Projects
프로젝트
InVision OCR문서 OCR·표 구조 복원·벤치마크 플랫폼
OCR API 호출을 넘어 문서 레이아웃 분석, 로직 기반 표 구조 복원, parser 기반 문서 재구성, 정량 벤치마크, 검수·운영 콘솔, 보안 납품 환경까지 하나로 묶은 Document AI 플랫폼입니다.
- 이미지/PDF/배치 OCR, 레이아웃 분석, 영역 지정, 이력 저장, 템플릿 리포트, 관리자 기능을 하나의 작업 흐름으로 연결했습니다.
- OCR bbox와 선분 정보를 결합해 row/column grouping, spanned cell·merged header 복원, fallback assignment, hybrid selection 등 로직 기반 표 구조 복원 엔진을 설계·고도화했습니다.
- HTML table GT 기준 Row/Col, Cell F1, CER, TEDS/TEDS-S를 함께 보는 평가 체계를 만들고 실험 콘솔에서 다중 메서드 비교와 ablation을 실행할 수 있게 했습니다.
- parser 기반 문서 복원, visual block payload, guide 기반 보정, LLM 후처리 enrichment, secure build, 운영 모니터링 프로필까지 제품·연구·납품 경계를 함께 관리했습니다.
Harmony안전한 사내 AI 지식 시스템
Harmony Agent가 사용자 맥락, 권한, 사내 지식, 회의 흐름을 이해하고 행동하는 엔터프라이즈 AI 에이전트 시스템입니다.
- Harmony Agent를 UserContext, Session, persona overlay, tool context, citation, audit trail이 연결된 실행 단위로 설계했습니다.
- 개인 채팅, Space 공유 채팅, 회의 세션마다 검색 후보가 다르게 합성되도록 SessionScopedRetrievalEngine과 permission metadata 경계를 구성했습니다.
- 문서와 회의 기록은 바로 지식화하지 않고 LLM-Wiki Compiler, review queue, reviewer 승인, publish, PageIndex reload 흐름을 거쳐 공식 corpus로 편입되게 만들었습니다.
- FastAPI API, Next.js Web, PageIndex RAG, Space 협업, Voice meeting, AWS 배포 계약까지 하나의 엔터프라이즈 AI 제품 구조로 묶었습니다.
AIOEnterprise AI 지식 관리 시스템
문서 업로드, 지식 저장소, Graph + Vector RAG, ACL 권한, LangGraph 기반 Agent Builder를 하나의 운영 콘솔로 묶은 엔터프라이즈 AI 지식 플랫폼입니다.
- Vue 3 콘솔에서 문서 저장소, 지식 아카이브, 데이터셋 생성, AI 모델 설정, Agent Graph 편집, Playground 실행을 하나의 워크스페이스로 제공합니다.
- FastAPI 서비스 계층은 문서 업로드 세션, 데이터셋 ingestion, Knowledge Graph 검색, Agent 실행, 계정/역할/ACL을 분리된 router와 service로 운영합니다.
- Milvus vector collection, Neo4j graph workspace, PostgreSQL metadata, Redis/Celery 비동기 작업을 조합해 대용량 문서 처리와 RAG 질의 흐름을 분리했습니다.
Plan2DoAI 산업안전 위험성평가 플랫폼
이미지와 문서를 산업안전 맥락으로 해석하고, 법령 벡터 검색과 LangGraph 워크플로우로 위험요인, 감소대책, 근거 테이블을 생성하는 RAG 기반 안전 분석 API입니다.
- 이미지, PDF, 일반 질의를 산업안전 위험성평가 요청으로 정규화하는 FastAPI 엔진을 기준으로 분석했습니다.
- 산업안전보건법, 중대재해처벌법, 건설기술진흥법 계열 XML을 전처리하고 OpenAI embedding으로 Qdrant 검색 컬렉션을 만드는 법령 RAG 파이프라인을 확인했습니다.
- LangGraph 기반 workflow가 법규 검색, 위험 분석, 감소대책 생성, 법령 검증, HTML 표 생성을 SSE 이벤트로 단계별 반환합니다.
- Plan2Do 수상 맥락은 포트폴리오 수상 데이터의 AI 안전도우미/위험성평가 지원 시스템 고도화 기여와 연결해 정리했습니다.
JeaniRFP 기반 시장 인텔리전스 에이전트
Jeani는 RFP 문서를 읽어 조사 계획을 만들고, 시장/경쟁사/기술 동향을 병렬 수집한 뒤 Bedrock Knowledge Base로 동기화하는 시장 인텔리전스 멀티에이전트 시스템입니다.
- Planner가 S3 RFP 문서를 파싱해 project context, competitors, search keywords, tech topics, market topics, execution priority를 생성합니다.
- Researcher, Competitor, Tech Analyst는 같은 plan을 공유하되 서로 다른 검색면과 품질 평가 기준으로 병렬 실행됩니다.
- Synthesizer가 최종 보고서를 만들면 Orchestrator가 source_data, duplicate URL filtering metadata와 함께 daily_updates에 저장하고 KB Sync를 트리거합니다.
- AWS EST Gen AI 실무 역량 강화 과정에서 팀 프로젝트로 Jeani를 개발하고 과정을 이수했습니다.
ArtygenSpacebooxTory / arti 제품 개발 포트폴리오
ArtygenSpace에서 1년간 진행한 두 개의 핵심 프로젝트, booxTory와 arti의 제품 개발 및 AI 솔루션 리드 경험을 정리한 포트폴리오 허브입니다.
- ArtygenSpace에서는 booxTory와 arti, 두 개의 제품 프로젝트를 중심으로 연구와 엔지니어링을 수행했습니다.
- booxTory는 AI 독서 경험, arti는 CATS/MERGE/CLEAR/NEXIS 네 가지 핵심 AI 솔루션으로 정리했습니다.
- 내부 저장소 이름보다 제품명, 솔루션명, 역할, 기술 리드 범위를 중심으로 설명합니다.
booxToryAI 독서 경험 제품 개발
CES 2025 Best of Innovation을 받은 booxTory에서 책 페이지 인식, 사용자별 독서 AI, RAG, TTS, 퀴즈, 번역, 추천 기능을 제품 흐름으로 묶은 경험입니다.
- 책 페이지 입력을 텍스트와 영역 정보로 바꾸고, 사용자와 책 단위의 독서 데이터로 이어지도록 설계했습니다.
- 사용자별 문서 컬렉션과 채팅 메모리를 분리해 독서 질문, 이전 대화, 책 페이지 맥락이 안전하게 섞이도록 만들었습니다.
- TTS, 퀴즈, 요약, 번역, 추천 질문, 사운드 추천을 독서 후속 활동으로 확장했습니다.
- 모델 실험을 API, 저장소, 비동기 작업, 테스트 가능한 서비스 흐름으로 옮기는 역할을 맡았습니다.
arti핵심 AI 솔루션 기술 리드
CES 2025 Honoree 제품인 arti에서 CATS, MERGE, CLEAR, NEXIS 네 가지 핵심 AI 솔루션의 기술 방향과 제품화 흐름을 리드한 경험입니다.
- CATS는 LangGraph 기반 다중 에이전트로 책 내용을 퀴즈, 음악, 인터랙티브 스토리로 변환하는 콘텐츠 솔루션입니다.
- MERGE는 자연어 프롬프트로 이미지 속 객체를 탐지하고 정밀 영역 분할과 중복 제거를 수행하는 탐지 솔루션입니다.
- CLEAR는 다국어 문서를 인식하고 레이아웃을 보존하며 OCR 결과를 교정/구조화하는 문서 인식 솔루션입니다.
- NEXIS는 문서 기반 질의응답과 텍스트-효과음 매칭을 연결하는 검색/추천 솔루션입니다.
LightGCN / WF-GCN / OptGCN추천 시스템 연구
사용자-아이템 그래프에서 임베딩 전파와 가중 전달을 개선해 추천 정확도를 높인 그래프 추천 시스템 연구입니다.
- LightGCN embedding enhancement와 Weighted Forwarding Graph Convolution Network 연구를 SCIE 논문으로 확장했습니다.
- MovieLens, FilmTrust, Yelp 등 공개 데이터셋에서 Recall, NDCG 기반 추천 품질을 비교했습니다.
- 석사 논문에서는 추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법을 정리했습니다.
MCU-Net의료 영상 딥러닝
췌장 CT segmentation과 퇴행성 관절염 분류를 다룬 의료영상 딥러닝 연구입니다.
- 다중 연쇄 U-Net 구조를 활용해 췌장 영역 분할 탐지 성능을 개선했습니다.
- 퇴행성 관절염 분류에서는 딥러닝 모델 앙상블로 전문의 앙상블 77.05% 기준과 비교한 연구를 수행했습니다.
- 의료 영상 연구 결과는 CMC 2023 SCIE 논문과 KCI 논문으로 발표했습니다.