Projects
프로젝트
InVision OCR문서 OCR·표 구조 복원·벤치마크 플랫폼
OCR API 호출을 넘어 문서 레이아웃 분석, 로직 기반 표 구조 복원, parser 기반 문서 재구성, 정량 벤치마크, 검수·운영 콘솔, 보안 납품 환경까지 하나로 묶은 Document AI 플랫폼입니다.
- 이미지/PDF/배치 OCR, 레이아웃 분석, 영역 지정, 이력 저장, 템플릿 리포트, 관리자 기능을 하나의 작업 흐름으로 연결했습니다.
- OCR bbox와 선분 정보를 결합해 row/column grouping, spanned cell·merged header 복원, fallback assignment, hybrid selection 등 로직 기반 표 구조 복원 엔진을 설계·고도화했습니다.
- HTML table GT 기준 Row/Col, Cell F1, CER, TEDS/TEDS-S를 함께 보는 평가 체계를 만들고 실험 콘솔에서 다중 메서드 비교와 ablation을 실행할 수 있게 했습니다.
- parser 기반 문서 복원, visual block payload, guide 기반 보정, LLM 후처리 enrichment, secure build, 운영 모니터링 프로필까지 제품·연구·납품 경계를 함께 관리했습니다.
Harmony안전한 사내 AI 지식 시스템
Harmony Agent가 사용자 맥락, 권한, 사내 지식, 회의 흐름을 이해하고 행동하는 엔터프라이즈 AI 에이전트 시스템입니다.
- Harmony Agent를 UserContext, Session, persona overlay, tool context, citation, audit trail이 연결된 실행 단위로 설계했습니다.
- 개인 채팅, Space 공유 채팅, 회의 세션마다 검색 후보가 다르게 합성되도록 SessionScopedRetrievalEngine과 permission metadata 경계를 구성했습니다.
- 문서와 회의 기록은 바로 지식화하지 않고 LLM-Wiki Compiler, review queue, reviewer 승인, publish, PageIndex reload 흐름을 거쳐 공식 corpus로 편입되게 만들었습니다.
- FastAPI API, Next.js Web, PageIndex RAG, Space 협업, Voice meeting, AWS 배포 계약까지 하나의 엔터프라이즈 AI 제품 구조로 묶었습니다.
AIOEnterprise AI 지식 관리 시스템
문서 업로드, 지식 저장소, Graph + Vector RAG, ACL 권한, LangGraph 기반 Agent Builder를 하나의 운영 콘솔로 묶은 엔터프라이즈 AI 지식 플랫폼입니다.
- Vue 3 콘솔에서 문서 저장소, 지식 아카이브, 데이터셋 생성, AI 모델 설정, Agent Graph 편집, Playground 실행을 하나의 워크스페이스로 제공합니다.
- FastAPI 서비스 계층은 문서 업로드 세션, 데이터셋 ingestion, Knowledge Graph 검색, Agent 실행, 계정/역할/ACL을 분리된 router와 service로 운영합니다.
- Milvus vector collection, Neo4j graph workspace, PostgreSQL metadata, Redis/Celery 비동기 작업을 조합해 대용량 문서 처리와 RAG 질의 흐름을 분리했습니다.
Plan2DoAI 산업안전 위험성평가 플랫폼
이미지와 문서를 산업안전 맥락으로 해석하고, 법령 벡터 검색과 LangGraph 워크플로우로 위험요인, 감소대책, 근거 테이블을 생성하는 RAG 기반 안전 분석 API입니다.
- 이미지, PDF, 일반 질의를 산업안전 위험성평가 요청으로 정규화하는 FastAPI 엔진을 기준으로 분석했습니다.
- 산업안전보건법, 중대재해처벌법, 건설기술진흥법 계열 XML을 전처리하고 OpenAI embedding으로 Qdrant 검색 컬렉션을 만드는 법령 RAG 파이프라인을 확인했습니다.
- LangGraph 기반 workflow가 법규 검색, 위험 분석, 감소대책 생성, 법령 검증, HTML 표 생성을 SSE 이벤트로 단계별 반환합니다.
- Plan2Do 수상 맥락은 포트폴리오 수상 데이터의 AI 안전도우미/위험성평가 지원 시스템 고도화 기여와 연결해 정리했습니다.
JeaniRFP 기반 시장 인텔리전스 에이전트
Jeani는 RFP 문서를 읽어 조사 계획을 만들고, 시장/경쟁사/기술 동향을 병렬 수집한 뒤 Bedrock Knowledge Base로 동기화하는 시장 인텔리전스 멀티에이전트 시스템입니다.
- Planner가 S3 RFP 문서를 파싱해 project context, competitors, search keywords, tech topics, market topics, execution priority를 생성합니다.
- Researcher, Competitor, Tech Analyst는 같은 plan을 공유하되 서로 다른 검색면과 품질 평가 기준으로 병렬 실행됩니다.
- Synthesizer가 최종 보고서를 만들면 Orchestrator가 source_data, duplicate URL filtering metadata와 함께 daily_updates에 저장하고 KB Sync를 트리거합니다.
- AWS EST Gen AI 실무 역량 강화 과정에서 팀 프로젝트로 Jeani를 개발하고 과정을 이수했습니다.
ArtygenSpacebooxTory / arti 제품 개발 포트폴리오
ArtygenSpace에서 1년간 진행한 두 개의 핵심 프로젝트, booxTory와 arti의 제품 개발 및 AI 솔루션 리드 경험을 정리한 포트폴리오 허브입니다.
- ArtygenSpace에서는 booxTory와 arti, 두 개의 제품 프로젝트를 중심으로 연구와 엔지니어링을 수행했습니다.
- booxTory는 AI 독서 경험, arti는 CATS/MERGE/CLEAR/NEXIS 네 가지 핵심 AI 솔루션으로 정리했습니다.
- 내부 저장소 이름보다 제품명, 솔루션명, 역할, 기술 리드 범위를 중심으로 설명합니다.
booxToryAI 독서 경험 제품 개발
CES 2025 Best of Innovation을 받은 booxTory에서 책 페이지 인식, 사용자별 독서 AI, RAG, TTS, 퀴즈, 번역, 추천 기능을 제품 흐름으로 묶은 경험입니다.
- 책 페이지 입력을 텍스트와 영역 정보로 바꾸고, 사용자와 책 단위의 독서 데이터로 이어지도록 설계했습니다.
- 사용자별 문서 컬렉션과 채팅 메모리를 분리해 독서 질문, 이전 대화, 책 페이지 맥락이 안전하게 섞이도록 만들었습니다.
- TTS, 퀴즈, 요약, 번역, 추천 질문, 사운드 추천을 독서 후속 활동으로 확장했습니다.
- 모델 실험을 API, 저장소, 비동기 작업, 테스트 가능한 서비스 흐름으로 옮기는 역할을 맡았습니다.
arti핵심 AI 솔루션 기술 리드
CES 2025 Honoree 제품인 arti에서 CATS, MERGE, CLEAR, NEXIS 네 가지 핵심 AI 솔루션의 기술 방향과 제품화 흐름을 리드한 경험입니다.
- CATS는 LangGraph 기반 다중 에이전트로 책 내용을 퀴즈, 음악, 인터랙티브 스토리로 변환하는 콘텐츠 솔루션입니다.
- MERGE는 자연어 프롬프트로 이미지 속 객체를 탐지하고 정밀 영역 분할과 중복 제거를 수행하는 탐지 솔루션입니다.
- CLEAR는 다국어 문서를 인식하고 레이아웃을 보존하며 OCR 결과를 교정/구조화하는 문서 인식 솔루션입니다.
- NEXIS는 문서 기반 질의응답과 텍스트-효과음 매칭을 연결하는 검색/추천 솔루션입니다.
GCN 추천 시스템 최적화 연구Egress 초기화와 Weighted Forwarding으로 임베딩 손실을 완화한 석사 논문 연구
석사학위논문 「추천 시스템에서 그래프 콘볼루션 네트워크 최적화 방법」을 기반으로, GCN 추천 시스템의 임베딩 값 손실과 깊은 Layer 구성 한계를 분석하고 Egress 초기화와 Weighted Forwarding(WF)으로 학습 속도와 추천 정확도 개선을 검증한 연구입니다.
- GCN 기반 추천에서 임베딩 값이 작은 범위로 수렴하며 정보가 약화되는 문제와 깊은 Layer를 쌓기 어려운 문제를 연구 주제로 정의했습니다.
- Egress 초기화로 더 넓은 임베딩 초기화 범위를 적용하고, Weighted Forwarding으로 전파 전 임베딩에 가중치를 곱해 다음 Layer에 전달하는 구조를 제안했습니다.
- FilmTrust, MovieLens-1M, Yelp2018, Douban-book 벤치마크에서 Recall@20/NDCG@20과 최고 성능 epoch를 비교했습니다.
- LightGCN, BUIR, MixGCF, SGL, SimGCL, XSimGCL 등 기존 추천 알고리즘에 제안 기법을 적용해 효과와 한계를 검증했습니다.
Degenerative Arthritis Specialist EnsembleKneeXray 5-class K-L grade 분류에서 class별 전문 모델을 결합한 의료영상 앙상블 연구
CMC 2023 논문 「Deep Learning Model Ensemble for the Accuracy of Classification Degenerative Arthritis」를 바탕으로, 무릎 X-ray 영상의 Kellgren–Lawrence grade 분류에서 여러 CNN·Transformer 계열 모델을 비교하고 class별 specialist ensemble로 성능을 개선한 프로젝트입니다.
- KneeXray 데이터셋 8,260장의 무릎 X-ray를 Kellgren–Lawrence grade 0~4의 5-class classification 문제로 정의했습니다.
- VGGNet, DenseNet, ResNet, TinyNet, EfficientNet, MobileNet, Xception, ViT 계열 모델을 같은 조건에서 비교했습니다.
- 각 grade에서 가장 강한 모델을 선택하는 specialist ensemble을 구성해 accuracy 77.05%, precision 0.79, recall 0.77, F1 0.78을 확인했습니다.
MCU-Net Pancreas Segmentation다중 연쇄 U-Net으로 작은 장기 분할 성능을 개선한 의료영상 연구
KCI 논문 「의료 영상 시스템에서 다중 연쇄 U-Net 모델을 이용한 개선된 췌장 영역 분할 탐지」를 바탕으로, 복부 CT에서 췌장 영역을 더 안정적으로 분할하기 위해 서로 다른 패치 크기의 U-Net 특징을 결합한 프로젝트입니다.
- 췌장 CT segmentation에서는 서로 다른 패치 크기의 U-Net을 마지막 단계에서 연쇄 결합하는 MCU-Net 구조를 제안했습니다.
- Pancreas-CT 데이터셋 82개 3D CT scan, 19,328장 슬라이스를 대상으로 4-fold 검증과 Dice coefficient 기반 평가를 수행했습니다.
- MCU-Net M5 구조는 DSC 0.916으로 기존 U-Net 0.896, Attention U-Net 0.832, RSTN 0.846 대비 높은 분할 성능을 보였습니다.