Sangmin Lee

이상향을 추구하는 엔지니어

인공지능 연구 결과와 기술을 제품으로 연결하는 AI 연구원입니다.

Highlights

주요 성과

enterprise ai
Hybrid RAG

Knowledge Graph와 Vector retrieval, plugin chunking, XML parsing, LLM observability를 결합해 사내 지식 관리 시스템을 제품화했습니다.

document ai
TEDS 0.9188

OCR bbox, line segment, parser-driven reconstruction, benchmark router를 묶어 테이블 구조 복원 품질과 운영 검증 체계를 만들었습니다.

minister awards
장관상 2회

WIS 2025 혁신상과 Plan2Do 산업안전 플랫폼 성과에서 장관상급 수상으로 AI 제품화와 현장 적용성을 인정받았습니다.

product ai
CES 2025

booxTory Best of Innovation, arti Honoree에 기여하며 생성, 편집, 추천 AI를 실제 제품 경험으로 연결했습니다.

research
SCIE 3 / KCI 2

LightGCN, WF-GCN, 의료영상 딥러닝을 중심으로 추천 시스템과 의료 AI 연구 성과를 논문으로 축적했습니다.

modeling
Top 1% 7회

DACON 39개 대회, 상위 1% 7회, HD현대 AI Challenge 4위로 실전 문제 정의와 모델링 역량을 검증했습니다.

Experience

실무 및 연구 경력

2025.07 - now

AsianaIDT, AI/ML Engineer & Researcher

엔터프라이즈 규정, 법령, 문서 도메인을 대상으로 RAG, 에이전트, OCR 플랫폼을 제품 수준으로 설계하고 운영합니다.

  • Enterprise AI 지식 관리 시스템에서 Knowledge Graph와 Vector를 결합한 hybrid RAG, plugin chunking, XML parsing, LLM observability를 구축했습니다.
  • 문서 OCR 및 테이블 복원 플랫폼에서 parser-driven reconstruction, benchmark router, Next.js console, secure build 흐름을 고도화했습니다.
  • Market Intelligence 시스템에서 4-Layer architecture와 25-agent orchestration으로 시장 조사 자동화 파이프라인을 설계했습니다.
2024.07 - 2025.07

ArtygenSpace, AI/ML Engineer

AI 기반 콘텐츠 제품의 모델 설계, 추천, 생성, 편집 워크플로를 담당하며 CES 2025 수상 제품의 AI 기능 개발을 주도했습니다.

  • booxTory와 arti의 AI 기능을 설계해 CES 2025 AI Innovation Awards 성과에 기여했습니다.
  • StoryMate, Booxedit, KOCCA AI 콘텐츠 지원 사업, AI 바우처 공급기업 프로젝트를 수행했습니다.
  • 콘텐츠 생성, 사용자 선호 기반 추천, 편집 자동화 기능을 제품 요구사항에 맞춰 연결했습니다.
2022 - 2024

Kyonggi University, Computer Science M.S.

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법을 연구하고 LightGCN, WF-GCN, 의료영상 딥러닝 논문을 발표했습니다.

  • 석사 논문: 추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법.
  • 석사 GPA 4.25/4.5, 학부 GPA 3.62/4.5, ABEEK 공학인증.
  • APIC-IST 2022 Best Paper Award, KIIT Best Paper Award를 수상했습니다.

Projects

프로젝트

AsianaIDT / 2025.09 - 2026.01

Enterprise AI 지식 관리 시스템

Graph + Vector RAGMulti-AgentLLM Observability

기업 내부 지식, 규정, 문서 자료를 검색 가능한 AI 지식 체계로 전환한 hybrid RAG 플랫폼입니다.

  • Knowledge Graph 기반 관계 탐색과 Vector retrieval을 함께 사용해 구조적 지식과 의미 검색을 결합했습니다.
  • Multi-Layer 비동기 처리 구조, plugin chunking, XML parsing으로 문서 수집부터 답변 생성까지의 흐름을 운영 관점에서 정리했습니다.
  • LLM 호출, 검색 근거, fallback, latency를 추적하는 관찰성 구성을 통해 엔터프라이즈 환경의 검증 가능성을 높였습니다.
LangGraphFastAPIMilvusNeo4jLangfuse
TEDS 0.9188TEDS-S 0.9506Cell F1 0.9702

문서 이미지에서 OCR 결과와 선분 정보를 결합해 표 구조를 복원하고, 벤치마크와 운영 콘솔까지 연결한 Document AI 플랫폼입니다.

  • row/column grouping, spanned cell 복원, parser-driven reconstruction으로 복잡한 표의 구조적 일관성을 개선했습니다.
  • hf_korean_table 100 기준 TEDS 0.9174, Cell F1 0.9934, row accuracy 1.00, column accuracy 0.96을 기록했습니다.
  • hf_finance_legal_mrc 480 최신 실행에서 TEDS 0.9188을 기록하고, benchmark router와 콘솔로 반복 검증 흐름을 만들었습니다.
PythonFastAPINext.jsPrometheusGrafana
AsianaIDT / 2025.07 - 2025.11

Market Intelligence Multi-Agent System

25 agents4-LayerDual Knowledge Base

시장 조사, 내부 자산 검색, 외부 검색, 검증을 분리한 4-Layer 기반 엔터프라이즈 GenAI orchestrator입니다.

  • Internal Asset과 Brave Search를 결합한 Dual Knowledge Base로 사내 자료와 공개 웹 근거를 함께 사용했습니다.
  • 25개 전문 에이전트가 조사, 요약, 검증, 보고 흐름을 분담하도록 custom orchestrator를 구성했습니다.
  • self-reflection과 단계별 상태 관리를 포함해 장시간 시장 조사 태스크를 추적 가능한 작업 단위로 분해했습니다.
AWS LambdaDynamoDBEventBridgeBrave Search
ArtygenSpace / 2024.07 - 2025.07

booxTory / arti AI Products

CES 2025Best of InnovationHonoree

AI 콘텐츠 생성과 편집, 사용자 경험을 제품 기능으로 연결한 CES 2025 수상 제품군입니다.

  • booxTory는 CES 2025 AI 부문 Best of Innovation, arti는 CES 2025 Honoree 성과를 기록했습니다.
  • 콘텐츠 생성, 편집 보조, 사용자 행동 기반 추천 흐름을 실제 서비스 요구사항에 맞게 설계했습니다.
  • KOCCA AI 콘텐츠 지원 사업과 AI 바우처 공급기업 프로젝트에서 제품형 AI 기능을 확장했습니다.
PythonLLMRecommendationContent AI
Kyonggi University / M.S. Research

LightGCN / WF-GCN / OptGCN 추천 시스템 연구

LightGCNWF-GCNSCIE

사용자-아이템 그래프에서 임베딩 전파와 가중 전달을 개선해 추천 정확도를 높인 그래프 추천 시스템 연구입니다.

  • LightGCN embedding enhancement와 Weighted Forwarding Graph Convolution Network 연구를 SCIE 논문으로 확장했습니다.
  • MovieLens, FilmTrust, Yelp 등 공개 데이터셋에서 Recall, NDCG 기반 추천 품질을 비교했습니다.
  • 석사 논문에서는 추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법을 정리했습니다.
PyTorchGraph Neural NetworkMovieLensYelp
Kyonggi University / Research Projects

MCU-Net / 의료 영상 딥러닝

MCU-NetCMC 202377.05% ensemble

췌장 CT segmentation과 퇴행성 관절염 분류를 다룬 의료영상 딥러닝 연구입니다.

  • 다중 연쇄 U-Net 구조를 활용해 췌장 영역 분할 탐지 성능을 개선했습니다.
  • 퇴행성 관절염 분류에서는 딥러닝 모델 앙상블로 전문의 앙상블 77.05% 기준과 비교한 연구를 수행했습니다.
  • 의료 영상 연구 결과는 CMC 2023 SCIE 논문과 KCI 논문으로 발표했습니다.
CNNU-NetOpenCVMedical Imaging

Research

연구 목록

Deck 01 / 05
Master's Thesis
2024

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법

Kyonggi University dCollection

Optimization methods of Graph Convolution Networks for Recommendation Systems.

M.S. ThesisUCI I804:41002-0000000577831st author
dCollection
SCIE Journal
2024

Embedding Enhancement method for LightGCN in Recommendation Information Systems

Electronics, vol. 13, no. 12

LightGCN 기반 추천 시스템에서 embedding 표현을 강화하는 방법을 제안했습니다.

SCIE(Q2)MDPI Electronics1st author
DOI
SCIE Journal
2024

Weighted Forwarding in Graph Convolution Networks for Recommendation Information System

Computers, Materials & Continua, vol. 78, no. 2

그래프 컨볼루션 네트워크의 가중 전달 전략으로 추천 품질을 개선한 연구입니다.

SCIE(Q2)CMC1st author
DOI
SCIE Journal
2023

Deep Learning Model Ensemble for the Accuracy of Classification Degenerative Arthritis

Computers, Materials & Continua, vol. 75, no. 1

퇴행성 관절염 분류 정확도를 높이기 위한 딥러닝 모델 앙상블 연구입니다.

SCIE(Q2)CMC1st author
DOI

Awards

수상 기록

Deck 01 / 02
2025.12

Plan2Do 수상

안전산업진흥 유공 행정안전부 장관상, 한국건설기술연구원 원장상

Plan2Do에 탑재되는 AI 안전도우미와 위험성평가 지원 시스템을 고도화해 AI 산업안전보건 플랫폼의 수상 성과에 기여했습니다.

Plan2DoAI SafetyMinister Award
2025

CES 2025 AI Innovation Awards

booxTory Best of Innovation / arti Honoree

AI 콘텐츠 제품의 AI 엔진 개발과 기술 리더십으로 CES 2025 혁신상 성과에 기여했습니다.

AI ProductsbooxToryarti
2025

WIS 2025 혁신상

과학기술정보통신부 장관상

AI 제품화 성과와 기술 경쟁력을 인정받아 월드IT쇼 혁신상 장관상을 수상했습니다.

Minister AwardWIS 2025Product AI
2022

APIC-IST 2022 Best Paper Award

Best Paper Award

Xception 기반 퇴행성 관절염 분류 연구가 APIC-IST Best Paper에 선정되었습니다.

Medical ImagingXception1st author

Competitions

대회 및 외부 활동

2024.01 - 2024.02

LG Aimers 4기

팀리더

MQL 데이터 기반 B2B 영업 기회 창출 예측 모델을 개발했습니다. 데이터 정규화, 비즈니스 영역 매핑, XGBoost 모델, 임계값 최적화를 통해 F1-score를 개선했습니다.

MQL PredictionF1-score 0.75154Team Leader
활동 보기 →
2023

HD현대 AI Challenge

4위

건설기계 센서데이터를 활용한 작업 중량 예측 모델을 개발하고, 시계열 Transformer와 맞춤형 손실 함수로 성능을 끌어올렸습니다.

4th PlacePublic Score 98.21432Time Series Transformer
활동 보기 →
2021 - 2024

DACON 경진대회

39개 대회 참여

컴퓨터 비전, 정형 데이터 분류, 시계열, 추천 시스템 등 다양한 AI 경진대회에 참여하며 데이터 분석과 모델링 경험을 축적했습니다.

Top 1% 7Top 5% 10Top 10% 15
활동 보기 →
2022.09 - 2022.11

가짜연구소 6기

그래프로 설득하기 팀원

Graph Neural Network를 주제로 한 비영리 AI 연구 활동에 참여했습니다. GraphGym 기반 실험 환경을 구축하고 GCN, GIN, Virtual Node, Aggregation 방식별 성능을 비교했습니다.

GNNGraphGymTeam 8
활동 보기 →
2021.03 - 2023.02

DIYA

AI 연구 및 대회 참여 커뮤니티

Computer Vision Team과 ML/GNN Team에서 논문 리뷰, PyTorch 기반 모델 구현, DACON 대회 참여, 학술발표대회 논문 발표를 수행했습니다.

Computer VisionGNNPaper Review
활동 보기 →

Skills

기술 스택

RAG / Agent

엔터프라이즈 지식 검색과 시장조사 자동화를 운영 가능한 에이전트 흐름으로 설계합니다.

  • LangGraph
  • LangSmith
  • Langfuse
  • Knowledge Graph
  • Hybrid Retrieval
  • Multi-Agent Orchestration
  • Prompt Engineering
  • Knowledge Graph와 Vector retrieval을 결합한 hybrid RAG
  • 25-agent Market Intelligence orchestration
  • 근거, latency, fallback을 추적하는 LLM observability

Document AI / OCR

문서 이미지에서 텍스트와 표 구조를 복원하고, 품질 지표를 반복 검증하는 플랫폼을 만듭니다.

  • Python
  • OCR bbox
  • Line Segment
  • Table Reconstruction
  • Parser-driven Reconstruction
  • TEDS Benchmark
  • Cell F1
  • Next.js Console
  • row/column grouping과 spanned cell 복원
  • hf_finance_legal_mrc 기준 TEDS 0.9188
  • benchmark router와 콘솔 기반 반복 검증

Research ML

추천 시스템, 의료영상, 경진대회 모델링을 논문과 실험 지표로 검증합니다.

  • PyTorch
  • LightGCN
  • WF-GCN
  • CNN
  • U-Net
  • OpenCV
  • XGBoost
  • Pandas
  • MovieLens, FilmTrust, Yelp 기반 Recall/NDCG 실험
  • MCU-Net과 의료영상 딥러닝 연구
  • DACON 39개 대회 기반 모델링과 튜닝

Backend / Product

AI 모델을 제품 기능과 API, 운영 콘솔로 연결하는 서버와 프론트엔드 흐름을 구현합니다.

  • FastAPI
  • Python
  • Next.js 14
  • React
  • Tailwind
  • Streamlit
  • AWS Lambda
  • EventBridge
  • Brave Search
  • Document AI 운영 콘솔과 benchmark UI
  • 시장조사 에이전트의 serverless workflow
  • 콘텐츠 생성, 편집, 추천 제품 기능 개발

Data / Search

벡터, 그래프, 검색, 관계형 저장소를 문제 성격에 맞게 조합합니다.

  • Milvus
  • Neo4j
  • Qdrant
  • Elasticsearch
  • PostgreSQL
  • Redis
  • DynamoDB
  • MySQL
  • 문서-관계-답변 흐름을 표현하는 Knowledge Graph
  • 내부 자산 검색과 외부 웹 검색을 결합한 Dual Knowledge Base
  • RAG, 추천, 운영 로그를 위한 저장소 분리

MLOps / Infra

빌드, 배포, 모니터링, 벤치마크를 제품 운영 흐름 안에 묶습니다.

  • Docker
  • Docker Compose
  • Kubernetes
  • Prometheus
  • Grafana
  • Loki
  • wandb
  • GitHub Actions
  • Prometheus/Grafana 기반 실행 상태 관찰
  • secure build와 GitHub Actions 배포 흐름
  • 실험 추적과 벤치마크 재현성 관리

Blog

최근 지식

Deck 01 / 02 · 블로그 전체 글 65개