Sangmin Lee

이상향을 추구하는 엔지니어

인공지능 연구 결과와 기술을 제품으로 연결하는 AI 연구원입니다.

Highlights

주요 성과

awards
CES 2025

booxTory Best of Innovation, arti Honoree로 AI 제품 개발과 기술 리더십을 입증했습니다.

minister award
장관상

WIS 2025 혁신상에서 과학기술정보통신부 장관상을 수상하며 제품화 성과를 인정받았습니다.

challenge
HD현대 4위

HD현대 AI Challenge 4위로 산업 AI 문제 해결과 실전형 모델링 역량을 검증했습니다.

research
SCIE 3

LightGCN, WF-GCN, 의료영상 앙상블을 중심으로 SCIE 3편과 KCI 2편의 연구 실적을 보유했습니다.

table OCR
TEDS 0.9188

hf_finance_legal_mrc 480 샘플 기준 TEDS-S 0.9506, Cell F1 0.9702까지 구조 복원 품질을 끌어올렸습니다.

systems
25 agents

Market Intelligence 시스템에서 4-Layer 기반 25개 전문 에이전트 협업 구조를 설계했습니다.

Experience

실무 및 연구 경력

2025.07 - now

AsianaIDT, AI/ML Engineer & Researcher

엔터프라이즈 규정, 법령, 문서 도메인을 대상으로 RAG, 에이전트, OCR 플랫폼을 제품 수준으로 설계하고 운영합니다.

  • Enterprise AI 지식 관리 시스템에서 Knowledge Graph와 Vector를 결합한 hybrid RAG, plugin chunking, XML parsing, LLM observability를 구축했습니다.
  • 문서 OCR 및 테이블 복원 플랫폼에서 parser-driven reconstruction, benchmark router, Next.js console, secure build 흐름을 고도화했습니다.
  • Market Intelligence 시스템에서 4-Layer architecture와 25-agent orchestration으로 시장 조사 자동화 파이프라인을 설계했습니다.
2024.07 - 2025.07

ArtygenSpace, AI/ML Engineer

AI 기반 콘텐츠 제품의 모델 설계, 추천, 생성, 편집 워크플로를 담당하며 CES 2025 수상 제품의 AI 기능 개발을 주도했습니다.

  • booxTory와 arti의 AI 기능을 설계해 CES 2025 AI Innovation Awards 성과에 기여했습니다.
  • StoryMate, Booxedit, KOCCA AI 콘텐츠 지원 사업, AI 바우처 공급기업 프로젝트를 수행했습니다.
  • 콘텐츠 생성, 사용자 선호 기반 추천, 편집 자동화 기능을 제품 요구사항에 맞춰 연결했습니다.
2022 - 2024

Kyonggi University, Computer Science M.S.

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법을 연구하고 LightGCN, WF-GCN, 의료영상 딥러닝 논문을 발표했습니다.

  • 석사 논문: 추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법.
  • 석사 GPA 4.25/4.5, 학부 GPA 3.62/4.5, ABEEK 공학인증.
  • APIC-IST 2022 Best Paper Award, KIIT Best Paper Award를 수상했습니다.

Projects

프로젝트

AsianaIDT / 2025.09 - 2026.01

Enterprise AI 지식 관리 시스템

Graph + Vector RAGMulti-AgentLLM Observability

기업 내부 지식, 규정, 문서 자료를 검색 가능한 AI 지식 체계로 전환한 hybrid RAG 플랫폼입니다.

  • Knowledge Graph 기반 관계 탐색과 Vector retrieval을 함께 사용해 구조적 지식과 의미 검색을 결합했습니다.
  • Multi-Layer 비동기 처리 구조, plugin chunking, XML parsing으로 문서 수집부터 답변 생성까지의 흐름을 운영 관점에서 정리했습니다.
  • LLM 호출, 검색 근거, fallback, latency를 추적하는 관찰성 구성을 통해 엔터프라이즈 환경의 검증 가능성을 높였습니다.
LangGraphFastAPIMilvusNeo4jLangfuse
TEDS 0.9188TEDS-S 0.9506Cell F1 0.9702

문서 이미지에서 OCR 결과와 선분 정보를 결합해 표 구조를 복원하고, 벤치마크와 운영 콘솔까지 연결한 Document AI 플랫폼입니다.

  • row/column grouping, spanned cell 복원, parser-driven reconstruction으로 복잡한 표의 구조적 일관성을 개선했습니다.
  • hf_korean_table 100 기준 TEDS 0.9174, Cell F1 0.9934, row accuracy 1.00, column accuracy 0.96을 기록했습니다.
  • hf_finance_legal_mrc 480 최신 실행에서 TEDS 0.9188을 기록하고, benchmark router와 콘솔로 반복 검증 흐름을 만들었습니다.
PythonFastAPINext.jsPrometheusGrafana
AsianaIDT / 2025.07 - 2025.11

Market Intelligence Multi-Agent System

25 agents4-LayerDual Knowledge Base

시장 조사, 내부 자산 검색, 외부 검색, 검증을 분리한 4-Layer 기반 엔터프라이즈 GenAI orchestrator입니다.

  • Internal Asset과 Brave Search를 결합한 Dual Knowledge Base로 사내 자료와 공개 웹 근거를 함께 사용했습니다.
  • 25개 전문 에이전트가 조사, 요약, 검증, 보고 흐름을 분담하도록 custom orchestrator를 구성했습니다.
  • self-reflection과 단계별 상태 관리를 포함해 장시간 시장 조사 태스크를 추적 가능한 작업 단위로 분해했습니다.
AWS LambdaDynamoDBEventBridgeBrave Search
ArtygenSpace / 2024.07 - 2025.07

booxTory / arti AI Products

CES 2025Best of InnovationHonoree

AI 콘텐츠 생성과 편집, 사용자 경험을 제품 기능으로 연결한 CES 2025 수상 제품군입니다.

  • booxTory는 CES 2025 AI 부문 Best of Innovation, arti는 CES 2025 Honoree 성과를 기록했습니다.
  • 콘텐츠 생성, 편집 보조, 사용자 행동 기반 추천 흐름을 실제 서비스 요구사항에 맞게 설계했습니다.
  • KOCCA AI 콘텐츠 지원 사업과 AI 바우처 공급기업 프로젝트에서 제품형 AI 기능을 확장했습니다.
PythonLLMRecommendationContent AI
Kyonggi University / M.S. Research

LightGCN / WF-GCN / OptGCN 추천 시스템 연구

LightGCNWF-GCNSCIE

사용자-아이템 그래프에서 임베딩 전파와 가중 전달을 개선해 추천 정확도를 높인 그래프 추천 시스템 연구입니다.

  • LightGCN embedding enhancement와 Weighted Forwarding Graph Convolution Network 연구를 SCIE 논문으로 확장했습니다.
  • MovieLens, FilmTrust, Yelp 등 공개 데이터셋에서 Recall, NDCG 기반 추천 품질을 비교했습니다.
  • 석사 논문에서는 추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법을 정리했습니다.
PyTorchGraph Neural NetworkMovieLensYelp
Kyonggi University / Research Projects

MCU-Net / 의료 영상 딥러닝

MCU-NetCMC 202377.05% ensemble

췌장 CT segmentation과 퇴행성 관절염 분류를 다룬 의료영상 딥러닝 연구입니다.

  • 다중 연쇄 U-Net 구조를 활용해 췌장 영역 분할 탐지 성능을 개선했습니다.
  • 퇴행성 관절염 분류에서는 딥러닝 모델 앙상블로 전문의 앙상블 77.05% 기준과 비교한 연구를 수행했습니다.
  • 의료 영상 연구 결과는 CMC 2023 SCIE 논문과 KCI 논문으로 발표했습니다.
CNNU-NetOpenCVMedical Imaging

Research

논문 리스트

Master's Thesis
2024

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법

Kyonggi University dCollection

Optimization methods of Graph Convolution Networks for Recommendation Systems.

M.S. ThesisUCI I804:41002-0000000577831st author
dCollection
SCIE Journal
2024

Embedding Enhancement method for LightGCN in Recommendation Information Systems

Electronics, vol. 13, no. 12

LightGCN 기반 추천 시스템에서 embedding 표현을 강화하는 방법을 제안했습니다.

SCIE(Q2)MDPI Electronics1st author
DOI
SCIE Journal
2024

Weighted Forwarding in Graph Convolution Networks for Recommendation Information System

Computers, Materials & Continua, vol. 78, no. 2

그래프 컨볼루션 네트워크의 가중 전달 전략으로 추천 품질을 개선한 연구입니다.

SCIE(Q2)CMC1st author
DOI
SCIE Journal
2023

Deep Learning Model Ensemble for the Accuracy of Classification Degenerative Arthritis

Computers, Materials & Continua, vol. 75, no. 1

퇴행성 관절염 분류 정확도를 높이기 위한 딥러닝 모델 앙상블 연구입니다.

SCIE(Q2)CMC1st author
DOI
KCI Journal
2023

Graph Neural Network 기반 추천시스템 성능 향상을 위한 유저 행동 시간 기반 데이터 사용 방안 분석

The Journal of Korean Institute of Information Technology

추천 시스템 성능 향상을 위해 사용자 행동 시간 기반 데이터를 분석한 연구입니다.

KCIJKIIT 21(5)1st author
DOI
KCI Journal
2022

의료 영상 시스템에서 다중 연쇄 U-Net 모델을 이용한 개선된 췌장 영역 분할 탐지

The Journal of Korean Institute of Information Technology

다중 연쇄 U-Net 모델로 의료 영상의 췌장 영역 분할 탐지 성능을 개선한 연구입니다.

KCIJKIIT 20(5)1st author
DOI
International Conference
2023

Egress Initialization for Graph Convolution Network in Recommendation Systems

The 15th International Conference on Internet (ICONI 2023)

추천 시스템에서 그래프 컨볼루션 네트워크의 egress initialization을 다룬 국제학회 논문입니다.

ICONI 2023Recommendation1st author
International Conference
2023

Thin Graph Convolution Network in Recommendation Systems

The 15th International Conference on Internet (ICONI 2023)

추천 시스템을 위한 경량 그래프 컨볼루션 네트워크 구조를 다룬 국제학회 논문입니다.

ICONI 2023GNN1st author
International Conference
2023

Over-smoothing in LightGCN doesn't happen much

The 15th International Conference on Internet (ICONI 2023)

LightGCN에서 over-smoothing 현상을 분석한 추천 시스템 국제학회 논문입니다.

ICONI 2023LightGCN1st author
International Conference
2023

Leverage time-based data to improve recommendation system accuracy

The 18th Asia Pacific International Conference on Information Science and Technology

시간 기반 데이터를 활용해 추천 시스템 정확도를 개선하는 방법을 발표했습니다.

APIC-ISTRecommendation1st author
International Conference
2023

Using Deep Learning for Medical Automation in Diagnosis of Degenerative Arthritis

The 8th international Conference for Small and Medium Business 2023

퇴행성 관절염 진단 자동화를 위한 딥러닝 기반 의료영상 연구입니다.

ICSMB 2023Medical Imaging1st author
International Conference
2022

Classification of degenerative arthritis using Xception model in radiographic images

The 17th Asia Pacific International Conference on Information Science and Technology

Xception 기반 방사선 이미지 퇴행성 관절염 분류 연구로 APIC-IST Best Paper에 선정되었습니다.

APIC-ISTBest Paper1st author
Domestic Conference
2023

이상 점수 임계값 선택 기준에 따른 비지도 이상치 탐지 방법의 성능 분석

KSII Summer Conference

비지도 이상치 탐지에서 이상 점수 임계값 선택 기준에 따른 성능 변화를 분석했습니다.

KSIIAnomaly Detection2nd author
Domestic Conference
2023

GNN 기반 딥러닝 모델에서 시간-공간 Attention 모듈 구조에 따른 교통 흐름 예측 성능 분석

KSII Spring Conference

시간-공간 Attention 구조가 교통 흐름 예측 성능에 미치는 영향을 분석했습니다.

KSIITraffic Forecasting2nd author
Domestic Conference
2023

추천 시스템 성능 개선을 위한 시간 기반 데이터 분석

KSII Spring Conference

추천 시스템의 시간 기반 사용자 행동 데이터를 분석한 국내학회 논문입니다.

KSIIRecommendation1st author
Domestic Conference
2023

SDN 환경에서 오토 인코더 모델을 활용한 플로우 분류 기법

KICS Winter Conference, vol. 80

SDN 환경에서 오토 인코더 기반 플로우 분류 기법을 제안했습니다.

KICSAutoencoder3rd author
Domestic Conference
2022

추천 시스템을 활용한 캐싱 서버 최적화

SEBS Fall Conference

추천 시스템을 활용해 정보 중심 네트워크의 캐싱 서버 최적화를 다룬 논문입니다.

SEBSRecommendation1st author
Domestic Conference
2022

RFID 태그를 통한 출결 확인 시스템 구현

KSII Spring Conference

RFID 태그 기반 출결 확인 시스템 구현 내용을 발표했습니다.

KSIIRFID3rd author
Domestic Conference
2021

겹친 문자 이미지 분류를 위한 합성곱 신경망 모델의 정확도 분석

KSII Fall Conference

겹친 문자 이미지 분류를 위한 CNN 모델의 정확도를 분석했습니다.

KSIICNN1st author
Domestic Conference
2021

PoseNet을 활용한 헬스 트레이너 웹 서비스

KIIT Conference, pp. 729-733

PoseNet 기반 헬스 트레이너 웹 서비스 논문으로 KIIT Best Paper Award를 수상했습니다.

KIITBest Paper1st author

Awards

수상 기록

2025.12

Plan2Do 수상

안전산업진흥 유공 행정안전부 장관상, 한국건설기술연구원 원장상

Plan2Do에 탑재되는 AI 안전도우미와 위험성평가 지원 시스템을 고도화해 AI 산업안전보건 플랫폼의 수상 성과에 기여했습니다.

Plan2DoAI SafetyMinister Award
2025

CES 2025 AI Innovation Awards

booxTory Best of Innovation / arti Honoree

AI 콘텐츠 제품의 AI 엔진 개발과 기술 리더십으로 CES 2025 혁신상 성과에 기여했습니다.

AI ProductsbooxToryarti
2025

WIS 2025 혁신상

과학기술정보통신부 장관상

AI 제품화 성과와 기술 경쟁력을 인정받아 월드IT쇼 혁신상 장관상을 수상했습니다.

Minister AwardWIS 2025Product AI
2022

APIC-IST 2022 Best Paper Award

Best Paper Award

Xception 기반 퇴행성 관절염 분류 연구가 APIC-IST Best Paper에 선정되었습니다.

Medical ImagingXception1st author

Competitions

대회 및 외부 활동

2024.01 - 2024.02

LG Aimers 4기

팀리더

MQL 데이터 기반 B2B 영업 기회 창출 예측 모델을 개발했습니다. 데이터 정규화, 비즈니스 영역 매핑, XGBoost 모델, 임계값 최적화를 통해 F1-score를 개선했습니다.

MQL PredictionF1-score 0.75154Team Leader
활동 보기 →
2023

HD현대 AI Challenge

4위

건설기계 센서데이터를 활용한 작업 중량 예측 모델을 개발하고, 시계열 Transformer와 맞춤형 손실 함수로 성능을 끌어올렸습니다.

4th PlacePublic Score 98.21432Time Series Transformer
활동 보기 →
2021 - 2024

DACON 경진대회

39개 대회 참여

컴퓨터 비전, 정형 데이터 분류, 시계열, 추천 시스템 등 다양한 AI 경진대회에 참여하며 데이터 분석과 모델링 경험을 축적했습니다.

Top 1% 7Top 5% 10Top 10% 15
활동 보기 →
2022.09 - 2022.11

가짜연구소 6기

그래프로 설득하기 팀원

Graph Neural Network를 주제로 한 비영리 AI 연구 활동에 참여했습니다. GraphGym 기반 실험 환경을 구축하고 GCN, GIN, Virtual Node, Aggregation 방식별 성능을 비교했습니다.

GNNGraphGymTeam 8
활동 보기 →
2021.03 - 2023.02

DIYA

AI 연구 및 대회 참여 커뮤니티

Computer Vision Team과 ML/GNN Team에서 논문 리뷰, PyTorch 기반 모델 구현, DACON 대회 참여, 학술발표대회 논문 발표를 수행했습니다.

Computer VisionGNNPaper Review
활동 보기 →

Skills

기술 스택

RAG / Agent

엔터프라이즈 지식 검색과 시장조사 자동화를 운영 가능한 에이전트 흐름으로 설계합니다.

  • LangGraph
  • LangSmith
  • Langfuse
  • Knowledge Graph
  • Hybrid Retrieval
  • Multi-Agent Orchestration
  • Prompt Engineering
  • Knowledge Graph와 Vector retrieval을 결합한 hybrid RAG
  • 25-agent Market Intelligence orchestration
  • 근거, latency, fallback을 추적하는 LLM observability

Document AI / OCR

문서 이미지에서 텍스트와 표 구조를 복원하고, 품질 지표를 반복 검증하는 플랫폼을 만듭니다.

  • Python
  • OCR bbox
  • Line Segment
  • Table Reconstruction
  • Parser-driven Reconstruction
  • TEDS Benchmark
  • Cell F1
  • Next.js Console
  • row/column grouping과 spanned cell 복원
  • hf_finance_legal_mrc 기준 TEDS 0.9188
  • benchmark router와 콘솔 기반 반복 검증

Research ML

추천 시스템, 의료영상, 경진대회 모델링을 논문과 실험 지표로 검증합니다.

  • PyTorch
  • LightGCN
  • WF-GCN
  • CNN
  • U-Net
  • OpenCV
  • XGBoost
  • Pandas
  • MovieLens, FilmTrust, Yelp 기반 Recall/NDCG 실험
  • MCU-Net과 의료영상 딥러닝 연구
  • DACON 39개 대회 기반 모델링과 튜닝

Backend / Product

AI 모델을 제품 기능과 API, 운영 콘솔로 연결하는 서버와 프론트엔드 흐름을 구현합니다.

  • FastAPI
  • Python
  • Next.js 14
  • React
  • Tailwind
  • Streamlit
  • AWS Lambda
  • EventBridge
  • Brave Search
  • Document AI 운영 콘솔과 benchmark UI
  • 시장조사 에이전트의 serverless workflow
  • 콘텐츠 생성, 편집, 추천 제품 기능 개발

Data / Search

벡터, 그래프, 검색, 관계형 저장소를 문제 성격에 맞게 조합합니다.

  • Milvus
  • Neo4j
  • Qdrant
  • Elasticsearch
  • PostgreSQL
  • Redis
  • DynamoDB
  • MySQL
  • 문서-관계-답변 흐름을 표현하는 Knowledge Graph
  • 내부 자산 검색과 외부 웹 검색을 결합한 Dual Knowledge Base
  • RAG, 추천, 운영 로그를 위한 저장소 분리

MLOps / Infra

빌드, 배포, 모니터링, 벤치마크를 제품 운영 흐름 안에 묶습니다.

  • Docker
  • Docker Compose
  • Kubernetes
  • Prometheus
  • Grafana
  • Loki
  • wandb
  • GitHub Actions
  • Prometheus/Grafana 기반 실행 상태 관찰
  • secure build와 GitHub Actions 배포 흐름
  • 실험 추적과 벤치마크 재현성 관리

Blog

최근 글

evaluation-benchmarks
evaluation-benchmarks

OmniShotCut은 샷 경계 검출을 컷 포인트 찾기에서 관계 예측과 벤치마크 설계 문제로 바꾼다

OmniShotCut은 shot boundary detection을 단순 프레임 경계 검출이 아니라 intra-shot·inter-shot 관계를 함께 예측하는 구조적 문제로 재정의하고, 합성 전환 데이터와 현대적 벤치마크를 함께 설계해 영상 분할 파이프라인을 더 해석 가능하고 실전 지향적으로 밀어 올리려는 작업이다.

Sangmin Lee