Sangmin Lee

이상향을 추구하는 엔지니어

인공지능 연구 결과와 기술을 제품으로 연결하는 AI 연구원입니다.

Highlights

주요 성과

product ai
CES 2025

booxTory Best of Innovation과 arti Honoree 제품에서 AI 엔진, 추천, 생성, 편집 자동화 기능을 실제 제품 경험으로 연결했습니다.

enterprise ai
AsianaIDT

사내 지식 관리, 권한형 에이전트, 산업안전 RAG, 시장 인텔리전스, 문서 OCR을 운영 가능한 업무 시스템으로 구현했습니다.

minister awards
장관상 2회

WIS 2025 혁신상과 Plan2Do 산업안전 플랫폼 성과에서 장관상급 수상으로 AI 제품화와 현장 적용성을 인정받았습니다.

research
SCIE 3 / KCI 2

LightGCN, WF-GCN, 의료영상 딥러닝을 중심으로 추천 시스템과 의료 AI 연구 성과를 1저자 논문으로 축적했습니다.

modeling
Top 1% 7회

DACON 39개 대회, HD현대 AI Challenge 4위, 상위 1% 7회로 데이터 분석과 실전 모델링 역량을 검증했습니다.

academic awards
Best Paper 2회

APIC-IST 2022와 KIIT 논문 성과로 추천 시스템, 의료영상, PoseNet 기반 응용 연구의 학술 성과를 남겼습니다.

Experience

실무 및 연구 경력

2025.07 - now

AsianaIDT, AI/ML Engineer & Researcher

사내 지식 관리, 산업안전 RAG, 시장 인텔리전스, 문서 OCR, 권한형 에이전트 런타임을 제품과 운영 단위로 설계하고 구현합니다.

  • AIO와 Harmony에서 문서 저장소, ingestion, Graph + Vector RAG, ACL, permission-aware retrieval, persona/session/tool trace, human review queue를 연결했습니다.
  • Plan2Do에서 현장 이미지와 문서 입력, 산업안전 법령 XML corpus, Qdrant 검색, LangGraph workflow, 검토용 위험성평가 HTML 표를 API 제품으로 묶었습니다.
  • Jeani에서 RFP 기반 planner, 병렬 market/competitor/tech agent, synthesizer, S3 산출물 lifecycle, Bedrock Knowledge Base sync로 시장 조사 운영 루프를 만들었습니다.
  • InVision OCR에서 PDF/이미지 업로드, OCR/레이아웃 분석, 표 구조 복원, 결과 검수, 배치 처리, 고객 납품 프로필까지 문서 처리 흐름을 구현했습니다.
2024.07 - 2025.07

ArtygenSpace, AI/ML Engineer

AI 기반 콘텐츠 제품의 모델 설계, 추천, 생성, 편집 워크플로를 담당하며 CES 2025 수상 제품의 AI 기능 개발을 주도했습니다.

  • booxTory와 arti의 AI 기능을 설계해 CES 2025 AI Innovation Awards 성과에 기여했습니다.
  • StoryMate, Booxedit, KOCCA AI 콘텐츠 지원 사업, AI 바우처 공급기업 프로젝트를 수행했습니다.
  • 콘텐츠 생성, 사용자 선호 기반 추천, 편집 자동화 기능을 제품 요구사항에 맞춰 연결했습니다.
2022 - 2024

Kyonggi University, Computer Science M.S.

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법을 연구하고 LightGCN, WF-GCN, 의료영상 딥러닝 논문을 발표했습니다.

  • 석사 논문: 추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법.
  • 석사 GPA 4.25/4.5, 학부 GPA 3.62/4.5, ABEEK 공학인증.
  • APIC-IST 2022 Best Paper Award, KIIT Best Paper Award를 수상했습니다.

Projects

프로젝트

Deck 01 / 05 · 2개씩 보기
AsianaIDT / 2026.02 - 현재

InVision OCR문서 OCR 및 표 구조 복원 스택

자체 구축한 InVision OCR Engine을 중심으로 PDF/이미지 문서 처리, 레이아웃 분석, 표 구조 복원, 결과 검수, 배치 처리, 보안 납품까지 이어지는 OCR 제품을 개발하고 있습니다.

  • 이미지와 PDF 업로드, OCR, 레이아웃 분석, 영역 지정, 배치 처리, 이력 저장, 템플릿 리포트까지 한 작업 흐름으로 연결했습니다.
  • 자체 구축한 InVision OCR Engine과 문서 레이아웃/표 구조 분석 엔진을 서빙하고, 표 중심 업무 문서의 구조 복원 품질을 계속 개선하고 있습니다.
  • 사용자가 결과를 직접 검수하고 재처리할 수 있도록 페이지 이미지, OCR 결과, 표 후보, 저장 이력을 함께 보여주는 화면을 만들었습니다.
  • 개발/연구/고객 납품/모니터링 환경을 분리하고, 보안 납품과 라이선스 잠금 조건을 함께 관리했습니다.
InVision OCR EngineDocument ParserTable Reconstruction
FastAPINext.jsInVision OCR EnginePrivate Model ServingDocument ParserTable ReconstructionSQLiteDocker
상세 내용 보기 →
AsianaIDT / 2026.05.11 - 2026.05.22

Harmony안전한 사내 AI 지식 시스템

Harmony Agent가 사용자 맥락, 권한, 사내 지식, 회의 흐름을 이해하고 행동하는 엔터프라이즈 AI 에이전트 시스템입니다.

  • Harmony Agent를 UserContext, Session, persona overlay, tool context, citation, audit trail이 연결된 실행 단위로 설계했습니다.
  • 개인 채팅, Space 공유 채팅, 회의 세션마다 검색 후보가 다르게 합성되도록 SessionScopedRetrievalEngine과 permission metadata 경계를 구성했습니다.
  • 문서와 회의 기록은 바로 지식화하지 않고 LLM-Wiki Compiler, review queue, reviewer 승인, publish, PageIndex reload 흐름을 거쳐 공식 corpus로 편입되게 만들었습니다.
  • FastAPI API, Next.js Web, PageIndex RAG, Space 협업, Voice meeting, AWS 배포 계약까지 하나의 엔터프라이즈 AI 제품 구조로 묶었습니다.
Harmony Agent RuntimePermission-aware RAGHuman-gated Knowledge Loop
PythonFastAPINext.jsHarmony AgentAWS BedrockPageIndexSQLAlchemyOpenTofu
상세 내용 보기 →

Research

연구 목록

Deck 01 / 05
Master's Thesis
2024

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법

Kyonggi University dCollection

Optimization methods of Graph Convolution Networks for Recommendation Systems.

M.S. ThesisUCI I804:41002-0000000577831st author
dCollection
SCIE Journal
2024

Embedding Enhancement method for LightGCN in Recommendation Information Systems

Electronics, vol. 13, no. 12

LightGCN 기반 추천 시스템에서 embedding 표현을 강화하는 방법을 제안했습니다.

SCIE(Q2)MDPI Electronics1st author
DOI
SCIE Journal
2024

Weighted Forwarding in Graph Convolution Networks for Recommendation Information System

Computers, Materials & Continua, vol. 78, no. 2

그래프 컨볼루션 네트워크의 가중 전달 전략으로 추천 품질을 개선한 연구입니다.

SCIE(Q2)CMC1st author
DOI
SCIE Journal
2023

Deep Learning Model Ensemble for the Accuracy of Classification Degenerative Arthritis

Computers, Materials & Continua, vol. 75, no. 1

퇴행성 관절염 분류 정확도를 높이기 위한 딥러닝 모델 앙상블 연구입니다.

SCIE(Q2)CMC1st author
DOI

Awards

수상 기록

Deck 01 / 02
2025.12

Plan2Do 수상

안전산업진흥 유공 행정안전부 장관상, 한국건설기술연구원 원장상

Plan2Do에 탑재되는 AI 안전도우미와 위험성평가 지원 시스템을 고도화해 AI 산업안전보건 플랫폼의 수상 성과에 기여했습니다.

Plan2DoAI SafetyMinister Award
2025

CES 2025 AI Innovation Awards

booxTory Best of Innovation / arti Honoree

AI 콘텐츠 제품의 AI 엔진 개발과 기술 리더십으로 CES 2025 혁신상 성과에 기여했습니다.

AI ProductsbooxToryarti
2025

WIS 2025 혁신상

과학기술정보통신부 장관상

AI 제품화 성과와 기술 경쟁력을 인정받아 월드IT쇼 혁신상 장관상을 수상했습니다.

Minister AwardWIS 2025Product AI
2022

APIC-IST 2022 Best Paper Award

Best Paper Award

Xception 기반 퇴행성 관절염 분류 연구가 APIC-IST Best Paper에 선정되었습니다.

Medical ImagingXception1st author

Competitions

대회 및 외부 활동

2024.01 - 2024.02

LG Aimers 4기

팀리더

MQL 데이터 기반 B2B 영업 기회 창출 예측 모델을 개발했습니다. 데이터 정규화, 비즈니스 영역 매핑, XGBoost 모델, 임계값 최적화를 통해 F1-score를 개선했습니다.

MQL PredictionF1-score 0.75154Team Leader
활동 보기 →
2023

HD현대 AI Challenge

4위

건설기계 센서데이터를 활용한 작업 중량 예측 모델을 개발하고, 시계열 Transformer와 맞춤형 손실 함수로 성능을 끌어올렸습니다.

4th PlacePublic Score 98.21432Time Series Transformer
활동 보기 →
2021 - 2024

DACON 경진대회

39개 대회 참여

컴퓨터 비전, 정형 데이터 분류, 시계열, 추천 시스템 등 다양한 AI 경진대회에 참여하며 데이터 분석과 모델링 경험을 축적했습니다.

Top 1% 7Top 5% 10Top 10% 15
활동 보기 →
2022.09 - 2022.11

가짜연구소 6기

그래프로 설득하기 팀원

Graph Neural Network를 주제로 한 비영리 AI 연구 활동에 참여했습니다. GraphGym 기반 실험 환경을 구축하고 GCN, GIN, Virtual Node, Aggregation 방식별 성능을 비교했습니다.

GNNGraphGymTeam 8
활동 보기 →
2021.03 - 2023.02

DIYA

AI 연구 및 대회 참여 커뮤니티

Computer Vision Team과 ML/GNN Team에서 논문 리뷰, PyTorch 기반 모델 구현, DACON 대회 참여, 학술발표대회 논문 발표를 수행했습니다.

Computer VisionGNNPaper Review
활동 보기 →

Skills

기술 스택

O/S

  • Windows
  • UNIX

언어 (Language)

프레임워크 (Framework)

  • MyBatis
  • Langsmith

DBMS

  • Oracle

클라우드 및 미들웨어

  • AWS SageMaker
  • AWS CLI
  • NCP

업무도구 (Work Tools)

AI Skill

Foundation Models

  • SLM
  • LLM
  • Embeddings
  • Prompting
  • Optimization
  • Serving

Retrieval / Agent

  • Vector RAG
  • Graph RAG
  • Vector Database
  • Single Agent
  • Multi-Agent

Vision AI

  • Object Detection
  • Prompt Detection
  • Open-World Detection
  • Segmentation
  • Classification
  • Pose Estimation

Recommendation / Graph

  • Recommender Systems
  • GNN
  • GCN
  • GIN
  • Graph Optimization

Predictive Modeling

  • Prediction
  • Regression
  • Classification
  • Time Series
  • Ensemble
  • Structured Data
  • Unstructured Data
  • Hyperparameter Tuning

NLP / Data Ops

  • NLP
  • Multilingual NLP
  • Document Layout
  • OCR
  • Augmentation
  • Pre-processing
  • Post-processing
  • MLOps

Blog

최근 지식

Deck 01 / 02 · 블로그 전체 글 155개