AI Engineer & Researcher

이상(Ideal)은 높게, 평균(Mean)은 넘게

이상은 연구가 그리고, 평균은 엔지니어링이 넘습니다.
그 사이를 운영 가능한 시스템으로 잇습니다.

~/portfolio/whoami

               ..:.
           .=*###%##=.
          -%@%%###%%%#*+:
         :%@@@%@@@%%%%@@%*
        =%@@@@%%@@@@@@@@@@#
       :%%@%%%%%@@@@@@@@@%@*
       *%%%%%%%@@@%@@@@@%@@@:
      .%@@%#%%@@%%%@%%@@@@@@=
      .%@@%%#######%#*%@@@@@-
       #@@@@%%%%%###**%%@@@@:
       =%%@@%%%##++*##%@@@@#
        %%+=--==-..-=+++*#@+
        =#..--*=: .--*++=+#-.
       =:+:  .:.  .::::--+*=-
       .:+:       .-:...:++-
        ..:    .. .=-...-++.
         .-:.   :-=+-..:==:
           ::..  .:--::-+.
           ::..:===++--==
            -::..::---==.
            :=:....::-+=
            .==:..::-++-
            .:---=++++=-
            :..:--===--=
          .::...:::--::---:
        .+%:... ...::::-=*@*:
      =#%@@+  . ...:::::-#@@@*:
   -*%%%%%%%+    ......-#@@@@@@#=
-*%%%%%%%%%%@#=:....:-+%@@@@@%%@@%+:
%%%%%%%%%%%%@@@%%###%%@@@@@@@@@@@@@%
%%%%%%%%%%%@@@@@@@@@@@@@@@@@@@@@@@@@
%%%%@%%%@@@@@@@@@@@@@@@@@@@@@@@@@@@@

$ whoami

sangmin@d9249

Profile

Name: Sangmin Lee
Role: AI Engineer & Researcher
Current: AsianaIDT · AI/ML
Focus: RAG · Agents · OCR · Vision

Stack

Languages: Python · JavaScript
AI / Data: PyTorch · LangGraph · FastAPI
Infra: AWS · Docker · Kubernetes

Highlights

Products: AI products ×8
Research: SCIE Q2 ×3 · KCI ×2
Awards: CES 2025 · Minister ×2

Contact

Email: dodo9249@gmail.com
GitHub: github.com/d9249

Highlights

주요 성과

product ai

CES 2025

booxTory Best of Innovation과 arti Honoree 두 제품에서 개인화 독서 AI 엔진과 CATS·MERGE·CLEAR·NEXIS 4개 핵심 AI 솔루션을 기술 리드했습니다.

product engineering

AI 제품 8종

ArtygenSpace booxTory·arti(콘텐츠 AI)부터 AsianaIDT AIO·Harmony·Plan2Do·Jeani·InVision OCR·A-VLAN(엔터프라이즈 AI)까지, 8개 AI 제품을 RAG·멀티에이전트·비전으로 설계·구축했습니다.

awards

장관상 · 회장상

행정안전부(Plan2Do)·과학기술정보통신부(WIS 2025) 장관상과 대한상공회의소 회장상(AI 항공조업 안전기술)까지, AI 제품화 성과를 정부·산업에서 3회 수상했습니다.

productization

특허 · 공급계약

InVision OCR에서 표 구조 복원을 TEDS 0.9188까지 고도화하고, 관련 기술 특허 출원과 K사 솔루션 공급 계약 수주로 연구를 사업 성과로 연결했습니다.

research

SCIE Q2 3편

추천 시스템(LightGCN·WF-GCN)과 의료영상 딥러닝에서 SCIE(Q2) 저널 3편을 1저자로 발표하고, Best Paper 2회를 수상했습니다.

modeling

Top 1% 7회

DACON 39개 대회 상위 1% 7회, HD현대 AI Challenge 4위, LG Aimers 4기 팀리더로 실전 데이터 분석·모델링 역량을 검증했습니다.

Experience

실무 및 연구 경력

2025.07 - now

AsianaIDT, AI/ML Engineer & Researcher

사내 지식 관리부터 산업안전 RAG, 시장 인텔리전스, 문서 OCR, 영상·멀티모달 관제까지 — 엔터프라이즈 AI 제품을 리서치에서 운영까지 직접 설계하고 구축합니다.

AIO·Harmony에서 사내 지식 에이전트 플랫폼을 설계 — Graph + Vector 하이브리드 RAG에 ACL 기반 permission-aware retrieval을 결합해 팀·직급별로 답이 달라지는 접근 제어를 구현하고, persona·session·tool trace와 human review queue로 운영 신뢰성까지 확보했습니다.
Plan2Do에서 현장 이미지·문서와 산업안전 법령 corpus를 Qdrant 검색·LangGraph workflow로 엮어 위험성평가를 자동 생성하는 산업안전 RAG API를 제품화 — 행정안전부 장관상을 받은 AI 산업안전 플랫폼의 핵심 기능으로 탑재됐습니다.
Jeani에서 RFP를 넣으면 market·competitor·tech 에이전트가 병렬로 조사하고 synthesizer가 리포트를 합성하는 멀티에이전트 시장조사 시스템을 구축 — Bedrock Knowledge Base sync와 S3 산출물 lifecycle로 반복 가능한 운영 루프까지 완성했습니다.
InVision OCR에서 표 구조 복원 정확도를 TEDS 0.9188 / TEDS-S 0.9506 / Cell F1 0.9702까지 끌어올린 문서 OCR 스택을 구축 — 레이아웃 분석, 로직 기반 표 복원, parser 기반 문서 재조립을 벤치마크 콘솔과 함께 운영형으로 통합했습니다.
A-VLAN에서 영상·탐지·매뉴얼·항공법령을 근거로 조합하는 목표기반 멀티에이전트 관제 시스템을 설계 — GoalOrchestrator의 SELECT→COMPOSE→EVALUATE→REFINE 루프로 스킬을 동적 조합하고, Text2SQL·Chroma RAG·듀얼 RAG(리터럴+벡터)를 엮어 지상조업 상황을 자동 판정·브리핑하도록 구현했습니다.
BEV에서 단일 카메라 주기장 영상만으로 미터 척도 3D 조감도를 복원하는 파이프라인을 연구·구현 — 개방어휘 검출과 VLM 공시제원으로 실척을 추정하고 지면 호모그래피로 조감도·위험영역을 생성, 소실점·화면밖 처리로 정확도(R2)를 고도화했습니다.

2024.07 - 2025.07

ArtygenSpace, AI/ML Engineer

AI 기반 콘텐츠 제품의 모델 설계, 추천, 생성, 편집 워크플로를 담당하며 CES 2025 수상 제품의 AI 기능 개발을 주도했습니다.

booxTory와 arti의 AI 기능을 설계해 CES 2025 AI Innovation Awards 성과에 기여했습니다.
StoryMate, Booxedit, KOCCA AI 콘텐츠 지원 사업, AI 바우처 공급기업 프로젝트를 수행했습니다.
콘텐츠 생성, 사용자 선호 기반 추천, 편집 자동화 기능을 제품 요구사항에 맞춰 연결했습니다.

2022 - 2024

Kyonggi University, Computer Science M.S.

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법을 연구하고 LightGCN, WF-GCN, 의료영상 딥러닝 논문을 발표했습니다.

석사 논문: 추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법.
석사 GPA 4.25/4.5, 학부 GPA 3.62/4.5, ABEEK 공학인증.
APIC-IST 2022 Best Paper Award, KIIT Best Paper Award를 수상했습니다.

이상민AI Engineer & Researcher

2025.07 - now

AsianaIDT, AI/ML Engineer & Researcher

AIO·Harmony에서 사내 지식 에이전트 플랫폼을 설계 — Graph + Vector 하이브리드 RAG에 ACL 기반 permission-aware retrieval을 결합해 팀·직급별로 답이 달라지는 접근 제어를 구현하고, persona·session·tool trace와 human review queue로 운영 신뢰성까지 확보했습니다.
Plan2Do에서 현장 이미지·문서와 산업안전 법령 corpus를 Qdrant 검색·LangGraph workflow로 엮어 위험성평가를 자동 생성하는 산업안전 RAG API를 제품화 — 행정안전부 장관상을 받은 AI 산업안전 플랫폼의 핵심 기능으로 탑재됐습니다.
Jeani에서 RFP를 넣으면 market·competitor·tech 에이전트가 병렬로 조사하고 synthesizer가 리포트를 합성하는 멀티에이전트 시장조사 시스템을 구축 — Bedrock Knowledge Base sync와 S3 산출물 lifecycle로 반복 가능한 운영 루프까지 완성했습니다.

2024.07 - 2025.07

ArtygenSpace, AI/ML Engineer

AI 기반 콘텐츠 제품의 모델 설계, 추천, 생성, 편집 워크플로를 담당하며 CES 2025 수상 제품의 AI 기능 개발을 주도했습니다.

booxTory와 arti의 AI 기능을 설계해 CES 2025 AI Innovation Awards 성과에 기여했습니다.
StoryMate, Booxedit, KOCCA AI 콘텐츠 지원 사업, AI 바우처 공급기업 프로젝트를 수행했습니다.
콘텐츠 생성, 사용자 선호 기반 추천, 편집 자동화 기능을 제품 요구사항에 맞춰 연결했습니다.

2022 - 2024

Kyonggi University, Computer Science M.S.

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법을 연구하고 LightGCN, WF-GCN, 의료영상 딥러닝 논문을 발표했습니다.

석사 논문: 추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법.
석사 GPA 4.25/4.5, 학부 GPA 3.62/4.5, ABEEK 공학인증.
APIC-IST 2022 Best Paper Award, KIIT Best Paper Award를 수상했습니다.

Projects

프로젝트

전체 프로젝트 보기 →

AsianaIDT / 2026.06 - 2026.07

A-VLAN목표 주도 멀티스킬 루프로 항공조업 영상을 분석하는 안전 관제 에이전트

항공 조업 영상을 조합형 스킬 파이프라인으로 분석하고, GoalOrchestrator가 select → compose → evaluate → refine 루프로 목표 충족을 스스로 판정하는 영상 안전 분석 에이전트입니다. 전신 버전은 'AI 항공조업 안전기술'로 기업혁신대상 대한상공회의소 회장상('25)을 수상했습니다.

분석 능력을 1:N SkillDescriptor 카탈로그로 데이터화하고, GoalOrchestrator가 select → compose → evaluate → refine으로 스킬 조합을 스스로 구성 → 고정 파이프라인이던 전신 버전을 '목표만 주면 조합이 바뀌는' 자율 관제 루프로 재설계했습니다.
50배 압축 CCTV의 재생 위치를 파일명 촬영시각·fps와 결합해 벽시계 시각↔프레임을 결정적으로 매핑 → '10시 59분경 상황'을 프레임 번호가 아닌 실제 시각으로 질의·브리핑할 수 있게 만들었습니다.
전역·사용자 커스텀 스킬을 합집합으로 합성하고 실행 이력을 학습해 검증 통과 스킬 초안을 자동 제안 → 운영자가 쓸수록 분석 카탈로그가 확장되는 루프를 구현했습니다.

대한상의 회장상 (전신 '25)Goal-driven 멀티스킬 루프50배 압축영상 시각 앵커링

PythonFastAPIVLMObject DetectionHexagonal ArchitectureVectorDBNext.js

상세 내용 보기 →

AsianaIDT / 2026.01 - 진행 중

InVision OCR로직 기반 표 구조 복원과 정량 벤치마크를 갖춘 Document AI 플랫폼

OCR 이후의 표 구조 복원을 후보 생성 → 비교 → 선택 프레임으로 풀고, TEDS 기반 정량 벤치마크와 보안 납품 체계까지 갖춘 Document AI 플랫폼입니다. 관련 기술 특허 출원 중, K사 솔루션 공급 계약 수주.

OCR bbox와 선분 신호를 결합해 표 구조 후보를 여러 개 생성 → 비교 → 선택하는 로직 기반 복원 엔진을 단독 설계·고도화 → TEDS 0.9188 / Cell F1 0.9702까지 끌어올리고 관련 기술을 특허 출원했습니다.
HTML table GT 기준 TEDS/TEDS-S·Cell F1·CER·Row/Col 일치를 함께 재는 벤치마크 콘솔을 구축 → '좋아졌다'는 주장을 baseline 대비 정량 수치로 증명 가능하게 만들었습니다.
RSA-OAEP + AES-256-GCM 번들 암호화와 Cython secure build로 고객사 납품 파이프라인을 구축 → 모델 유출 없는 온프레미스 납품을 가능하게 해 K사 공급 계약을 수주했습니다.

TEDS 0.9188 / Cell F1 0.9702K사 솔루션 공급계약 수주관련 기술 특허 출원

FastAPINext.jsInVision OCRTable ReconstructionTEDS BenchmarkRSA-OAEP + AES-256-GCMCythonDocker Compose

상세 내용 보기 →

AsianaIDT / 2026.06 - 2026.07

A-VLAN목표 주도 멀티스킬 루프로 항공조업 영상을 분석하는 안전 관제 에이전트

분석 능력을 1:N SkillDescriptor 카탈로그로 데이터화하고, GoalOrchestrator가 select → compose → evaluate → refine으로 스킬 조합을 스스로 구성 → 고정 파이프라인이던 전신 버전을 '목표만 주면 조합이 바뀌는' 자율 관제 루프로 재설계했습니다.
50배 압축 CCTV의 재생 위치를 파일명 촬영시각·fps와 결합해 벽시계 시각↔프레임을 결정적으로 매핑 → '10시 59분경 상황'을 프레임 번호가 아닌 실제 시각으로 질의·브리핑할 수 있게 만들었습니다.
전역·사용자 커스텀 스킬을 합집합으로 합성하고 실행 이력을 학습해 검증 통과 스킬 초안을 자동 제안 → 운영자가 쓸수록 분석 카탈로그가 확장되는 루프를 구현했습니다.

대한상의 회장상 (전신 '25)Goal-driven 멀티스킬 루프50배 압축영상 시각 앵커링

PythonFastAPIVLMObject DetectionHexagonal ArchitectureVectorDBNext.js

상세 내용 보기 →

AsianaIDT / 2026.01 - 진행 중

InVision OCR로직 기반 표 구조 복원과 정량 벤치마크를 갖춘 Document AI 플랫폼

OCR bbox와 선분 신호를 결합해 표 구조 후보를 여러 개 생성 → 비교 → 선택하는 로직 기반 복원 엔진을 단독 설계·고도화 → TEDS 0.9188 / Cell F1 0.9702까지 끌어올리고 관련 기술을 특허 출원했습니다.
HTML table GT 기준 TEDS/TEDS-S·Cell F1·CER·Row/Col 일치를 함께 재는 벤치마크 콘솔을 구축 → '좋아졌다'는 주장을 baseline 대비 정량 수치로 증명 가능하게 만들었습니다.
RSA-OAEP + AES-256-GCM 번들 암호화와 Cython secure build로 고객사 납품 파이프라인을 구축 → 모델 유출 없는 온프레미스 납품을 가능하게 해 K사 공급 계약을 수주했습니다.

TEDS 0.9188 / Cell F1 0.9702K사 솔루션 공급계약 수주관련 기술 특허 출원

FastAPINext.jsInVision OCRTable ReconstructionTEDS BenchmarkRSA-OAEP + AES-256-GCMCythonDocker Compose

상세 내용 보기 →

AsianaIDT / 2026.05.11 - 2026.05.22

Harmony권한 · 승인 · 인용으로 구성되는 엔터프라이즈 초개인화 AI 에이전트

에이전트 런타임을 프로토콜 계약으로 추상화하고, 검색을 에이전트 주도 멀티홉으로 전환해 검색 후보와 인용을 분리하며, AI가 만든 지식은 사람 승인을 거쳐야만 공식 corpus가 되는 human-gated 사내 AI 시스템입니다.

run_turn/stream_turn IAIAgent 프로토콜로 런타임을 계약화하고 로컬·서버 2개 구현을 같은 계약으로 교체 가능하게 만듦 → 모델·인프라가 바뀌어도 상위 코드는 그대로인 벤더 독립 구조를 확보했습니다.
프리페치 RAG를 에이전트 주도 멀티홉(최대 6회) 검색으로 전환하고 검색 후보(tool trace)와 실제 인용(citations)을 분리 → '무엇을 봤는지'와 '무엇을 근거로 답했는지'가 따로 추적되는 검색을 구현했습니다.
LLM이 만든 지식 초안을 review queue에서 사람이 승인해야만 공식 corpus에 편입되는 human-gated loop를 설계 → AI 생성 지식이 검증 없이 사내 정답이 되는 위험을 원천 차단했습니다.

사내 에이전트 플랫폼Human-gated 지식 승인 루프Agentic 멀티홉 검색 (최대 6회)

PythonFastAPINext.jsAWS BedrockPageIndexSQLAlchemyOpenTofu

상세 내용 보기 →

AsianaIDT / 2025.10 - 2026.02

AIOGraph + Vector Hybrid RAG와 Agent Builder를 갖춘 엔터프라이즈 지식 플랫폼

기업 문서를 Graph + Vector 이중 인덱스로 지식화하고, 5가지 검색 모드와 RRF 4벡터 융합으로 질의하며, LangGraph 기반 Agent Builder로 워크플로우를 조립하는 엔터프라이즈 AI 지식 플랫폼입니다.

LightRAG를 Milvus + Neo4j로 재구성해 local/global/hybrid/naive/mix 5개 검색 모드를 한 파이프라인에 통합 → 질의 성격에 따라 벡터·그래프 검색을 골라 쓰는 Hybrid RAG를 구축했습니다.
content/title/domain/structure 4개 벡터 필드를 병렬 검색해 RRF(k=60)로 융합 → 단일 임베딩이 놓치는 제목·도메인·구조 신호까지 반영한 멀티벡터 검색을 구현했습니다.
다중 저장소 삭제 잔존과 동시 연결 초기화 경합을 세션 기반 삭제 파이프라인·asyncio.Lock double-check로 해결 → Graph/Vector 인덱스가 서로 어긋나지 않는 삭제 일관성을 확보했습니다.

5종 DB 오케스트레이션RRF 4벡터 융합 (k=60)검색 모드 5종

FastAPILangGraphMilvusNeo4jPostgreSQLRedisElasticsearchVue 3Celery

상세 내용 보기 →

AsianaIDT / 2025.07 - 2025.12

Plan2Do법령 근거가 검증된 위험성평가를 생성하는 산업안전 RAG 서비스

현장 이미지 · 문서에서 위험요인을 추출하고, 법령 벡터 검색과 LLM 재검증으로 근거의 정확성을 보증하며, LangGraph 워크플로우로 위험성평가 표를 생성하는 AI 안전 분석 서비스입니다. 이 서비스을 탑재한 Plan2Do 플랫폼은 행정안전부 장관상·한국건설기술연구원 원장상을 수상했습니다.

3개 법령 계열 XML을 법→조→항→호 계층으로 정규화하고 상위 계층을 chunk 제목에 포함 → 검색 결과가 그 자체로 인용 가능한 표기('산업안전보건법 제38조 제1항')가 되는 법령 corpus를 구축했습니다.
위험 설명↔조문의 어휘 간극을 원본·키워드 이중 검색으로 메우고 법령당 2건·조당 1건 cap으로 편중을 차단 → 근거가 특정 법 한 곳에 도배되지 않고 폭넓게 커버되도록 설계했습니다.
생성 이후 감소대책 단위로 매칭 법령을 LLM이 재판정(validated/removed·removal_rate)하고 제거 내역을 리포트에 공개 → 환각·무관 인용을 걸러 '검증 과정이 보이는' 신뢰를 확보했습니다.

행안부 장관상·건기연 원장상AI 위험성평가 서비스 단독 개발법령 근거 LLM 재검증

PythonFastAPILangGraphQdrantPostgreSQLOpenAI GPT-4oGeminiDocker Compose

상세 내용 보기 →

AsianaIDT / AWS EST 과정 2025.09.08 - 12.05 · 집중 개발 2025.11 - 12

JeaniRFP 기반 제안서·시장 인텔리전스 멀티에이전트 플랫폼

RFP를 분석·수정하는 8+8 에이전트 파이프라인 위에, 시장 인텔리전스를 자동 수집해 Bedrock Knowledge Base로 동기화하는 KB Intelligence 오케스트레이터를 얹은 팀 프로젝트입니다. 역할: 프론트엔드, KB Intelligence 오케스트레이터, IaC.

시장 인텔리전스 수집을 supervisor + 5개 전문 에이전트(planner·researcher·competitor·tech·synthesizer)로 설계하고 Bedrock KB 동기화까지 자동화 → RFP만 넣으면 조사 리포트가 KB에 쌓이는 무인 수집 루프를 만들었습니다.
Next.js 프론트엔드와 14개 BFF 라우트를 구현하고 S3 단일 소스 원칙을 적용 → 여러 산출물 화면 사이의 클라이언트 상태 불일치를 제거했습니다.
AWS EST Gen AI 실무 과정(2025.09–12, 13주) 팀 프로젝트로, 8+8 RFP 분석·수정 에이전트 위에 본인이 KB Intelligence 오케스트레이터·프론트엔드·IaC를 얹어 완성했습니다.

KB Intelligence 5 Agents8+8 분석·수정 에이전트BFF 라우트 14

AWS LambdaAmazon S3DynamoDBEventBridgeAWS BedrockBedrock Knowledge BaseTerraformNext.jsTypeScript

상세 내용 보기 →

ArtygenSpace / 2024.07 - 2025.07

ArtygenSpacebooxTory / arti 제품 개발 포트폴리오

ArtygenSpace에서 1년간 진행한 두 개의 핵심 프로젝트, booxTory와 arti의 제품 개발 및 AI 솔루션 리드 경험을 정리한 포트폴리오 허브입니다.

ArtygenSpace 1년간 booxTory·arti 두 제품의 AI 연구·엔지니어링을 수행 → 두 제품 모두 CES 2025 혁신상(booxTory Best of Innovation·arti Honoree)에 기여했습니다.
booxTory는 개인화 AI 독서 경험, arti는 CATS·MERGE·CLEAR·NEXIS 4개 핵심 AI 솔루션으로 제품화 → 콘텐츠 생성·비전·문서·검색을 아우르는 풀스택 AI 역량을 보였습니다.
각 프로젝트를 저장소가 아니라 제품명·솔루션명·역할·기술 리드 범위 중심으로 정리 → '무엇을 만들고 무엇을 책임졌는가'로 읽히게 구성했습니다.

2 Product ProjectsbooxTory Best of Innovationarti Honoree

PythonFastAPILangGraphQdrantComputer VisionOCRRAG

상세 내용 보기 →

ArtygenSpace / 2024.07 - 2025.07

booxToryAI 독서 경험 제품 개발

CES 2025 Best of Innovation을 받은 booxTory에서 책 페이지 인식, 사용자별 독서 AI, RAG, TTS, 퀴즈, 번역, 추천 기능을 제품 흐름으로 묶은 경험입니다.

책 페이지 이미지를 텍스트·영역으로 변환해 사용자·책 단위 독서 데이터로 연결 → 종이책을 개인화 AI가 붙는 디지털 독서 세션으로 만들었습니다.
사용자별 문서 컬렉션과 채팅 메모리를 분리 → 독서 질문·이전 대화·책 맥락이 섞이지 않고 안전하게 결합되는 개인화 RAG를 설계했습니다.
TTS·퀴즈·요약·번역·추천 질문·사운드 추천을 독서 후속 활동으로 확장 → 한 번의 페이지 인식에서 여러 상호작용이 파생되는 제품 흐름을 완성했습니다.
모델 실험을 API·저장소·비동기 작업·테스트 가능한 서비스로 이관 → 연구 코드를 CES 2025 Best of Innovation 제품 런타임으로 안착시켰습니다.

CES 2025 Best of InnovationPersonalized Reading AIOCR/RAG/TTS

PythonFastAPIQdrantLangChainOpenAIComputer VisionTTS

상세 내용 보기 →

ArtygenSpace / 2024.07 - 2025.07

arti핵심 AI 솔루션 기술 리드

CES 2025 Honoree 제품인 arti에서 CATS, MERGE, CLEAR, NEXIS 네 가지 핵심 AI 솔루션의 기술 방향과 제품화 흐름을 리드한 경험입니다.

CATS: LangGraph 다중 에이전트로 책 한 권을 퀴즈·음악·인터랙티브 스토리로 변환하는 콘텐츠 솔루션의 기술 방향을 리드 → 정적인 책을 능동형 콘텐츠로 확장했습니다.
MERGE: 자연어 프롬프트로 객체를 탐지하고 정밀 분할·중복 제거하는 탐지 솔루션을 리드 → 좌표를 몰라도 '무엇을'을 말로 지정하는 이미지 편집 흐름을 가능하게 했습니다.
CLEAR: 다국어 문서를 레이아웃 보존한 채 인식하고 OCR 결과를 교정·구조화하는 문서 인식 솔루션을 리드 → 원문 구조가 살아있는 디지털화를 구현했습니다.
NEXIS: 문서 기반 질의응답과 텍스트–효과음 매칭을 잇는 검색/추천 솔루션을 리드 → 콘텐츠 맥락에 맞는 사운드를 자동 연결했습니다. (4개 솔루션으로 CES 2025 Honoree 기여)

CES 2025 Honoree4 Core AI SolutionsAI Tech Lead

LangGraphQdrantBGE-M3Vision TransformerOCRRAGFastAPINLP

상세 내용 보기 →

Kyonggi University / M.S. Thesis

GCN 추천 시스템 최적화 연구Egress 초기화와 Weighted Forwarding으로 임베딩 손실을 완화한 석사 논문 연구

석사학위논문 「추천 시스템에서 그래프 콘볼루션 네트워크 최적화 방법」을 기반으로, GCN 추천 시스템의 임베딩 값 손실과 깊은 Layer 구성 한계를 분석하고 Egress 초기화와 Weighted Forwarding(WF)으로 학습 속도와 추천 정확도 개선을 검증한 연구입니다.

GCN 추천의 임베딩 값 손실(좁은 범위 수렴)과 깊은 Layer 구성 한계를 문제로 정의하고 Egress 초기화로 초기 임베딩 범위를 넓힘 → 학습 속도와 추천 정확도 개선을 확인했습니다.
전파 전 임베딩에 가중치를 곱해 전달하는 Weighted Forwarding으로 layer가 깊어질수록 신호가 희석되는 문제를 완화 → over-smoothing 없이 더 깊은 GCN 구성이 가능함을 검증했습니다.
FilmTrust·MovieLens-1M·Yelp2018·Douban-book 4개 벤치마크에서 LightGCN·SGL·SimGCL·XSimGCL 등에 제안 기법을 이식해 Recall@20/NDCG@20을 비교 → 기법의 효과와 한계를 다각 검증했습니다.
이 연구를 석사학위논문과 SCIE(Q2) 저널 2편(Electronics·CMC) 1저자 논문으로 게재 → 추천 시스템 최적화 성과를 학술적으로 인정받았습니다.

SCIE(Q2) 2편 · 1저자석사학위논문 기반Egress Init · Weighted Forwarding

Graph Convolution NetworkRecommendation SystemLightGCNPyTorchPCA / GKDEMovieLens-1M / FilmTrust / Yelp2018 / Douban-book

상세 내용 보기 →

Kyonggi University / SCIE Journal

Degenerative Arthritis Specialist EnsembleKneeXray 5-class K-L grade 분류에서 class별 전문 모델을 결합한 의료영상 앙상블 연구

CMC 2023 논문 「Deep Learning Model Ensemble for the Accuracy of Classification Degenerative Arthritis」를 바탕으로, 무릎 X-ray 영상의 Kellgren–Lawrence grade 분류에서 여러 CNN·Transformer 계열 모델을 비교하고 class별 specialist ensemble로 성능을 개선한 프로젝트입니다.

인접 grade 차이가 작고 class 불균형이 심한 KneeXray 8,260장 K-L grade 0~4 5-class 분류를, 전체 accuracy만으로는 유용성을 설명하기 어려운 문제로 정의했습니다.
VGG·DenseNet·ResNet·EfficientNet·MobileNet·Xception·ViT 계열을 동일 조건에서 비교해 grade별 강점 모델을 식별 → 단일 모델의 한계를 데이터로 드러냈습니다.
grade마다 가장 강한 모델을 결합하는 class별 specialist ensemble을 구성 → accuracy 77.05%·F1 0.78로 단일 모델을 넘어서고 SCIE(Q2·CMC) 1저자 논문으로 게재했습니다.

SCIE(Q2) · CMC 1저자Accuracy 77.05% / F1 0.78KneeXray 5-class · 8,260장

Medical Image ClassificationSpecialist EnsemblePyTorch / timmTransfer LearningKneeXrayKellgren–Lawrence Grade

상세 내용 보기 →

Kyonggi University / KCI Journal

MCU-Net Pancreas Segmentation다중 연쇄 U-Net으로 작은 장기 분할 성능을 개선한 의료영상 연구

KCI 논문 「의료 영상 시스템에서 다중 연쇄 U-Net 모델을 이용한 개선된 췌장 영역 분할 탐지」를 바탕으로, 복부 CT에서 췌장 영역을 더 안정적으로 분할하기 위해 서로 다른 패치 크기의 U-Net 특징을 결합한 프로젝트입니다.

크기가 작고 경계가 모호해 분할이 어려운 췌장 문제에, 서로 다른 패치 크기의 U-Net 특징을 마지막 단계에서 연쇄 결합하는 MCU-Net 구조를 제안 → 작은 장기·제한된 데이터에서 안정적 분할을 노렸습니다.
Pancreas-CT 82개 3D scan·19,328 슬라이스로 4-fold·Dice 기반 평가를 설계 → 성능 수치뿐 아니라 '어떤 기준으로 쟀는지'까지 명확한 검증 체계를 갖췄습니다.
MCU-Net M5가 DSC 0.916으로 U-Net 0.896·Attention U-Net 0.832·RSTN 0.846을 상회 → 개선을 입증하고 KCI 1저자 논문으로 게재했습니다.

Pancreas DSC 0.916 (U-Net 0.896)Pancreas-CT 82 scansKCI 논문 · 1저자

Medical Image SegmentationU-Net / MCU-NetTensorFlow / KerasPancreas-CTDice Coefficient

The Journal of Korean Institute of Information Technology

KIIT Conference, pp. 729-733

PoseNet 기반 헬스 트레이너 웹 서비스 논문으로 KIIT Best Paper Award를 수상했습니다.

KIITBest Paper1st author

Awards

수상 기록

전체 수상 보기 →

2025.12

Plan2Do 수상

안전산업진흥 유공 행정안전부 장관상, 한국건설기술연구원 원장상

Plan2Do에 탑재되는 AI 안전도우미와 위험성평가 지원 시스템을 고도화해 AI 산업안전보건 플랫폼의 수상 성과에 기여했습니다.

Plan2DoAI SafetyMinister Award

아시아나IDT 뉴스 →아시아나IDT 연혁 →

2025

CES 2025 AI Innovation Awards

booxTory Best of Innovation / arti Honoree

AI 콘텐츠 제품의 AI 엔진 개발과 기술 리더십으로 CES 2025 혁신상 성과에 기여했습니다.

AI ProductsbooxToryarti

booxTory CES →arti CES →

2025

WIS 2025 혁신상

과학기술정보통신부 장관상

AI 제품화 성과와 기술 경쟁력을 인정받아 월드IT쇼 혁신상 장관상을 수상했습니다.

Minister AwardWIS 2025Product AI

WIS 2025 결과보고서 →

2022

APIC-IST 2022 Best Paper Award

Best Paper Award

Xception 기반 퇴행성 관절염 분류 연구가 APIC-IST Best Paper에 선정되었습니다.

Medical ImagingXception1st author

2025.12

Plan2Do 수상

안전산업진흥 유공 행정안전부 장관상, 한국건설기술연구원 원장상

Plan2Do에 탑재되는 AI 안전도우미와 위험성평가 지원 시스템을 고도화해 AI 산업안전보건 플랫폼의 수상 성과에 기여했습니다.

Plan2DoAI SafetyMinister Award

아시아나IDT 뉴스 →아시아나IDT 연혁 →

2025

CES 2025 AI Innovation Awards

booxTory Best of Innovation / arti Honoree

AI 콘텐츠 제품의 AI 엔진 개발과 기술 리더십으로 CES 2025 혁신상 성과에 기여했습니다.

AI ProductsbooxToryarti

booxTory CES →arti CES →

2025

WIS 2025 혁신상

과학기술정보통신부 장관상

AI 제품화 성과와 기술 경쟁력을 인정받아 월드IT쇼 혁신상 장관상을 수상했습니다.

Minister AwardWIS 2025Product AI

WIS 2025 결과보고서 →

2022

APIC-IST 2022 Best Paper Award

Best Paper Award

Xception 기반 퇴행성 관절염 분류 연구가 APIC-IST Best Paper에 선정되었습니다.

Medical ImagingXception1st author

2021

KIIT Best Paper Award

Best Paper Award

PoseNet을 활용한 헬스 트레이너 웹 서비스 논문으로 한국정보기술학회 우수 논문 성과를 기록했습니다.

PoseNetKIIT1st author

2021

한국정보기술학회 대학생논문경진대회

우수논문상 동상

PoseNet을 활용한 헬스 트레이너 웹 서비스 논문으로 대학생논문경진대회 우수논문상을 수상했습니다.

No. 21-222BronzePaper Contest

상장 →

2021

경기대학교 AI컴퓨터공학부 캡스톤디자인전시회

장려상

핏-시방 프로젝트로 캡스톤디자인전시회 장려상을 수상했습니다.

No. 2021-0005CapstoneTeam Project

상장 →

Competitions

대회 및 외부 활동

전체 대회 보기 →

2024.01 - 2024.02

LG Aimers 4기

팀리더

MQL 데이터 기반 B2B 영업 기회 창출 예측 모델을 개발했습니다. 데이터 정규화, 비즈니스 영역 매핑, XGBoost 모델, 임계값 최적화를 통해 F1-score를 개선했습니다.

MQL PredictionF1-score 0.75154Team Leader

수료증 →

활동 보기 →

2023

HD현대 AI Challenge

4위

건설기계 센서데이터를 활용한 작업 중량 예측 모델을 개발하고, 시계열 Transformer와 맞춤형 손실 함수로 성능을 끌어올렸습니다.

4th PlacePublic Score 98.21432Time Series Transformer

증빙서 →

활동 보기 →

2021 - 2024

DACON 경진대회

39개 대회 참여

컴퓨터 비전, 정형 데이터 분류, 시계열, 추천 시스템 등 다양한 AI 경진대회에 참여하며 데이터 분석과 모델링 경험을 축적했습니다.

Top 1% 7Top 5% 10Top 10% 15

활동 보기 →

2022.09 - 2022.11

가짜연구소 6기

그래프로 설득하기 팀원

Graph Neural Network를 주제로 한 비영리 AI 연구 활동에 참여했습니다. GraphGym 기반 실험 환경을 구축하고 GCN, GIN, Virtual Node, Aggregation 방식별 성능을 비교했습니다.

GNNGraphGymTeam 8

활동 보기 →

2021.03 - 2023.02

DIYA

AI 연구 및 대회 참여 커뮤니티

Computer Vision Team과 ML/GNN Team에서 논문 리뷰, PyTorch 기반 모델 구현, DACON 대회 참여, 학술발표대회 논문 발표를 수행했습니다.

Computer VisionGNNPaper Review

DIYA 4기 증빙 →

활동 보기 →

2021.07

산업인공지능 단기집중교육

교육과정 수료

한국생산성본부와 전자부품연구원의 산업인공지능 단기집중 교육과정(일반공통)을 수료했습니다.

Industrial AIKPCKETI

수료증 →

2024.01 - 2024.02

LG Aimers 4기

팀리더

MQL PredictionF1-score 0.75154Team Leader

수료증 →

활동 보기 →

2023

HD현대 AI Challenge

4위

건설기계 센서데이터를 활용한 작업 중량 예측 모델을 개발하고, 시계열 Transformer와 맞춤형 손실 함수로 성능을 끌어올렸습니다.

4th PlacePublic Score 98.21432Time Series Transformer

증빙서 →

활동 보기 →

2021 - 2024

DACON 경진대회

39개 대회 참여

컴퓨터 비전, 정형 데이터 분류, 시계열, 추천 시스템 등 다양한 AI 경진대회에 참여하며 데이터 분석과 모델링 경험을 축적했습니다.

Top 1% 7Top 5% 10Top 10% 15

활동 보기 →

2022.09 - 2022.11

가짜연구소 6기

그래프로 설득하기 팀원

GNNGraphGymTeam 8

활동 보기 →

2021.03 - 2023.02

DIYA

AI 연구 및 대회 참여 커뮤니티

Computer Vision Team과 ML/GNN Team에서 논문 리뷰, PyTorch 기반 모델 구현, DACON 대회 참여, 학술발표대회 논문 발표를 수행했습니다.

Computer VisionGNNPaper Review

DIYA 4기 증빙 →

활동 보기 →

2021.07

산업인공지능 단기집중교육

교육과정 수료

한국생산성본부와 전자부품연구원의 산업인공지능 단기집중 교육과정(일반공통)을 수료했습니다.

Industrial AIKPCKETI

수료증 →

Skills

기술 스택

CORE 01

O/S

Linux (Ubuntu)
Windows
UNIX

CORE 02

언어 (Language)

Python
JavaScript

CORE 03

프레임워크 (Framework)

Next.js
React.js
Vue.js
Django
Nest.js
MyBatis
Tailwind CSS
Langsmith
Langfuse
Langchain
Langgraph
PyTorch
NumPy
Pandas
OpenCV
Pillow
ImageHash
Scikit-learn
TensorFlow
FastAPI
Uvicorn
Gunicorn
aiohttp
Streamlit

CORE 04

DBMS

MySQL
PostgreSQL
Oracle
MongoDB
Qdrant
Milvus
Neo4j

CORE 05

클라우드 및 미들웨어

AWS SageMaker
AWS Lambda
EventBridge
SQS
DynamoDB
AWS CLI
NCP
Redis
Kafka
Docker
Docker-Compose
Kubernetes
Elasticsearch
Logstash
Kibana
Prometheus
Grafana
Loki
Terraform
wandb

CORE 06

업무도구 (Work Tools)

Git
Jira
Confluence
Postman
Notion
pytest
Github Actions

AI 01

Foundation Models

SLM
LLM
Embeddings
Prompting
Optimization
Serving

AI 02

Retrieval / Agent

Vector RAG
Graph RAG
Hybrid Search
Rank Fusion
Hierarchy Indexing
Vector Database
Single Agent
Multi-Agent
Agent Orchestration

AI 03

Vision AI

Object Detection
Prompt Detection
Open-World Detection
Segmentation
Classification
Pose Estimation

AI 04

RecSys / Graph

Recommender Systems
GNN
GCN
GIN
Graph Optimization

AI 05

Predictive Modeling

Prediction
Regression
Classification
Time Series
Ensemble
Structured Data
Unstructured Data
Hyperparameter Tuning

AI 06

NLP / Data Ops

NLP
Multilingual NLP
Document Layout
Document Parser
OCR
Table Reconstruction
OCR Benchmarking
Augmentation
Pre-processing
Post-processing
Observability
MLOps

CORE 01

O/S

Linux (Ubuntu)
Windows
UNIX

CORE 02

언어 (Language)

Python
JavaScript

CORE 03

프레임워크 (Framework)

Next.js
React.js
Vue.js
Django
Nest.js
MyBatis
Tailwind CSS
Langsmith
Langfuse
Langchain
Langgraph
PyTorch
NumPy
Pandas
OpenCV
Pillow
ImageHash
Scikit-learn
TensorFlow
FastAPI
Uvicorn
Gunicorn
aiohttp
Streamlit

CORE 04

DBMS

MySQL
PostgreSQL
Oracle
MongoDB
Qdrant
Milvus
Neo4j

CORE 05

클라우드 및 미들웨어

AWS SageMaker
AWS Lambda
EventBridge
SQS
DynamoDB
AWS CLI
NCP
Redis
Kafka
Docker
Docker-Compose
Kubernetes
Elasticsearch
Logstash
Kibana
Prometheus
Grafana
Loki
Terraform
wandb

CORE 06

업무도구 (Work Tools)

Git
Jira
Confluence
Postman
Notion
pytest
Github Actions

AI 01

Foundation Models

SLM
LLM
Embeddings
Prompting
Optimization
Serving

AI 02

Retrieval / Agent

Vector RAG
Graph RAG
Hybrid Search
Rank Fusion
Hierarchy Indexing
Vector Database
Single Agent
Multi-Agent
Agent Orchestration

AI 03

Vision AI

Object Detection
Prompt Detection
Open-World Detection
Segmentation
Classification
Pose Estimation

AI 04

RecSys / Graph

Recommender Systems
GNN
GCN
GIN
Graph Optimization

AI 05

Predictive Modeling

Prediction
Regression
Classification
Time Series
Ensemble
Structured Data
Unstructured Data
Hyperparameter Tuning

AI 06

NLP / Data Ops

NLP
Multilingual NLP
Document Layout
Document Parser
OCR
Table Reconstruction
OCR Benchmarking
Augmentation
Pre-processing
Post-processing
Observability
MLOps

Blog

최근 지식

전체 지식 보기 →

Video Generation

VideoCoCo는 물리 과정을 먼저 코드로 실행하고, 그 다음 영상을 만든다

VideoCoCo는 Blender 코드로 물리 과정의 저해상도 초안을 먼저 실행한 뒤 비디오 편집 모델로 사실적 영상을 만드는 Code-as-CoT 이중 엔진 접근으로, 물리 일관성 비디오 생성의 제어 가능한 중...

Sangmin Lee2026.08.03

Agent Systems

Qwen-UI-Agent는 GUI 에이전트를 모델이 아니라 현실 실행 스택으로...

Qwen-UI-Agent는 실제 기기 런타임, GUI·CLI 혼합 행동, 100턴 이상 온라인 RL, 능동형 harness를 하나의 폐루프로 묶어 모바일·컴퓨터·웹을 넘나드는 GUI 에이전트를 제안한다.

Sangmin Lee2026.08.03

Agent Systems

MANTA는 멀티에이전트의 연결 구조까지 추론 중에 고친다

arXiv 2607.28527의 MANTA는 agent role·통신 link·실행 순서·정보 가시성·검증 경로를 inference-time trace에 맞춰 제한적으로 갱신하는 Multi-Agent Networ...

Sangmin Lee2026.08.02

Video Generation

VideoCoCo는 물리 과정을 먼저 코드로 실행하고, 그 다음 영상을 만든다

Sangmin Lee2026.08.03

Agent Systems

Qwen-UI-Agent는 GUI 에이전트를 모델이 아니라 현실 실행 스택으로...

Sangmin Lee2026.08.03

Agent Systems

MANTA는 멀티에이전트의 연결 구조까지 추론 중에 고친다

arXiv 2607.28527의 MANTA는 agent role·통신 link·실행 순서·정보 가시성·검증 경로를 inference-time trace에 맞춰 제한적으로 갱신하는 Multi-Agent Networ...

Sangmin Lee2026.08.02

Foundation Models

Kimi K3는 2.8T·104B 활성 경로를 open weight로 공개했다

Moonshot AI의 Kimi K3는 2.8T parameter·104B activated MoE, 1M context, native vision을 내세운 모델이다. 96개 safetensors shard의 f...

Sangmin Lee2026.07.28

Foundation Models

Nanbeige4.2-3B는 3B 규모로 agent·코드·툴 사용을 함께 겨냥한...

Nanbeige4.2-3B는 반복 레이어를 쓰는 Looped Transformer와 실행 환경 기반 SFT·다단계 RL을 결합해 3B non-embedding parameter 안에서 코드 agent, offic...

Sangmin Lee2026.07.28

Model Training

Experience Distillation은 agent의 시행착오를 contex...

Experience Distillation(EPD)은 agent가 실제 환경에서 모은 긴 시행착오 기록을 경험 context로 읽는 교사의 다음 결정으로 바꾼 뒤, 새 환경 상호작용이나 world model ro...

Sangmin Lee2026.07.26

이상(Ideal)은 높게, 평균(Mean)은 넘게

주요 성과

실무 및 연구 경력

AsianaIDT, AI/ML Engineer & Researcher

ArtygenSpace, AI/ML Engineer

Kyonggi University, Computer Science M.S.

AsianaIDT, AI/ML Engineer & Researcher

ArtygenSpace, AI/ML Engineer

Kyonggi University, Computer Science M.S.

프로젝트

A-VLAN목표 주도 멀티스킬 루프로 항공조업 영상을 분석하는 안전 관제 에이전트

InVision OCR로직 기반 표 구조 복원과 정량 벤치마크를 갖춘 Document AI 플랫폼

A-VLAN목표 주도 멀티스킬 루프로 항공조업 영상을 분석하는 안전 관제 에이전트

InVision OCR로직 기반 표 구조 복원과 정량 벤치마크를 갖춘 Document AI 플랫폼

Harmony권한 · 승인 · 인용으로 구성되는 엔터프라이즈 초개인화 AI 에이전트

AIOGraph + Vector Hybrid RAG와 Agent Builder를 갖춘 엔터프라이즈 지식 플랫폼

Plan2Do법령 근거가 검증된 위험성평가를 생성하는 산업안전 RAG 서비스

JeaniRFP 기반 제안서·시장 인텔리전스 멀티에이전트 플랫폼

ArtygenSpacebooxTory / arti 제품 개발 포트폴리오

booxToryAI 독서 경험 제품 개발

arti핵심 AI 솔루션 기술 리드

GCN 추천 시스템 최적화 연구Egress 초기화와 Weighted Forwarding으로 임베딩 손실을 완화한 석사 논문 연구

Degenerative Arthritis Specialist EnsembleKneeXray 5-class K-L grade 분류에서 class별 전문 모델을 결합한 의료영상 앙상블 연구

MCU-Net Pancreas Segmentation다중 연쇄 U-Net으로 작은 장기 분할 성능을 개선한 의료영상 연구

연구 목록

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법

Embedding Enhancement method for LightGCN in Recommendation Information Systems

Weighted Forwarding in Graph Convolution Networks for Recommendation Information System

Deep Learning Model Ensemble for the Accuracy of Classification Degenerative Arthritis

추천 시스템에서 그래프 컨볼루션 네트워크 최적화 방법

Embedding Enhancement method for LightGCN in Recommendation Information Systems

Weighted Forwarding in Graph Convolution Networks for Recommendation Information System

Deep Learning Model Ensemble for the Accuracy of Classification Degenerative Arthritis

Graph Neural Network 기반 추천시스템 성능 향상을 위한 유저 행동 시간 기반 데이터 사용 방안 분석

의료 영상 시스템에서 다중 연쇄 U-Net 모델을 이용한 개선된 췌장 영역 분할 탐지

Egress Initialization for Graph Convolution Network in Recommendation Systems

Thin Graph Convolution Network in Recommendation Systems

Over-smoothing in LightGCN doesn't happen much

Leverage time-based data to improve recommendation system accuracy

Using Deep Learning for Medical Automation in Diagnosis of Degenerative Arthritis

Classification of degenerative arthritis using Xception model in radiographic images

이상 점수 임계값 선택 기준에 따른 비지도 이상치 탐지 방법의 성능 분석

GNN 기반 딥러닝 모델에서 시간-공간 Attention 모듈 구조에 따른 교통 흐름 예측 성능 분석

추천 시스템 성능 개선을 위한 시간 기반 데이터 분석

SDN 환경에서 오토 인코더 모델을 활용한 플로우 분류 기법

추천 시스템을 활용한 캐싱 서버 최적화

RFID 태그를 통한 출결 확인 시스템 구현

겹친 문자 이미지 분류를 위한 합성곱 신경망 모델의 정확도 분석

PoseNet을 활용한 헬스 트레이너 웹 서비스

수상 기록

Plan2Do 수상

CES 2025 AI Innovation Awards

WIS 2025 혁신상

APIC-IST 2022 Best Paper Award

Plan2Do 수상

CES 2025 AI Innovation Awards

WIS 2025 혁신상

APIC-IST 2022 Best Paper Award

KIIT Best Paper Award

한국정보기술학회 대학생논문경진대회

경기대학교 AI컴퓨터공학부 캡스톤디자인전시회

대회 및 외부 활동

LG Aimers 4기

HD현대 AI Challenge

DACON 경진대회

가짜연구소 6기

DIYA

산업인공지능 단기집중교육

LG Aimers 4기

HD현대 AI Challenge

DACON 경진대회

가짜연구소 6기

DIYA

산업인공지능 단기집중교육

기술 스택

최근 지식