Tips

#Fine-tuning

4 tips tagged #Fine-tuning, 1-4 showing

1 / 1

Open source notebook

LGPL-3.0

Unsloth의 DeepSeek-OCR 3B Colab은 Google Colab GPU에서 DeepSeek-OCR을 불러와 Persian OCR 데이터로 baseline inference, LoRA fine-tuning,...

`unslothai/notebooks`의 `Deepseek_OCR_(3B).ipynb`는 README의 OCR Notebooks 표에서 Deepseek OCR 3B...
노트북은 `unsloth/DeepSeek-OCR`을 `snapshot_download`로 내려받고 `FastVisionModel.from_pretrained(...,...
예제 데이터는 Persian OCR용 `hezarai/parsynth-ocr-200k`이며, notebook code는 baseline에는 `train[:2000]`...
sample 하나에서는 baseline CER 23%에서 60-step LoRA 후 6%로 좋아지는 예시를 보여주고, Unsloth 문서는 200-sample Per...
저장 경로는 LoRA adapter local/Hub 저장과 merged 16bit export 중심이며, DeepSeek-OCR 자체 inference는 Trans...
OCR 문서는 개인정보·계약서·스캔 원본이 섞이기 쉬우므로 Colab/Hugging Face Hub 업로드, `trust_remote_code`, dataset li...

unslothai/notebooksSource

Free web calculator

Proprietary / Terms of Use

ApX Machine Learning의 APXML VRAM Calculator는 LLM 추론·파인튜닝에서 모델 크기, 양자화, KV 캐시, 컨텍스트 길이, 배치, 동시 사용자, GPU VRAM을 조합해 메모리와 대략적인 처...

설치형 앱이나 오픈소스 저장소가 아니라 브라우저에서 쓰는 ApX Machine Learning의 무료 웹 계산기이며, 조사 시점에 공개된 calculator sour...
Inference와 Fine-tuning 탭을 나누고, FP16/Q8/Q4 같은 모델 weight quantization과 KV cache quantization을...
모델 구조, layer/hidden dimension, active experts, attention 구조, batch size, sequence length, co...
Full fine-tuning, LoRA, QLoRA 쪽도 다루지만 공식 문구처럼 optimizer, parallelism, framework 구현에 따라 실제 필요...
결과는 하드웨어 구매·모델 후보 압축용 ballpark로 쓰고, 최종 배포 전에는 실제 런타임(Ollama, vLLM, llama.cpp, Transformers 등...

ApX Machine Learning / VRAM CalculatorSource

Open source notebook

LGPL-3.0

Unsloth의 Ministral 3 VL 3B Vision Colab은 Google Colab T4 환경에서 Ministral 3 3B Instruct VLM을 LaTeX OCR 데이터로 SFT/LoRA fine-tuni...

`unslothai/notebooks`의 `Ministral_3_VL_(3B)_Vision.ipynb`는 README의 Main Notebooks 표에서 Mistra...
노트북 metadata와 안내문은 Google Colab GPU, 특히 무료 Tesla T4 런타임을 기준으로 하며, repo 자체는 Jupyter Notebook...
`FastVisionModel.from_pretrained("unsloth/Ministral-3-3B-Instruct-2512")`로 3B Instruct VLM을...
예제 데이터는 `unsloth/LaTeX_OCR` train split이며, 이미지와 지시문을 multimodal chat message 형식으로 바꿔 `SFTTra...
학습 뒤에는 LoRA adapter 저장, merged 16bit export, GGUF q8_0/f16/q4_k_m 변환, Hugging Face Hub 업로드 경...
Colab/package/model version이 빠르게 바뀌는 실습 노트북이므로 재현 목적이면 notebook raw 파일과 모델/dataset revision을...

unslothai/notebooksSource

Open source demo app

MIT

patchy631/ai-engineering-hub의 finetune-studio-mcp-app은 Claude의 MCP App UI에서 Hugging Face 모델·데이터셋 선택, AutoTrain 학습 시작, Gradio...

Claude Connector에 붙는 MCP App widget으로 모델 선택, 데이터셋 선택, 하이퍼파라미터 설정, 학습 모니터링을 4단계 wizard로 묶는다.
실제 학습은 사용자의 Hugging Face 계정에 복제한 AutoTrain Advanced Space에서 돌고, 완료 후 fine-tuned model과 Gradi...
Manufact MCP Cloud 배포를 전제로 안내하지만, Node/TypeScript 서버를 로컬에서 `HF_TOKEN=... npm start`로 띄워 `htt...
`launch_studio`, `search_models`, `search_datasets`, `start_training`, `check_training_statu...
HF write token, GPU billing, 공개 inference Space 생성, 모델·데이터셋 라이선스가 얽히므로 장난감 예제처럼 보여도 권한과 비용 경...

patchy631/ai-engineering-hubSource