Open source notebook
LGPL-3.0Unsloth의 DeepSeek-OCR 3B Colab은 Google Colab GPU에서 DeepSeek-OCR을 불러와 Persian OCR 데이터로 baseline inference, LoRA fine-tuning,...
- `unslothai/notebooks`의 `Deepseek_OCR_(3B).ipynb`는 README의 OCR Notebooks 표에서 Deepseek OCR 3B...
- 노트북은 `unsloth/DeepSeek-OCR`을 `snapshot_download`로 내려받고 `FastVisionModel.from_pretrained(...,...
- 예제 데이터는 Persian OCR용 `hezarai/parsynth-ocr-200k`이며, notebook code는 baseline에는 `train[:2000]`...
- sample 하나에서는 baseline CER 23%에서 60-step LoRA 후 6%로 좋아지는 예시를 보여주고, Unsloth 문서는 200-sample Per...
- 저장 경로는 LoRA adapter local/Hub 저장과 merged 16bit export 중심이며, DeepSeek-OCR 자체 inference는 Trans...
- OCR 문서는 개인정보·계약서·스캔 원본이 섞이기 쉬우므로 Colab/Hugging Face Hub 업로드, `trust_remote_code`, dataset li...
Free web calculator
Proprietary / Terms of UseApX Machine Learning의 APXML VRAM Calculator는 LLM 추론·파인튜닝에서 모델 크기, 양자화, KV 캐시, 컨텍스트 길이, 배치, 동시 사용자, GPU VRAM을 조합해 메모리와 대략적인 처...
- 설치형 앱이나 오픈소스 저장소가 아니라 브라우저에서 쓰는 ApX Machine Learning의 무료 웹 계산기이며, 조사 시점에 공개된 calculator sour...
- Inference와 Fine-tuning 탭을 나누고, FP16/Q8/Q4 같은 모델 weight quantization과 KV cache quantization을...
- 모델 구조, layer/hidden dimension, active experts, attention 구조, batch size, sequence length, co...
- Full fine-tuning, LoRA, QLoRA 쪽도 다루지만 공식 문구처럼 optimizer, parallelism, framework 구현에 따라 실제 필요...
- 결과는 하드웨어 구매·모델 후보 압축용 ballpark로 쓰고, 최종 배포 전에는 실제 런타임(Ollama, vLLM, llama.cpp, Transformers 등...
Open source notebook
LGPL-3.0Unsloth의 Ministral 3 VL 3B Vision Colab은 Google Colab T4 환경에서 Ministral 3 3B Instruct VLM을 LaTeX OCR 데이터로 SFT/LoRA fine-tuni...
- `unslothai/notebooks`의 `Ministral_3_VL_(3B)_Vision.ipynb`는 README의 Main Notebooks 표에서 Mistra...
- 노트북 metadata와 안내문은 Google Colab GPU, 특히 무료 Tesla T4 런타임을 기준으로 하며, repo 자체는 Jupyter Notebook...
- `FastVisionModel.from_pretrained("unsloth/Ministral-3-3B-Instruct-2512")`로 3B Instruct VLM을...
- 예제 데이터는 `unsloth/LaTeX_OCR` train split이며, 이미지와 지시문을 multimodal chat message 형식으로 바꿔 `SFTTra...
- 학습 뒤에는 LoRA adapter 저장, merged 16bit export, GGUF q8_0/f16/q4_k_m 변환, Hugging Face Hub 업로드 경...
- Colab/package/model version이 빠르게 바뀌는 실습 노트북이므로 재현 목적이면 notebook raw 파일과 모델/dataset revision을...
patchy631/ai-engineering-hub의 finetune-studio-mcp-app은 Claude의 MCP App UI에서 Hugging Face 모델·데이터셋 선택, AutoTrain 학습 시작, Gradio...
- Claude Connector에 붙는 MCP App widget으로 모델 선택, 데이터셋 선택, 하이퍼파라미터 설정, 학습 모니터링을 4단계 wizard로 묶는다.
- 실제 학습은 사용자의 Hugging Face 계정에 복제한 AutoTrain Advanced Space에서 돌고, 완료 후 fine-tuned model과 Gradi...
- Manufact MCP Cloud 배포를 전제로 안내하지만, Node/TypeScript 서버를 로컬에서 `HF_TOKEN=... npm start`로 띄워 `htt...
- `launch_studio`, `search_models`, `search_datasets`, `start_training`, `check_training_statu...
- HF write token, GPU billing, 공개 inference Space 생성, 모델·데이터셋 라이선스가 얽히므로 장난감 예제처럼 보여도 권한과 비용 경...