Apache-2.0
Lucebox Hub는 특정 소비자 GPU에 맞춰 손으로 튜닝한 로컬 LLM 추론 실험...
Luce-Org/lucebox-hub는 RTX 3090/5090 같은 NVIDIA CUDA GPU와 Ryzen AI MAX+ 395 HIP 경로까지 겨냥해 Megakernel, DFlash, PFlash로 로컬 LLM 추론...
- Megakernel, DFlash, PFlash 세 프로젝트를 한 저장소에 묶어 RTX 3090/5090/GB10/Jetson Thor 같은 CUDA GPU와 Ryz...
- 공식 배포 패키지나 Release가 아니라 source build 중심이며, DFlash는 `git clone --recurse-submodules`, CUDA 12...
- Megakernel은 Qwen 3.5-0.8B 전체 forward를 단일 CUDA dispatch로 묶고, DFlash/PFlash는 27B GGUF target의...
- RTX 5090에서는 Qwen 3.6-27B DFlash+DDTree가 205 tok/s, AMD Strix Halo HIP path에서는 Qwen 3.5-27B가...
- Apache-2.0 top-level LICENSE가 확인되지만, 하위 bench harness metadata와 외부 submodule/모델 weight 라이선스는...
- Linux/CUDA 개발자가 가장 자연스러운 대상이고, Windows는 community benchmark 신호가 있으며, macOS Metal이나 범용 하드웨어 지...
Luce-Org/lucebox-hubSource