Homelab Murah 2026: Mini PC Bekas 2 Jutaan Bisa Jalanin LLM Lokal?
May 27, 2026 · 5 min read
Satu pertanyaan yang sering muncul sejak tools AI makin banyak: “Bisa gak sih jalanin LLM sendiri di rumah tanpa ngabisin tabungan?”
Jawaban pendek: bisa. Tapi ada tapinya.
Saya barusan riset buat setup homelab murah meriah, dan hasilnya cukup mengejutkan — dengan budget Rp 2-3 juta, Anda bisa punya server mini yang jalanin model AI lokal. Bukan buat gantiin Claude atau GPT-4, tapi buat task-task yang gak butuh SOTA reasoning.
Kenapa Homelab?
Beberapa alasan developer akhirnya bikin homelab:
- Privacy. Data Anda gak ninggalin rumah. Query database internal, kode proprietary, dokumen sensitif — semua diproses lokal.
- No rate limit. Gak ada “you’ve exceeded your quota.” Bebas eksperimen.
- Biaya fixed. Setelah beli hardware, gak ada recurring cost. Listrik doang.
- Eksperimen. Coba fine-tuning, model custom, RAG pipeline — tanpa takut bill bengkak.
- Always on. Agent bisa jalan 24/7 tanpa subscription.
Hardware: Yang Realistis di Budget 2-3 Jutaan
Saya riset 3 opsi second-hand yang bisa jalanin LLM kecil-menengah:
| Device | Harga Bekas | RAM | Storage | GPU | Kemampuan |
|---|---|---|---|---|---|
| Lenovo ThinkCentre M720q Tiny | Rp 2,0-2,5jt | 16-32GB | 256GB SSD | Intel UHD 630 | LLM 7B (CPU) |
| Dell OptiPlex 3060 Micro | Rp 2,0-2,5jt | 16-32GB | 256GB SSD | Intel UHD 630 | LLM 7B (CPU) |
| HP EliteDesk 800 G4 Mini | Rp 2,3-3,0jt | 16-32GB | 256GB SSD | Intel UHD 630 | LLM 7B (CPU) |
| Raspberry Pi 5 (8GB) | Rp 1,2-1,5jt | 8GB | 128GB microSD | None | Tiny LLM (1-3B) |
Ketiganya mini PC ukuran buku — kecil, hemat daya (15-35W idle), bisa nyala 24/7 tanpa bikin listrik jebol.
Kenapa CPU, bukan GPU? Karena GPU bekas yang usable buat LLM (RTX 3060 12GB ke atas) masih 4-6 juta. Budget kita gak nyampe. CPU inference cukup buat eksperimen.
Model Apa yang Bisa Jalan?
Dengan 16-32GB RAM (CPU inference), ini yang bisa Anda jalankan:
| Model | Size | RAM Butuh | Speed (token/detik) | Use Case |
|---|---|---|---|---|
| Llama 3.2 3B | 3B | 4-6GB | 15-25 t/s | Chat basic, summarization |
| Qwen 2.5 7B | 7B | 8-12GB | 8-12 t/s | General purpose, coding |
| Phi-3 Mini | 3.8B | 6-8GB | 12-18 t/s | Reasoning, math |
| DeepSeek Coder 6.7B | 6.7B | 8-12GB | 6-10 t/s | Coding assistant |
| Gemma 2 9B | 9B | 12-16GB | 5-8 t/s | General purpose |
Realitas: Gak bisa jalanin model 70B. Tapi 3B-9B dengan quantization (Q4, Q5) cukup buat:
- Agent task simpel (klasifikasi, ekstraksi, summarization)
- Coding assistant lokal (autocomplete, refactor kecil)
- RAG pipeline (dokumen Q&A)
- Eksperimen fine-tuning
Setup Praktis
Step 1: Install Ollama
curl -fsSL https://ollama.com/install.sh | sh
Step 2: Download Model
ollama pull llama3.2:3b # ~2GB, paling ringan
ollama pull qwen2.5:7b # ~4.5GB, general purpose
ollama pull deepseek-coder:6.7b # ~4GB, coding
Step 3: API Server
ollama serve # listen di localhost:11434
Step 4: Connect ke Tools
- Continue.dev / Cline: tambahin
http://localhost:11434sebagai provider - LangChain / LlamaIndex: pakai
Ollamaintegration - Hermes Agent: config provider ollama-cloud (atau direct API)
Use Case Real: Agent Lokal Buat ERP
Setelah setup homelab, ini yang bisa Anda lakukan:
1. Mini PC nyala 24/7 di pojok meja, konek ke network rumah
2. Ollama serve Llama 3.2 3B + Qwen 2.5 7B
3. Hermes Agent cron job → detect tiket → delegate ke Claude Code
4. Claude Code pake model Sonnet (cloud) buat fix utama
5. Homelab handle task-task ringan:
- Klasifikasi tiket: bug / feature / question
- Summarization: ringkasin daily activity
- RAG: jawab pertanyaan dari dokumentasi internal
Cloud model tetap buat reasoning berat. Lokal model buat task repetitif murah.
Keterbatasan (Jujur)
- Jangan ekspektasi Claude/GPT performance. Model 7B gak akan sebagus model cloud.
- Speed. CPU inference 5-15 token/detik. Buat streaming chat masih ok, buat batch processing lambat.
- Memory. 32GB max di mini PC. Model 13B+ gak bakal muat.
- No GPU upgrade path. Form factor mini PC gak bisa ditambah GPU eksternal.
- Listrik. 15-35W idle, tapi 100W+ pas full load. Sebulan ~Rp 50-80rb.
Worth It Gak?
Worth it kalau: Anda developer yang mau eksperimen, privacy-conscious, dan pengen agent lokal 24/7. Terutama buat RAG pipeline dan task sederhana.
Gak worth it kalau: Anda cuma mau AI assistant dan gak mau urusan hardware. Cloud tools gratis (Copilot, Windsurf free tier) lebih praktis.
Middle ground: Beli mini PC 2,5 jutaan + Ollama. Coba 2 minggu. Kalau gak cocok, jual lagi — harganya gak banyak turun.
Rekomendasi Saya
Kalau Anda udah punya tools cloud kayak Claude Code atau Windsurf, homelab itu komplemen, bukan pengganti. Cloud buat heavy lifting, lokal buat task repetitif murah.
Budget Rp 3 juta dapet server yang bisa jalan 24/7, handle RAG pipeline, klasifikasi tiket, dan summarization.
Tertarik? Mulai dari yang paling simpel: install Ollama di laptop Anda sekarang. Kalau suka, baru pertimbangkan dedicated mini PC.
Baca juga: “MCP — Protokol yang Bikin AI Agent Bisa Apa Saja” (published today) dan “AI Junior Developer” series di susiloharjo.web.id.
Discover more from teknologi now
Subscribe to get the latest posts sent to your email.