Homelab Murah 2026: Mini PC Bekas 2 Jutaan Bisa Jalanin LLM Lokal?

Homelab Murah 2026: Mini PC Bekas 2 Jutaan Bisa Jalanin LLM Lokal?

May 27, 2026 · 5 min read

Satu pertanyaan yang sering muncul sejak tools AI makin banyak: “Bisa gak sih jalanin LLM sendiri di rumah tanpa ngabisin tabungan?”

Jawaban pendek: bisa. Tapi ada tapinya.

Saya barusan riset buat setup homelab murah meriah, dan hasilnya cukup mengejutkan — dengan budget Rp 2-3 juta, Anda bisa punya server mini yang jalanin model AI lokal. Bukan buat gantiin Claude atau GPT-4, tapi buat task-task yang gak butuh SOTA reasoning.


Kenapa Homelab?

Beberapa alasan developer akhirnya bikin homelab:

  1. Privacy. Data Anda gak ninggalin rumah. Query database internal, kode proprietary, dokumen sensitif — semua diproses lokal.
  2. No rate limit. Gak ada “you’ve exceeded your quota.” Bebas eksperimen.
  3. Biaya fixed. Setelah beli hardware, gak ada recurring cost. Listrik doang.
  4. Eksperimen. Coba fine-tuning, model custom, RAG pipeline — tanpa takut bill bengkak.
  5. Always on. Agent bisa jalan 24/7 tanpa subscription.

Hardware: Yang Realistis di Budget 2-3 Jutaan

Saya riset 3 opsi second-hand yang bisa jalanin LLM kecil-menengah:

Device Harga Bekas RAM Storage GPU Kemampuan
Lenovo ThinkCentre M720q Tiny Rp 2,0-2,5jt 16-32GB 256GB SSD Intel UHD 630 LLM 7B (CPU)
Dell OptiPlex 3060 Micro Rp 2,0-2,5jt 16-32GB 256GB SSD Intel UHD 630 LLM 7B (CPU)
HP EliteDesk 800 G4 Mini Rp 2,3-3,0jt 16-32GB 256GB SSD Intel UHD 630 LLM 7B (CPU)
Raspberry Pi 5 (8GB) Rp 1,2-1,5jt 8GB 128GB microSD None Tiny LLM (1-3B)

Ketiganya mini PC ukuran buku — kecil, hemat daya (15-35W idle), bisa nyala 24/7 tanpa bikin listrik jebol.

Kenapa CPU, bukan GPU? Karena GPU bekas yang usable buat LLM (RTX 3060 12GB ke atas) masih 4-6 juta. Budget kita gak nyampe. CPU inference cukup buat eksperimen.


Model Apa yang Bisa Jalan?

Dengan 16-32GB RAM (CPU inference), ini yang bisa Anda jalankan:

Model Size RAM Butuh Speed (token/detik) Use Case
Llama 3.2 3B 3B 4-6GB 15-25 t/s Chat basic, summarization
Qwen 2.5 7B 7B 8-12GB 8-12 t/s General purpose, coding
Phi-3 Mini 3.8B 6-8GB 12-18 t/s Reasoning, math
DeepSeek Coder 6.7B 6.7B 8-12GB 6-10 t/s Coding assistant
Gemma 2 9B 9B 12-16GB 5-8 t/s General purpose

Realitas: Gak bisa jalanin model 70B. Tapi 3B-9B dengan quantization (Q4, Q5) cukup buat:

  • Agent task simpel (klasifikasi, ekstraksi, summarization)
  • Coding assistant lokal (autocomplete, refactor kecil)
  • RAG pipeline (dokumen Q&A)
  • Eksperimen fine-tuning

Setup Praktis

Step 1: Install Ollama


curl -fsSL https://ollama.com/install.sh | sh

Step 2: Download Model


ollama pull llama3.2:3b        # ~2GB, paling ringan
ollama pull qwen2.5:7b         # ~4.5GB, general purpose
ollama pull deepseek-coder:6.7b # ~4GB, coding

Step 3: API Server


ollama serve  # listen di localhost:11434

Step 4: Connect ke Tools

  • Continue.dev / Cline: tambahin http://localhost:11434 sebagai provider
  • LangChain / LlamaIndex: pakai Ollama integration
  • Hermes Agent: config provider ollama-cloud (atau direct API)

Use Case Real: Agent Lokal Buat ERP

Setelah setup homelab, ini yang bisa Anda lakukan:


1. Mini PC nyala 24/7 di pojok meja, konek ke network rumah
2. Ollama serve Llama 3.2 3B + Qwen 2.5 7B
3. Hermes Agent cron job → detect tiket → delegate ke Claude Code
4. Claude Code pake model Sonnet (cloud) buat fix utama
5. Homelab handle task-task ringan:
   - Klasifikasi tiket: bug / feature / question
   - Summarization: ringkasin daily activity
   - RAG: jawab pertanyaan dari dokumentasi internal

Cloud model tetap buat reasoning berat. Lokal model buat task repetitif murah.


Keterbatasan (Jujur)

  • Jangan ekspektasi Claude/GPT performance. Model 7B gak akan sebagus model cloud.
  • Speed. CPU inference 5-15 token/detik. Buat streaming chat masih ok, buat batch processing lambat.
  • Memory. 32GB max di mini PC. Model 13B+ gak bakal muat.
  • No GPU upgrade path. Form factor mini PC gak bisa ditambah GPU eksternal.
  • Listrik. 15-35W idle, tapi 100W+ pas full load. Sebulan ~Rp 50-80rb.

Worth It Gak?

Worth it kalau: Anda developer yang mau eksperimen, privacy-conscious, dan pengen agent lokal 24/7. Terutama buat RAG pipeline dan task sederhana.

Gak worth it kalau: Anda cuma mau AI assistant dan gak mau urusan hardware. Cloud tools gratis (Copilot, Windsurf free tier) lebih praktis.

Middle ground: Beli mini PC 2,5 jutaan + Ollama. Coba 2 minggu. Kalau gak cocok, jual lagi — harganya gak banyak turun.


Rekomendasi Saya

Kalau Anda udah punya tools cloud kayak Claude Code atau Windsurf, homelab itu komplemen, bukan pengganti. Cloud buat heavy lifting, lokal buat task repetitif murah.

Budget Rp 3 juta dapet server yang bisa jalan 24/7, handle RAG pipeline, klasifikasi tiket, dan summarization.

Tertarik? Mulai dari yang paling simpel: install Ollama di laptop Anda sekarang. Kalau suka, baru pertimbangkan dedicated mini PC.


Baca juga: “MCP — Protokol yang Bikin AI Agent Bisa Apa Saja” (published today) dan “AI Junior Developer” series di susiloharjo.web.id.


Discover more from teknologi now

Subscribe to get the latest posts sent to your email.

Leave a Comment

Discover more from teknologi now

Subscribe now to keep reading and get access to the full archive.

Continue reading