Phi-3.5: Trio Terbaru AI dari Microsoft

AI

Perkenalkan Phi-3.5, keluarga terbaru model AI dari Microsoft yang terdiri dari tiga model berbeda: Phi-3.5 Mini Instruct, Phi-3.5 MoE, dan Phi-3.5 Vision Instruct. Ketiga model ini menawarkan kemampuan yang mengesankan dalam berbagai tugas AI, dari memahami bahasa hingga menganalisis gambar.

Phi-3.5 Mini Instruct: Si Kecil yang Berkemampuan Besar

Phi-3.5 Mini Instruct adalah model AI berukuran kompak dengan 3.8 miliar parameter. Meskipun kecil, model ini mampu melakukan tugas-tugas yang kompleks seperti menghasilkan kode, menyelesaikan masalah matematika, dan melakukan penalaran berbasis logika.

Model ini dirancang untuk lingkungan dengan keterbatasan memori atau komputasi. Meskipun demikian, Phi-3.5 Mini Instruct menunjukkan kinerja yang kompetitif dalam tugas-tugas percakapan multibahasa dan multi-turn. Bahkan, model ini berhasil mengungguli model-model lain dengan ukuran yang sama, seperti Llama-3.1-8B-instruct dan Mistral-7B-instruct, dalam benchmark RepoQA yang mengukur pemahaman kode konteks panjang.

Phi-3.5 MoE: Kekuatan dalam Keberagaman

Phi-3.5 MoE (Mixture of Experts) adalah model AI yang unik karena menggabungkan beberapa jenis model berbeda menjadi satu. Model ini memiliki 42 miliar parameter aktif dan mendukung konteks hingga 128k token.

Phi-3.5 MoE dirancang untuk unggul dalam berbagai tugas penalaran, termasuk kode, matematika, dan pemahaman bahasa multibahasa. Model ini seringkali mengungguli model-model yang lebih besar dalam benchmark tertentu, seperti RepoQA. Bahkan, model ini mampu mengalahkan GPT-4o mini dalam benchmark MMLU (Massive Multitask Language Understanding) untuk berbagai subjek, seperti STEM, humaniora, dan ilmu sosial.

Arsitektur MoE yang unik memungkinkan model ini untuk tetap efisien sambil menangani tugas-tugas AI yang kompleks dalam berbagai bahasa.

Phi-3.5 Vision Instruct: Memahami Dunia Visual

Phi-3.5 Vision Instruct adalah model AI multimodal yang dapat memproses baik teks maupun gambar. Model ini sangat cocok untuk tugas-tugas seperti pemahaman gambar umum, pengenalan karakter optik (OCR), pemahaman grafik dan tabel, serta ringkasan video.

Seperti model-model lain dalam seri Phi-3.5, Vision Instruct mendukung konteks hingga 128k token, sehingga dapat menangani tugas-tugas visual yang kompleks dan multi-frame. Microsoft menekankan bahwa model ini dilatih dengan kombinasi dataset publik yang disaring dan sintetis, dengan fokus pada data berkualitas tinggi dan padat penalaran.

Pelatihan Model-Model Phi-3.5

Model-model Phi-3.5 dilatih dengan menggunakan sumber daya komputasi yang besar. Misalnya, Phi-3.5 Mini Instruct dilatih dengan menggunakan 512 GPU H100-80G selama 10 hari. Sementara itu, Phi-3.5 Vision Instruct dilatih dengan menggunakan 256 GPU A100-80G selama 6 hari.

Open-Source di Bawah Lisensi MIT

Ketiga model Phi-3.5 tersedia di bawah lisensi MIT, yang memungkinkan pengembang untuk menggunakan, memodifikasi, menggabungkan, menerbitkan, mendistribusikan, memberikan sublicensi, atau menjual salinan perangkat lunak secara bebas.

Dengan merilis seri Phi-3.5 sebagai open-source, Microsoft mendukung komunitas pengembang dan mendorong inovasi dalam bidang AI.

Fitur dan Kelebihan Phi-3.5 Mini Instruct

1. Parameter dan Arsitektur

Phi-3.5 Mini Instruct memiliki 3,8 miliar parameter, yang membuatnya menjadi model AI yang ringan dan efisien. Arsitektur model ini berbasis Transformer, yang merupakan teknologi yang sangat populer dalam bidang AI bahasa. Transformer ini memungkinkan model untuk memproses input secara paralel, sehingga meningkatkan kecepatan dan akurasi.

2. Konteks dan Data LatihModel ini mendukung konteks hingga 128K token, yang sangat besar untuk model AI ringan. Data latih yang digunakan mencakup berbagai sumber, termasuk dokumen publik yang telah di-filter untuk kualitas tinggi, data pendidikan yang berkualitas, repositori kode, dan data sintetis yang mirip dengan buku pelajaran. Selain itu, model ini juga dilatih dengan data percakapan yang berkualitas tinggi untuk meningkatkan kemampuan dalam mengikuti instruksi dan memahami preferensi manusia.

3. Pengoptimalan dan LatihanPhi-3.5 Mini Instruct telah mengalami proses pengoptimalan yang ketat, termasuk fine-tuning yang diawasi (Supervised Fine-tuning) dan optimasi preferensi langsung (Direct Preference Optimization). Proses ini bertujuan untuk meningkatkan kemampuan model dalam mengikuti instruksi dan memastikan keselamatan.

Aplikasi dan Penggunaan

1. Logika dan Matematika

Model ini sangat cocok untuk tugas-tugas yang memerlukan logika dan matematika, seperti pengenalan kode, pemecahan masalah matematika, dan logika berpikir. Performa model ini dalam tugas-tugas ini sangat kompetitif, bahkan dapat mengalahkan model yang lebih besar dalam beberapa benchmark, seperti RepoQA yang mengukur pemahaman konteks panjang dalam kode.2. Bahasa dan KomunikasiDengan kemampuan bahasa yang kuat, Phi-3.5 Mini Instruct dapat digunakan dalam berbagai aplikasi komunikasi, seperti chatbot yang dapat menjawab pertanyaan dan memberikan informasi yang relevan. Model ini juga dapat berinteraksi dalam bahasa-bahasa berbeda, meskipun performanya mungkin berbeda-beda tergantung pada bahasa yang digunakan.

Kelebihan dan Kekurangan

Kelebihan:

  • Ringan dan Efisien: Model ini dirancang untuk lingkungan komputasi terbatas, sehingga sangat cocok untuk penggunaan di perangkat dengan sumber daya terbatas.
  • Kemampuan Logika: Performa model dalam logika dan matematika sangat baik, membuatnya ideal untuk tugas-tugas yang memerlukan analisis dan pemecahan masalah.
  • Bahasa Beragam: Model ini dapat berinteraksi dalam berbagai bahasa, meskipun performanya mungkin berbeda-beda.

Kekurangan:

  • Keterbatasan Bahasa: Performa model dalam bahasa non-Inggris mungkin lebih rendah dibandingkan dengan bahasa Inggris.
  • Keterbatasan Konteks Panjang: Meskipun model ini mendukung konteks hingga 128K token, performa dalam konteks yang sangat panjang mungkin menurun.
  • Ketergantungan Data: Model ini sangat bergantung pada kualitas data latih, sehingga perlu perawatan yang ketat untuk memastikan akurasi tinggi.

Kesimpulan

Phi-3.5 adalah keluarga model AI yang menjanjikan dari Microsoft. Dengan kemampuan yang kuat dalam berbagai tugas AI, model-model ini dapat digunakan untuk berbagai aplikasi, dari pengembangan perangkat lunak hingga penelitian ilmiah.

Apakah Anda tertarik untuk mencoba model-model Phi-3.5? Jika demikian, Anda dapat mengaksesnya melalui platform open-source seperti Hugging Face.

Referensi

  1. Hugging Face – Phi-3.5 Mini Instruct: https://huggingface.co/microsoft/Phi-3.5-mini-instruct
  2. Hugging Face – Phi-3 Mini 128K Instruct: https://huggingface.co/microsoft/Phi-3-mini-128k-instruct
  3. AIbase – Microsoft Launches New Phi-3.5 Series AI Models: https://www.aibase.com/news/11175
  4. UnfoldAI – Microsoft’s Phi-3.5 Mini Overview: https://unfoldai.com/microsofts-phi-3-5-mini-overview/
  5. GitHub – Microsoft’s Phi-3 Family: https://github.com/microsoft/Phi-3CookBook/blob/main/md/01.Introduce/Phi3Family.md
  6. Microsoft Azure AI Studio – How to Use Phi-3 Family Chat Models: https://learn.microsoft.com/en-us/azure/ai-studio/how-to/deploy-models-phi-3


Discover more from teknologi now

Subscribe to get the latest posts sent to your email.

Related Posts

AI Monitoring Karyawan 2026: 7 Tools Boss Pakai + Cara Proteksi

AI Monitoring Karyawan 2026: 7 Tools Boss Pakai + Cara Proteksi AI monitoring karyawan 2026 bukan lagi fiksi ilmiah. Dengan Zoom yang baru saja bermitra dengan World…

HP Lipat 2026: iPhone Fold vs Samsung – Mana Worth It?

HP Lipat 2026: iPhone Fold vs Samsung – Mana Worth It? HP lipat 2026 menjadi salah satu kategori smartphone paling dinanti tahun ini. Dengan iPhone Fold yang…

Zoom AI Verifikasi 2026: Teknologi Anti-Bot untuk WFH

Zoom AI Verifikasi 2026: Teknologi Anti-Bot untuk WFH Zoom AI verifikasi 2026 menjadi breakthrough terbesar dalam dunia meeting virtual tahun ini. Zoom resmi mengumumkan kolaborasi dengan World…

Skandal Startup 2026: Drama Funding Guncang Dunia Tech

Skandal Startup 2026: Drama Funding Guncang Dunia Tech Skandal startup 2026 menjadi sorotan utama setelah bocoran dokumen funding mengungkap praktik manipulatif yang dilakukan sejumlah unicorn teknologi. TechCrunch…

Teknologi adhesive geCKo Materials untuk aplikasi luar angkasa

Startup Ini Dipakai Astronot ISS – Worth It Atau Tidak?

Startup Ini Dipakai Astronot ISS – Worth It Atau Tidak? Pernahkah kamu membayangkan teknologi yang dikembangkan di garasi startup bisa berakhir di Stasiun Luar Angkasa Internasional (ISS)?…

Drama Startup Tech: Skandal Funding yang Wajib Diketahui 2026

Drama Startup Tech: Skandal Funding yang Wajib Diketahui 2026 Industri teknologi tidak selalu berjalan mulus. Di balik headline tentang drama startup yang meraih pendanaan ratusan juta dolar,…

Leave a Reply

Your email address will not be published. Required fields are marked *

Discover more from teknologi now

Subscribe now to keep reading and get access to the full archive.

Continue reading