Phi-3.5: Trio Terbaru AI dari Microsoft
Eko Susilo Harjo August 27, 2024

Perkenalkan Phi-3.5, keluarga terbaru model AI dari Microsoft yang terdiri dari tiga model berbeda: Phi-3.5 Mini Instruct, Phi-3.5 MoE, dan Phi-3.5 Vision Instruct. Ketiga model ini menawarkan kemampuan yang mengesankan dalam berbagai tugas AI, dari memahami bahasa hingga menganalisis gambar.
Phi-3.5 Mini Instruct: Si Kecil yang Berkemampuan Besar
Phi-3.5 Mini Instruct adalah model AI berukuran kompak dengan 3.8 miliar parameter. Meskipun kecil, model ini mampu melakukan tugas-tugas yang kompleks seperti menghasilkan kode, menyelesaikan masalah matematika, dan melakukan penalaran berbasis logika.
Model ini dirancang untuk lingkungan dengan keterbatasan memori atau komputasi. Meskipun demikian, Phi-3.5 Mini Instruct menunjukkan kinerja yang kompetitif dalam tugas-tugas percakapan multibahasa dan multi-turn. Bahkan, model ini berhasil mengungguli model-model lain dengan ukuran yang sama, seperti Llama-3.1-8B-instruct dan Mistral-7B-instruct, dalam benchmark RepoQA yang mengukur pemahaman kode konteks panjang.
Phi-3.5 MoE: Kekuatan dalam Keberagaman
Phi-3.5 MoE (Mixture of Experts) adalah model AI yang unik karena menggabungkan beberapa jenis model berbeda menjadi satu. Model ini memiliki 42 miliar parameter aktif dan mendukung konteks hingga 128k token.
Phi-3.5 MoE dirancang untuk unggul dalam berbagai tugas penalaran, termasuk kode, matematika, dan pemahaman bahasa multibahasa. Model ini seringkali mengungguli model-model yang lebih besar dalam benchmark tertentu, seperti RepoQA. Bahkan, model ini mampu mengalahkan GPT-4o mini dalam benchmark MMLU (Massive Multitask Language Understanding) untuk berbagai subjek, seperti STEM, humaniora, dan ilmu sosial.
Arsitektur MoE yang unik memungkinkan model ini untuk tetap efisien sambil menangani tugas-tugas AI yang kompleks dalam berbagai bahasa.
Phi-3.5 Vision Instruct: Memahami Dunia Visual
Phi-3.5 Vision Instruct adalah model AI multimodal yang dapat memproses baik teks maupun gambar. Model ini sangat cocok untuk tugas-tugas seperti pemahaman gambar umum, pengenalan karakter optik (OCR), pemahaman grafik dan tabel, serta ringkasan video.
Seperti model-model lain dalam seri Phi-3.5, Vision Instruct mendukung konteks hingga 128k token, sehingga dapat menangani tugas-tugas visual yang kompleks dan multi-frame. Microsoft menekankan bahwa model ini dilatih dengan kombinasi dataset publik yang disaring dan sintetis, dengan fokus pada data berkualitas tinggi dan padat penalaran.
Pelatihan Model-Model Phi-3.5
Model-model Phi-3.5 dilatih dengan menggunakan sumber daya komputasi yang besar. Misalnya, Phi-3.5 Mini Instruct dilatih dengan menggunakan 512 GPU H100-80G selama 10 hari. Sementara itu, Phi-3.5 Vision Instruct dilatih dengan menggunakan 256 GPU A100-80G selama 6 hari.
Open-Source di Bawah Lisensi MIT
Ketiga model Phi-3.5 tersedia di bawah lisensi MIT, yang memungkinkan pengembang untuk menggunakan, memodifikasi, menggabungkan, menerbitkan, mendistribusikan, memberikan sublicensi, atau menjual salinan perangkat lunak secara bebas.
Dengan merilis seri Phi-3.5 sebagai open-source, Microsoft mendukung komunitas pengembang dan mendorong inovasi dalam bidang AI.
Fitur dan Kelebihan Phi-3.5 Mini Instruct
1. Parameter dan Arsitektur
Phi-3.5 Mini Instruct memiliki 3,8 miliar parameter, yang membuatnya menjadi model AI yang ringan dan efisien. Arsitektur model ini berbasis Transformer, yang merupakan teknologi yang sangat populer dalam bidang AI bahasa. Transformer ini memungkinkan model untuk memproses input secara paralel, sehingga meningkatkan kecepatan dan akurasi.
2. Konteks dan Data LatihModel ini mendukung konteks hingga 128K token, yang sangat besar untuk model AI ringan. Data latih yang digunakan mencakup berbagai sumber, termasuk dokumen publik yang telah di-filter untuk kualitas tinggi, data pendidikan yang berkualitas, repositori kode, dan data sintetis yang mirip dengan buku pelajaran. Selain itu, model ini juga dilatih dengan data percakapan yang berkualitas tinggi untuk meningkatkan kemampuan dalam mengikuti instruksi dan memahami preferensi manusia.
3. Pengoptimalan dan LatihanPhi-3.5 Mini Instruct telah mengalami proses pengoptimalan yang ketat, termasuk fine-tuning yang diawasi (Supervised Fine-tuning) dan optimasi preferensi langsung (Direct Preference Optimization). Proses ini bertujuan untuk meningkatkan kemampuan model dalam mengikuti instruksi dan memastikan keselamatan.
Aplikasi dan Penggunaan
1. Logika dan Matematika
Model ini sangat cocok untuk tugas-tugas yang memerlukan logika dan matematika, seperti pengenalan kode, pemecahan masalah matematika, dan logika berpikir. Performa model ini dalam tugas-tugas ini sangat kompetitif, bahkan dapat mengalahkan model yang lebih besar dalam beberapa benchmark, seperti RepoQA yang mengukur pemahaman konteks panjang dalam kode.2. Bahasa dan KomunikasiDengan kemampuan bahasa yang kuat, Phi-3.5 Mini Instruct dapat digunakan dalam berbagai aplikasi komunikasi, seperti chatbot yang dapat menjawab pertanyaan dan memberikan informasi yang relevan. Model ini juga dapat berinteraksi dalam bahasa-bahasa berbeda, meskipun performanya mungkin berbeda-beda tergantung pada bahasa yang digunakan.
Kelebihan dan Kekurangan
Kelebihan:
- Ringan dan Efisien: Model ini dirancang untuk lingkungan komputasi terbatas, sehingga sangat cocok untuk penggunaan di perangkat dengan sumber daya terbatas.
- Kemampuan Logika: Performa model dalam logika dan matematika sangat baik, membuatnya ideal untuk tugas-tugas yang memerlukan analisis dan pemecahan masalah.
- Bahasa Beragam: Model ini dapat berinteraksi dalam berbagai bahasa, meskipun performanya mungkin berbeda-beda.
Kekurangan:
- Keterbatasan Bahasa: Performa model dalam bahasa non-Inggris mungkin lebih rendah dibandingkan dengan bahasa Inggris.
- Keterbatasan Konteks Panjang: Meskipun model ini mendukung konteks hingga 128K token, performa dalam konteks yang sangat panjang mungkin menurun.
- Ketergantungan Data: Model ini sangat bergantung pada kualitas data latih, sehingga perlu perawatan yang ketat untuk memastikan akurasi tinggi.
Kesimpulan
Phi-3.5 adalah keluarga model AI yang menjanjikan dari Microsoft. Dengan kemampuan yang kuat dalam berbagai tugas AI, model-model ini dapat digunakan untuk berbagai aplikasi, dari pengembangan perangkat lunak hingga penelitian ilmiah.
Apakah Anda tertarik untuk mencoba model-model Phi-3.5? Jika demikian, Anda dapat mengaksesnya melalui platform open-source seperti Hugging Face.
Referensi
- Hugging Face – Phi-3.5 Mini Instruct: https://huggingface.co/microsoft/Phi-3.5-mini-instruct
- Hugging Face – Phi-3 Mini 128K Instruct: https://huggingface.co/microsoft/Phi-3-mini-128k-instruct
- AIbase – Microsoft Launches New Phi-3.5 Series AI Models: https://www.aibase.com/news/11175
- UnfoldAI – Microsoft’s Phi-3.5 Mini Overview: https://unfoldai.com/microsofts-phi-3-5-mini-overview/
- GitHub – Microsoft’s Phi-3 Family: https://github.com/microsoft/Phi-3CookBook/blob/main/md/01.Introduce/Phi3Family.md
- Microsoft Azure AI Studio – How to Use Phi-3 Family Chat Models: https://learn.microsoft.com/en-us/azure/ai-studio/how-to/deploy-models-phi-3
Discover more from teknologi now
Subscribe to get the latest posts sent to your email.