GTA777 Meta telah secara resmi merilis rangkaian model AI terbaru mereka, yang disebut Chameleon. Model ini diklaim sebanding dengan alat komersial seperti Gemini Pro dan GPT-4V.

Menurut laporan dari Tom’s Guide, Chameleon tersedia dalam dua versi parameter: 7 miliar dan 34 miliar. Model ini memiliki kemampuan untuk memahami serta menghasilkan gambar dan teks. Selain itu, Chameleon dapat memproses kombinasi teks dan gambar yang saling terkait dan memberikan respons yang bermakna.

Sebagai contoh, pengguna dapat mengambil foto isi lemari es mereka dan menanyakan resep masakan yang dapat dibuat hanya dengan bahan-bahan yang tersedia. Ini merupakan fitur yang tidak dimiliki oleh model AI generasi sebelumnya seperti Llama, membawa open source lebih dekat dengan model visi utama yang dikembangkan oleh OpenAI dan Google.

Tim Fundamental AI Research (FAIR) di Meta telah merilis model ini untuk penelitian publik dengan beberapa batasan. Dalam makalah yang dipublikasikan, disebutkan bahwa arsitektur Chameleon sepenuhnya berbasis token, memungkinkan model ini untuk mempertimbangkan gambar dan teks secara bersamaan. Hal ini tidak mungkin dilakukan pada model yang menggunakan encoder terpisah untuk setiap masukan.

Tantangan teknis utama yang dihadapi oleh tim Meta termasuk stabilitas dan penskalaan pengoptimalan. Mereka mengatasi ini dengan menggunakan metode dan teknik pelatihan baru. Hasilnya, Chameleon mampu menangani perintah yang membutuhkan keluaran berupa teks dan gambar dengan lebih mudah.

Contoh aplikasi lainnya adalah pengguna dapat meminta Chameleon untuk membuat rencana perjalanan untuk melihat titik balik matahari musim panas, dan model AI ini akan memberikan gambar yang relevan untuk mendukung teks yang dihasilkannya.

Para peneliti mengklaim bahwa berdasarkan evaluasi manusia, Chameleon mampu menyamai atau melampaui kinerja model seperti Gemini Pro dan GPT-4V, terutama dalam perintah yang melibatkan campuran gambar dan teks. Namun, evaluasi untuk interpretasi infografis dan grafik belum disertakan.

Model yang dirilis secara publik oleh Meta hanya dapat menghasilkan keluaran teks dengan tingkat keamanan yang telah ditingkatkan. Namun, Armen Aghajanyan, salah satu peneliti yang bekerja pada proyek ini, mengungkapkan di X bahwa model mereka telah menyelesaikan pelatihan lima bulan lalu dan telah mencapai kemajuan signifikan sejak saat itu.

Baca: Cara Cepat Charger Laptop Dalam Satu Menit

Bagi para peneliti, Chameleon menawarkan cara alternatif untuk melatih dan merancang model AI. Bagi masyarakat umum, ini berarti kita semakin dekat dengan memiliki asisten AI yang lebih canggih dan dapat memahami konteks operasinya dengan lebih baik tanpa harus bergantung pada platform tertutup.

TINGGALKAN KOMENTAR

Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini