Meta Platforms pada hari Kamis merilis versi awal model bahasa besar terbarunya, Llama 3, dan generator gambar yang memperbarui gambar secara real-time saat pengguna mengetik perintah, saat ia berlomba untuk mengejar pemimpin pasar AI generatif OpenAI.
Model-model tersebut akan diintegrasikan ke dalam asisten virtualnya, Meta AI, yang oleh perusahaan disebut-sebut sebagai yang tercanggih di antara model-model yang dapat digunakan secara gratis, mengutip perbandingan kinerja pada subjek-subjek seperti penalaran, pengkodean, dan penulisan kreatif terhadap penawaran dari para pesaingnya termasuk Google Alphabet dan Startup Perancis, Mistral AI.
Asisten Meta AI yang diperbarui akan diberikan penagihan yang lebih menonjol dalam aplikasi Meta Facebook, Instagram, WhatsApp dan Messenger serta situs web mandiri baru yang memposisikannya untuk bersaing lebih langsung dengan terobosan OpenAI yang didukung Microsoft, ChatGPT.
Halaman arahan yang menyambut pengunjung di situs tersebut mendorong mereka untuk mencoba meminta asistennya membuat daftar pengepakan liburan, memutar musik trivia tahun 1990-an bersama mereka, memberikan bantuan pekerjaan rumah, dan melukis gambar cakrawala Kota New York.
Meta telah berusaha keras untuk memperkenalkan produk-produk AI generatif kepada miliaran penggunanya untuk menantang posisi terdepan OpenAI dalam teknologi, yang melibatkan perombakan infrastruktur komputasi yang mahal dan konsolidasi tim penelitian dan produk yang sebelumnya berbeda.
Raksasa media sosial ini telah secara terbuka merilis model Llama untuk digunakan oleh pengembang yang membuat aplikasi AI sebagai bagian dari upaya mengejar ketinggalan, karena opsi gratis yang kuat dapat menghalangi rencana pesaing untuk memperoleh pendapatan dari teknologi milik mereka. Strategi ini telah menimbulkan kekhawatiran akan keselamatan dari para kritikus yang khawatir akan apa yang mungkin dilakukan oleh pihak-pihak yang tidak bermoral dalam membangun model tersebut.
Meta melengkapi Llama 3 dengan kemampuan pengkodean komputer baru dan memasukkannya gambar serta teks dalam pelatihan kali ini, meskipun untuk saat ini model hanya akan menghasilkan teks, kata Chief Product Officer Meta Chris Cox dalam sebuah wawancara.
Penalaran yang lebih maju, seperti kemampuan untuk menyusun rencana multi-langkah yang lebih panjang, akan menyusul di versi berikutnya, tambahnya. Versi yang direncanakan untuk dirilis dalam beberapa bulan mendatang juga akan mampu “multimodalitas,” yang berarti mereka dapat menghasilkan teks dan gambar, kata Meta dalam postingan blognya.
“Tujuannya pada akhirnya adalah membantu meringankan beban Anda, hanya membantu membuat hidup Anda lebih mudah, baik itu berinteraksi dengan bisnis, menulis sesuatu, atau merencanakan perjalanan,” kata Cox.
Cox mengatakan penyertaan gambar dalam pelatihan Llama 3 akan meningkatkan pembaruan yang diluncurkan tahun ini pada kacamata pintar Ray-Ban Meta, produk yang dibuat dengan pembuat kacamata Essilor Luxoticca, memungkinkan Meta AI untuk mengidentifikasi objek yang dilihat oleh pemakainya dan menjawab. pertanyaan tentang mereka.
Saham meta ditutup naik 1,5% pada hari Kamis.
Meta juga mengumumkan kemitraan dengan Google untuk memasukkan hasil pencarian real-time dalam tanggapan asisten, melengkapi pengaturan yang sudah ada dengan mesin pencari Bing Microsoft.
Asisten Meta AI berkembang ke lebih dari selusin pasar di luar Amerika Serikat dengan pembaruan ini, termasuk Australia, Kanada, Singapura, Nigeria, dan Pakistan. Meta “masih mencari cara yang tepat untuk melakukan hal ini di Eropa,” kata Cox, di mana peraturan privasi lebih ketat dan Undang-Undang AI yang akan datang siap untuk memberlakukan persyaratan seperti pengungkapan data pelatihan model.
Kebutuhan besar model AI generatif akan data telah muncul sebagai sumber utama ketegangan dalam pengembangan teknologi.
CEO Meta Mark Zuckerberg mengangguk pada persaingan dengan OpenAI dalam sebuah video yang menyertai pengumuman tersebut, di mana ia menyebut Meta AI sebagai “asisten AI paling cerdas yang dapat Anda gunakan secara bebas.”
Zuckerberg mengatakan dua versi lebih kecil dari Llama 3 yang diluncurkan sekarang, dengan 8 miliar parameter dan 70 miliar parameter, mendapat skor yang baik dibandingkan model gratis lainnya pada tolok ukur kinerja yang biasa digunakan untuk menilai kualitas model. Versi terbesar dari Llama 3 masih dalam tahap pelatihan, dengan 400 miliar parameter, katanya.
Hasil tersebut “tidak diragukan lagi mengesankan,” namun juga menunjukkan kesenjangan kinerja yang semakin besar antara model gratis dan model berpemilik, kata Nathan Benaich, pendiri perusahaan ventura yang berfokus pada AI, Air Street Capital.
Pengembang mengeluh bahwa model versi Llama 2 sebelumnya gagal memahami konteks dasar, sehingga membingungkan pertanyaan tentang cara “mematikan” program komputer dengan permintaan instruksi untuk melakukan pembunuhan. Saingannya, Google, juga mengalami masalah serupa dan baru-baru ini menghentikan penggunaan alat pembuat gambar Gemini AI setelah mendapat kritik karena menghasilkan penggambaran tokoh sejarah yang tidak akurat.
Meta mengatakan pihaknya mengurangi masalah tersebut di Llama 3 dengan menggunakan “data berkualitas tinggi” agar model dapat mengenali nuansa. Mereka tidak merinci kumpulan data yang digunakan, meskipun dikatakan bahwa mereka memasukkan data tujuh kali lebih banyak ke dalam Llama 3 dibandingkan yang digunakan untuk Llama 2.