OpenAI meluncurkan GPT-4o, model bahasa canggih dengan kemampuan omni-modal. Fitur baru termasuk peningkatan kecepatan, pengurangan biaya, dan dukungan multibahasa. ChatGPT ditingkatkan dengan kemampuan suara, visi, emosional, dan multibahasa. GPT-4o menjanjikan revolusi dalam interaksi AI, mengubah cara pengguna berinteraksi dengan teknologi.
OpenAI, perusahaan di balik ChatGPT yang populer, telah mengumumkan peluncuran model bahasa barunya, GPT-4o. “o” dalam GPT-4o berarti “omni,” yang menandakan kemampuan model untuk menangani teks, suara, dan video. Model baru ini merupakan peningkatan dari pendahulunya, GPT-4 Turbo, yang menawarkan kemampuan yang ditingkatkan, pemrosesan yang lebih cepat, dan penghematan biaya bagi pengguna.
Fitur dan Ketersediaan GPT-4o
GPT-4o akan menggerakkan chatbot ChatGPT dan API OpenAI, memungkinkan pengembang memanfaatkan kemampuan model. Model baru ini tersedia untuk pengguna gratis dan berbayar, dengan beberapa fitur diluncurkan segera dan lainnya dalam beberapa minggu ke depan.
Model baru ini membawa peningkatan signifikan dalam kecepatan pemrosesan, pengurangan biaya 50%, peningkatan batas penggunaan lima kali lipat, dan dukungan untuk lebih dari 50 bahasa. OpenAI berencana secara bertahap meluncurkan model baru ini ke pengguna ChatGPT Plus dan Team, dengan ketersediaan enterprise “segera hadir.” Perusahaan juga mulai meluncurkan model baru ini ke pengguna ChatGPT Gratis, meskipun dengan batasan penggunaan, pada hari Senin.
Peningkatan Kemampuan ChatGPT
GPT-4o sangat meningkatkan pengalaman di chatbot berbasis AI OpenAI, ChatGPT. Platform ini lama menawarkan mode suara yang mentranskripsi respons chatbot menggunakan model teks-ke-ucapan, tetapi GPT-4o memperkuat ini, memungkinkan pengguna berinteraksi dengan ChatGPT lebih seperti asisten. Model ini memberikan responsivitas “real-time” dan bahkan dapat menangkap nuansa dalam suara pengguna, dalam merespons menghasilkan suara dalam “berbagai gaya emosional yang berbeda” (termasuk bernyanyi).
GPT-4o juga meningkatkan kemampuan visi ChatGPT. Diberikan foto – atau layar desktop – ChatGPT sekarang dapat dengan cepat menjawab pertanyaan terkait, mulai dari “Apa yang terjadi pada kode perangkat lunak ini?” hingga “Merek baju apa yang dikenakan orang ini?”. Fitur-fitur ini akan terus berkembang di masa depan, dengan model potensial memungkinkan ChatGPT, misalnya, “menonton” pertandingan olahraga langsung dan menjelaskan aturannya. GPT-4o juga lebih multilingual, dengan peningkatan kinerja di sekitar 50 bahasa. Dan di API OpenAI dan Microsoft Azure OpenAI Service, GPT-4o dua kali lebih cepat, setengah harga dan memiliki batas tingkat yang lebih tinggi daripada GPT-4 Turbo.
Kemampuan Emosional dan Multilingual
Selama demonstrasi, GPT-4o menunjukkan bahwa ia dapat memahami emosi pengguna dengan mendengarkan napas mereka. Ketika ia menyadari pengguna sedang stres, ia menawarkan saran untuk membantu mereka rileks. Model ini juga menunjukkan bahwa ia dapat bercakap-cakap dalam beberapa bahasa, menerjemahkan dan menjawab pertanyaan secara otomatis.
Dampak dan Masa Depan
Pengumuman OpenAI menunjukkan betapa cepatnya dunia AI berkembang. Perbaikan dalam model dan kecepatan di mana mereka bekerja, bersama dengan kemampuan untuk menyatukan kemampuan multi-modal menjadi satu antarmuka omni-modal, akan mengubah cara orang berinteraksi dengan alat-alat ini.