OpenAI memperkenalkan GPT-4o (Omni), model flagship terbaru yang dirancang untuk menghadirkan interaksi manusia-komputer yang lebih natural di San Francisco. Chief Technology Officer OpenAI, Mira Murati, menjelaskan bahwa model ini mampu memproses kombinasi teks, audio, dan gambar secara bersamaan dalam satu jaringan saraf. Teknologi ini diklaim memiliki kecepatan respons rata-rata 320 milidetik, yang setara dengan kecepatan reaksi manusia dalam percakapan normal.

Keunggulan utama GPT-4o terletak pada kemampuan multimodal secara native, yang memungkinkan AI memahami nada suara dan emosi pengguna secara langsung. Peneliti OpenAI mendemonstrasikan bagaimana chatbot ini dapat menerjemahkan bahasa secara real-time, membantu menyelesaikan soal matematika melalui kamera, hingga memberikan bantuan teknis secara visual. CEO OpenAI, Sam Altman, menyatakan bahwa pencapaian ini membuat interaksi dengan komputer terasa jauh lebih intuitif dibandingkan teknologi sebelumnya.

Berbeda dengan kebijakan sebelumnya, OpenAI memberikan akses GPT-4o kepada pengguna gratis dengan batasan jumlah pesan tertentu. Pengguna berlangganan kategori Plus, Team, dan Enterprise akan mendapatkan kapasitas pesan hingga lima kali lipat lebih banyak serta prioritas akses ke fitur-fitur terbaru. Selain itu, perusahaan juga meluncurkan aplikasi desktop khusus untuk macOS guna mendukung integrasi kecerdasan buatan dalam produktivitas harian pengguna secara lebih mendalam.

Di tingkat lokal, perkembangan AI ini beriringan dengan penguatan dukungan bahasa pada perangkat pintar di Indonesia. Head of AI Samsung R&D Institute Indonesia (SRIN), Junaidillah Fadlil, mengungkapkan bahwa pihaknya terus menggali keunikan linguistik lokal untuk mengoptimalkan fitur seperti Live Translate dan Note Assist. Integrasi data berkualitas menjadi kunci utama agar teknologi AI global dapat relevan dan akurat saat digunakan oleh masyarakat di Tanah Air.