Google baru saja meluncurkan Gemini Omni, model AI terbaru yang diperkenalkan dalam perhelatan Google I/O 2026 di Mountain View, California, pada Selasa (19/5/2026). Inovasi ini dirancang sebagai model “any-to-any” yang sangat fleksibel, di mana pengguna dapat memasukkan berbagai jenis input—seperti teks, gambar, audio, hingga video—untuk kemudian diproses menjadi konten baru yang komprehensif. Gemini Omni merupakan evolusi dari model Google Veo, yang kini membawa kemampuan multimodal tersebut lebih jauh ke dalam ranah pengeditan dan pembuatan video berbasis kecerdasan buatan hanya dengan memanfaatkan perintah teks.
Gemini Omni hadir dengan inovasi utama berupa kemampuan penyuntingan video yang sangat intuitif melalui percakapan alami. Pengguna hanya perlu memberikan instruksi menggunakan bahasa sehari-hari, dan sistem akan langsung memproses penyesuaian video sesuai keinginan.

Dalam blog resminya, Google menegaskan bahwa Gemini Omni mampu mengintegrasikan berbagai jenis input—mulai dari teks, audio, hingga gambar—untuk menghasilkan video berkualitas tinggi yang kaya akan konteks dunia nyata. Salah satu keunggulan teknisnya adalah kemampuan memori sistem yang mampu mengingat setiap instruksi. Hal ini memastikan bahwa elemen penting seperti karakter, objek, maupun atmosfer video tetap terjaga konsistensinya meskipun dilakukan perubahan berulang kali. Kreator kini memiliki keleluasaan penuh untuk mengubah detail video, mulai dari mengganti material objek, menambahkan tokoh baru, hingga merombak suasana secara drastis cukup dengan perintah teks yang sederhana.
Gemini Omni Hadir dengan Simulasi Fisika yang Lebih Akurat
Salah satu terobosan utama Gemini Omni adalah kemampuannya dalam memahami hukum fisika dunia nyata. Model AI ini jauh lebih mahir dalam mensimulasikan pergerakan objek, mulai dari efek gravitasi hingga perilaku dinamis cairan dan gas, sehingga hasil visualnya terlihat sangat realistis.
Selain aspek fisika, Omni juga mengintegrasikan data sains dan pengetahuan umum untuk memastikan setiap video yang dibuat tetap masuk akal secara konteks. Pengguna kini dapat memanfaatkan fitur ini untuk membuat video penjelasan konsep sulit hanya dengan memberikan prompt teks sederhana, menjadikannya alat bantu visual yang sangat efektif untuk kebutuhan edukatif.
Hadirkan Fitur Avatar, Google Perketat Keamanan Video AI
Google kini memperkenalkan fitur Avatars pada Gemini Omni, yang memungkinkan pengguna membuat klon digital menggunakan wajah dan suara mereka sendiri untuk kebutuhan produksi video.
Guna meminimalisir risiko konten manipulatif, Google menerapkan standar keamanan melalui watermark SynthID pada setiap video hasil generatif. Sistem ini memungkinkan verifikasi keaslian konten secara instan melalui aplikasi Gemini, Chrome, dan Google Search, sehingga pengguna dapat membedakan antara video asli dan karya AI dengan lebih percaya diri.
Gemini Omni Flash Kini Hadir: Siapa Saja yang Bisa Menggunakannya?
Gemini Omni Flash menjadi model pertama yang dirilis untuk mengawali kehadiran keluarga besar Gemini Omni. Untuk menjangkau basis pengguna yang luas, Google menerapkan beberapa skema ketersediaan. Bagi Anda pelanggan Google One AI Premium, fitur ini sudah bisa dijajal secara global melalui aplikasi Gemini dan ekosistem Google Workspace.
Sementara itu, kabar baik bagi para kreator di YouTube Shorts dan pengguna YouTube Create, fitur ini mulai digulirkan secara gratis minggu ini. Tak ketinggalan bagi kalangan pengembang maupun sektor bisnis, Google memastikan bahwa akses melalui API akan segera dibuka dalam beberapa minggu mendatang guna mendukung inovasi di level yang lebih luas.
Poin Utama yang Disorot:
-
Model Perdana: Gemini Omni Flash adalah yang pertama dirilis.
-
Target Pengguna: Terbagi menjadi pelanggan berbayar, pengguna umum (kreator), dan pengembang/enterprise.
-
Platform: Tersedia di aplikasi Gemini, Workspace, YouTube Shorts, YouTube Create, dan segera menyusul via API.
