Bayangkan kamu hanya mengetikkan kalimat seperti: "Seorang anak bermain layangan di tengah padang rumput saat matahari terbenam," lalu dalam hitungan detik muncul video berkualitas tinggi sesuai deskripsi itu. Tanpa kamera. Tanpa kru film. Tanpa editing.
Itulah yang coba ditawarkan oleh Veo 3, teknologi terbaru dari Google DeepMind yang diluncurkan pada ajang Google I/O 2024. Veo 3 adalah AI generatif video, mampu mengubah teks biasa menjadi video sinematik seolah-olah dibuat oleh sutradara profesional.
Apa Itu Veo 3?
Veo 3 merupakan evolusi dari generasi sebelumnya, dengan peningkatan signifikan dalam kualitas, presisi gerakan, dan pemahaman konteks visual. Berbeda dengan AI gambar seperti DALL*E atau Midjourney, Veo tidak hanya menghasilkan satu bingkai gambar, tapi satu rangkaian video berdurasi 8--10 detik, bahkan bisa mencapai resolusi 4K.
Teknologi ini mengenali gaya sinematografi, efek cahaya, sudut kamera, hingga efek fisika realistis hanya berdasarkan deskripsi dalam bentuk teks. Ingin video timelapse, aerial shot, atau slow motion? Cukup tulis, dan AI akan membuatnya untukmu.
Teknologi yang Bikin Takjub
Dalam beberapa demo yang ditampilkan oleh Google, Veo mampu memvisualisasikan berbagai adegan kompleks: dari seorang peselancar menaklukkan ombak, hingga pemandangan pegunungan bersalju yang tenang. Semuanya terasa nyata, sinematik, dan mengesankan.
Beberapa fitur unggulannya antara lain:
- Resolusi hingga 4K
- Pemahaman konsep sinematografi seperti "long shot", "panoramic" dan "macro close-up"