AI Sora Bisa Buat Teks Jadi Video Resolusi 720P, Dirilis Akhir 2024
Platform berbasis kecerdasan buatan alias artificial intelligence (AI) Sora akan dirilis akhir tahun ini. Alat ini memungkinkan untuk mengubah teks menjadi video hingga satu menit dengan resolusi 720 piksel.
“Sora OpenAI akan tersedia untuk umum dalam beberapa bulan ke depan,” kata CTO OpenAI Mira Murati dalam wawancara eksklusif Wall Street Journal dengan kolumnis teknologi pribadi Joanna Stern dikutip dari Venture Beat, Kamis (14/3).
Sora dapat menghasilkan video berdurasi hingga satu menit hanya dengan perintah teks. All About AI melaporkan, kualitas video yang dihasilkan 720 piksel.
Karakter di video buatan AI Sora belum memiliki suara. Namun Mira menyampaikan bahwa perusahaan akan meningkatkan kemampuan untuk menambahkan suara.
OpenAI akan menerapkan model transformator difusi yang memungkinkan AI belajar dari penyimpanan data video dan gambar yang lebih luas, mencakup berbagai durasi, resolusi, dan rasio aspek.
Pembuat ChatGPT itu menyatakan bahwa Sora mampu menghasilkan adegan yang kompleks dengan banyak karakter, jenis gerakan tertentu, serta detail akurat dari subjek dan latar belakang.
Tidak hanya perintah teks dari pengguna, Sora disebut bisa memahami keadaan di dunia fisik.
Model AI itu memiliki pemahaman bahasa yang mendalam, sehingga memungkinkan untuk menafsirkan prompt secara akurat dan menghasilkan karakter yang memikat, serta mengekspresikan emosi yang hidup.
“Sora juga dapat membuat beberapa bidikan dalam satu video yang dihasilkan yang secara akurat mempertahankan karakter dan gaya visual,” kata OpenAI melalui laman resmi, bulan lalu (16/2).
OpenAI mengatakan bahwa Sora masih kesulitan menyimulasikan secara akurat suatu adegan yang kompleks. Selain itu, tidak memahami contoh sebab dan akibat yang spesifik.
Misalnya, seseorang menggigit kue. Tetapi setelah itu, kue tersebut tidak memiliki bekas gigitan. Selain itu, kesulitan mendeskripsikan peristiwa yang terjadi dari waktu ke waktu secara tepat seperti mengikuti alur pengambilan gambar lewat kamera tertentu.
Pembuat ChatGPT itu baru menyediakan AI Sora bagi pakar IT, peneliti konten, seniman visual, desainer, dan pembuat film. Ini bertujuan mendapatkan umpan balik untuk meningkatkan kualitas dan keamanan platform.
“Kami berencana menyertakan metadata C2PA di masa depan jika menerapkan model ini dalam produk OpenAI,” ujar perusahaan.
Selain mengembangkan teknik baru, OpenAI akan memanfaatkan metode keamanan yang sudah dibuat seperti yang ada pada DALL-E 3.
Pengklasifikasi teks akan memeriksa dan menolak permintaan input teks yang melanggar kebijakan penggunaan seperti kekerasan ekstrem, konten seksual, citra kebencian, kemiripan dengan selebriti, atau IP orang lain.
“Kami juga mengembangkan pengklasifikasi gambar yang kuat untuk meninjau bingkai setiap video yang dihasilkan,” ujar OpenAI. Ini bertujuan memastikan video sesuai dengan kebijakan penggunaan.
Sora AI Pakai Data Video di YouTube, Facebook, Instagram?
Joanna Stern bertanya kepada Mira mengenai data yang digunakan oleh AI Sora untuk mengubah teks menjadi video. “Kami menggunakan data yang tersedia untuk umum dan berlisensi,” kata CTO OpenAI ini.
Mira kemudian mengonfirmasi bahwa OpenAI menggunakan konten Shutterstock, sebagai bagian dari perjanjian penggunaan data untuk pelatihan AI selama enam tahun, yang diumumkan pada Juli 2023.
OpenAI CTO Mira Murati revealed in an interview with the WSJ that Sora was trained on publicly available and licensed data.
She also revealed that the model will be released later this year. pic.twitter.com/yGgEsxiznI— Rowan Cheung (@rowancheung) March 14, 2024
Stern kemudian bertanya kepada Mira apakah AI Sora menggunakan video yang beredar di media sosial. “Saya sebenarnya tidak yakin mengenai hal itu,” jawab Mira ketika ditanya mengenai apakah AI Sora menggunakan video yang ada di YouTube.
“Mungkin ada. Tetapi saya tidak yakin,” kata Mira ketika ditanya ada tidaknya video pengguna Facebook dan Instagram yang dipakai.
“Saya tidak akan membahas detail tentang data yang digunakan. Tetapi data tersebut tersedia untuk umum atau data berlisensi,” Mira menambahkan.
The Information melaporkan pada Juni 2023 bahwa OpenAI secara diam-diam menggunakan data dari The Wall Street Journal untuk melatih beberapa model AI ChatGPT.
Selain OpenAI, Google sebagai pemilik YouTube dinilai berpotensi menggunakan video pengguna di platform untuk melatih AI. Begitu juga Meta, induk usaha Facebook dan Instagram.