OpenAI meluncurkan layanan Application Programming Interface atau API ChatGPT dan Whisper. Layanan ini memungkinkan developer aplikasi mana pun menggunakan ChatGPT dan Whisper.

Whisper adalah sistem pengenalan ucapan otomatis. OpenAI mengatakan, sistem ini andal dalam mengubah suara menjadi teks dalam berbagai bahasa, termasuk menerjemahkannya ke bahasa Inggris.

Whisper bisa mengubah suara dalam berbagai format, termasuk M4A, MP3, MP4, MPEG, MPGA, WAV dan WEBM menjadi teks.

Pengembang ChatGPT, OpenAI pun mengenakan biaya US$ 0,006 per menit untuk suara yang diubah menjadi teks di Whisper.

Selain Whisper, raksasa teknologi seperti Google, Amazon, dan Meta sudah membuat sistem pengenalan suara dan mengubahnya menjadi teks.

Presiden sekaligus Pemimpin OpenAI Greg Brockman mengutip survei Statista pada 2000 mengenai hambatan yang dirasakan oleh pengguna selama menggunakan sistem pengenalan suara yang sudah ada, di antaranya:

  • Akurasi
  • Pengenalan aksen atau dialek
  • Biaya

“Whisper API berbeda karena dilatih dengan 680 ribu jam data multibahasa dan ‘multitask’ yang dikumpulkan dari web,” kata dikutip dari TechCrunch, Rabu (1/3).

Hasil dari pelatihan tersebut memungkinkan Whisper API mengenali suara dengan aksen unik. Selain itu, mengatasi kebisingan di balik suara dan mengenali jargon tertentu yang digunakan oleh warga di tiap negara atau daerah.

Halaman:
Reporter: Lenny Septiani