Startup Indonesia bekerja sama dengan AI Singapore alias AISG mengembangkan Large Language Model atau LLM. Teknologi seperti ini mendukung ChatGPT, Google Bard, dan Bing.
LLM adalah algoritme pembelajaran mendalam yang dapat melakukan berbagai tugas pemrosesan bahasa alami alias natural language process atau NLP.
Startup Indonesia yakni Glair.ai bersama dengan Datasaur.ai, Badan Riset dan Inovasi Nasional alias BRIN, dan AISG mengembangkan LLM yang berfokus pada Bahasa Indonesia.
"Mengembangkan fondasi model AI itu luar biasa apalagi mengunakan bahasa ASEAN. Apalagi bahasa Indonesia memiliki ratusan bahasa daerah yang bisa dimasukkan," kata Wakil Menteri Komunikasi dan Informatika alias Kominfo Nezar Patria saat konferensi pers di Jakarta, Kamis (30/11).
"Di Bangladesh, Microsoft misalnya membuat aplikasi untuk menerjemahkan petunjuk tentang pertanian. Bahasa di sana beragam. Petani di pelosok bisa saling terkoneksi dan berbagi informasi soal pertanian," Nezar menambahkan.
LLM yang akan dikembangkan di Indonesia yakni SEA LION. LLM ini dibangun di atas arsitektur MPT atau Mosaic Pretained Transformers yang kuat dan memiliki ukuran kosakata 256 ribu.
Untuk tokenisasi, model ini menggunakan SEABPETokenizer khusus, yang dirancang khusus untuk bahasa-bahasa di Asia Tenggara.
Datasaur.ai, Glair.ai, BRIN dan AISG menargetkan pengembangan LLM ini pada akhirnya mendorong pembuatan platform berbasis kecerdasan buatan alias artificial intelligence (AI) seperti ChatGPT.
Namun saat ini, LLM akan digunakan untuk platform berbasis AI yang sudah ada seperti milik BRIN, glair.ai, dan HiMuslim.
"Terlalu dini untuk bicara monetisasi. Kami berfokus membangun sesuatu yang bagus dan memiliki nilai. Untuk sementara, semuanya terbuka dan dapat diakses," kata Head of Applied Research and NLP AI Singapore William Tjhi.