Indosat Ooredoo Hutchison akan meluncurkan model bahasa besar atau large language model (LLM) seperti GPT-4o di balik ChatGPT. Layanan ini akan melengkapi solusi LLM buatan Glair.ai, Datasaur.ai, Badan Riset dan Inovasi Nasional alias BRIN, dan AI Singapore atau AISG.

LLM adalah algoritme pembelajaran mendalam yang dapat melakukan berbagai tugas pemrosesan bahasa alami alias natural language process atau NLP.

Teknologi LLM seperti GPT-4o ChatGPT buatan Indosat akan bernama Garuda LLM. Operator seluler ini bekerja sama dengan Tech Mahindra, perusahaan penyedia solusi dan layanan transformasi digital, konsultasi, serta rekayasa ulang bisnis.

Kemitraan tersebut diumumkan melalui penandatanganan Nota Kesepahaman atau MoU di ajang Mobile World Congress alias MWC pada Februari. “Garuda LLM akan diluncurkan pada Juli,” kata President Director and Chief Executive Officer Indosat Ooredoo Hutchison Vikram Sinha usai menghadiri RUPS, Selasa (21/5).

Dalam laporan Empowering Indonesia Report 2024 : Growth Beyond Metropolitan, Indosat menjelaskan bahwa perusahaan membangun Model AI Bahasa Besar untuk melayani 279 juta penutur bahasa.

Beberapa target dari pengembangan Garuda LLM di antaranya:

  • Menyiapkan pasar sebagai Platform as a Services atau PaaS bagi mitra untuk berkontribusi dan membangun solusi AI untuk Indonesia 
  • Menawarkan kasus penggunaan AI yang sudah jadi untuk pelanggan industri 
  • Menyiapkan Eksperimen sebagai layanan, pembuatan prototipe AI berbasis langganan untuk pengembangan solusi 
  • Memasarkan langganan ke Garuda (LLM / SLM) dengan ekstensi hak milik dan kapasitas GPU 
  • Langganan terbuka untuk layanan cloud GPU sesuai permintaan untuk mempercepat adopsi

Garuda LLM akan tersedia di server lokal untuk penggunaan Nasional, seperti mendukung identifikasi ID nasional, perpajakan kota dan proses perubahan nama dan alamat.

Melalui laman resmi, fitur ‘Garuda’ akan menghadirkan beragam usecase misalnya, bisa digunakan untuk chatbot di berbagai aplikasi, pembuatan konten lintas-industri seperti kesehatan, e-commerce, pendidikan perdesaan, perbankan dan keuangan, pertanian, serta telekomunikasi. 

Garuda disebut akan menyajikan pengalaman pengguna yang dipersonalisasi dengan menganalisis sentimen dan memahami pola perilaku, sehingga menghasilkan pembelajaran yang fleksibel berdasarkan interaksi sebelumnya. 

Sebagai bagian dari kemitraan ini, Tech Mahindra akan memanfaatkan keahlian untuk mengumpulkan dan merangkum data dalam bahasa Indonesia. LLM Garuda akan dilatih, kemudian dirilis sebagai model percakapan untuk Indosat.

Teknologi ChatGPT yang Paham Bahasa Daerah

Startup Indonesia yakni Glair.ai, Datasaur.ai mengumumkan kerja sama dengan BRIN dan AISG mengembangkan LLM yang berfokus pada Bahasa Indonesia pada akhir tahun lalu.

"Mengembangkan fondasi model AI itu luar biasa apalagi menggunakan bahasa ASEAN. Bahasa Indonesia memiliki ratusan bahasa daerah yang bisa dimasukkan," kata Wakil Menteri Komunikasi dan Informatika alias Kominfo Nezar Patria saat konferensi pers di Jakarta, pada November tahun lalu (30/11/2023).

"Di Bangladesh, Microsoft misalnya, membuat aplikasi untuk menerjemahkan petunjuk tentang pertanian. Bahasa di sana beragam. Petani di pelosok bisa saling terkoneksi dan berbagi informasi soal pertanian," Nezar menambahkan.

LLM yang akan dikembangkan di Indonesia yakni SEA LION. LLM ini dibangun di atas arsitektur MPT atau Mosaic Pretained Transformers yang kuat dan memiliki ukuran kosakata 256 ribu.

Untuk tokenisasi, model ini menggunakan SEABPETokenizer khusus, yang dirancang khusus untuk bahasa-bahasa di Asia Tenggara.

Datasaur.ai, Glair.ai, BRIN dan AISG menargetkan pengembangan LLM ini pada akhirnya mendorong pembuatan platform berbasis kecerdasan buatan alias artificial intelligence (AI) seperti ChatGPT.

Saat ini, LLM akan digunakan untuk platform berbasis AI yang sudah ada seperti milik BRIN, glair.ai, dan HiMuslim.

"Terlalu dini untuk bicara monetisasi. Kami berfokus membangun sesuatu yang bagus dan memiliki nilai. Untuk sementara, semuanya terbuka dan dapat diakses," kata Head of Applied Research and NLP AI Singapore William Tjhi.

William Tjhi juga menyampaikan ada dua tantangan dalam mengembangkan LLM sendiri. “Biaya yang dikeluarkan besar, dan perusahaan besar yang lebih dulu mengembangkan LLM tidak mungkin mau berbagi hasil riset mereka,” kata dia kepada Katadata.co.id.

Reporter: Lenny Septiani