Startup pemrosesan bahasa alami atau natural language processing (NLP) yang berbasis di Amerika Serikat (AS), Datasaur Inc. meraih pendanaan awal US$ 4 juta atau sekitar Rp 60 miliar. Perusahaan rintisan ini dibangun oleh orang Indonesia.
Pendanaan itu dipimpin oleh Initialized Capital dan partisipasi dari HNVR, Gold House Ventures, dan TenOneTen. Presiden OpenAI LP Greg Brockman disebut sebagai investor awal startup ini.
Sebelumnya, Datasaur mendapat investasi US$ 3,9 juta atau sekitar Rp 59 miliar setelah mengikuti demo day di program akselerator Y Combinator pada Maret 2020. Total pendanaan yang diperoleh US$ 7,9 juta atau sekitar Rp 119 miliar.
Perusahaan akan menggunakan dana tersebut untuk mengembangkan pelabelan data NLP yang lebih baik dan efisiensi proses pembuatan model untuk ilmuwan data.
NLP adalah bagian dari kecerdasan buatan yang berkaitan dengan pelatihan komputer untuk memahami kata-kata dan teks yang diucapkan dengan cara yang sama seperti manusia.
Meskipun berbasis di AS, Datasaur didirikan oleh Ivan Lee yang berasal dari Indonesia. Ia menjabat sebagai CEO.
“Apa yang selalu diupayakan oleh Datasaur adalah tempat terbaik untuk mengumpulkan data pelatihan yang Anda butuhkan untuk dimasukkan ke dalam model, apakah itu LLM, atau model NER tradisional, analisis sentimen, atau apa pun yang Anda miliki,” kata Ivan Lee dikutip dari TechCrunch, Kamis (3/8).
Large Language Models atau LLM adalah jenis model dasar yang memungkinkan AI berbicara seperti manusia. Ini dilatih dengan jumlah data yang besar dan menggunakan teknik canggih seperti jaringan saraf untuk memahami kompleksitas bahasa.
Menurutnya, kemunculan LLM meningkatkan kesadaran secara umum tentang bagaimana AI dapat membantu dalam konteks bisnis. Ivan Lee mengatakan sebagian besar perusahaan masih dalam tahap eksplorasi dan masih membutuhkan produk seperti Datasaur untuk membuat model.
Ivan Lee mengatakan, salah satu tujuannya sejak awal Datasaur yakni mendemokratisasi AI, terutama dalam hal pemrosesan bahasa alami. Selain itu, fitur pembuatan model baru harus menempatkan AI dalam jangkauan lebih banyak perusahaan.
“Fitur ini merupakan salah satu yang sangat saya sukai, karena memungkinkan tim tanpa data scientist dan engineer, dapat menandai dan melabeli data ini sesuai keinginan mereka. Ini akan secara otomatis melatih model untuk mereka,” kata Ivan Lee.
Platform Datasaur memungkinkan perusahaan mengubah petabyte data mentah menjadi kumpulan data berharga yang dapat digunakan untuk melatih model NLP yang lebih canggih.
Dikutip dari SiliconANGLE, Datasaur mengatakan alat pelabelan data milik mereka belajar saat menjalankan tugas. Startup ini juga menyediakan alat untuk membantu perusahaan menemukan kesalahan dalam pengumpulan data pelatihan AI.
“Kami melihat perusahaan di setiap industri dan vertikal bergegas menemukan cara menerapkan teknologi seperti ChatGPT ke perusahaan mereka sendiri,” ujar Managing Partner Initialized Capital Brett Gibson.
Menurutnya, produk seperti Datasaur Dinamic menyederhanakan dan menstandarkan proses bagi mereka yang baru mengenal ruang NLP.
“Kami melihat potensi NLP pada 2020 ketika kami pertama kali berinvestasi di tim ini. Waktunya sudah matang untuk merebut pasar yang berkembang pesat,” kata dia.
Tim teknik Datasaur sebagian besar berada di Indonesia. “Filosofi saya selalu profitabilitas, tumbuh dengan cara yang terukur, tidak pernah tumbuh dengan segala cara,” kata Ivan.
“Ada perbedaan signifikan dalam budaya tempat kerja antara AS dan cara kerja di Indonesia,” Ivan menambahkan. “Jadi kami harus menangkap yang terbaik dari kedua negara.”