AI Milik Alibaba Raih Skor Sempurna Saat Tes Matematika Tingkat Global
Model AI milik Alibaba, Qwen3-Max-Thinking meraih skor sempurna 100% dalam kompetisi matematika American Invitational Mathematics Examination (AIME) 2025 dan Harvard-MIT Mathematics Tournament (HMMT).
Melansir StartupStory (5/11), capaian itu membuat Qwen3-Max-Thinking Alibaba menjadi model AI pertama dari Cina yang berhasil meraih nilai sempurna dalam kontes internasional . Kompetisi AIME dan HMMT dikenal menantang, menguji kemampuan penalaran matematis tingkat tinggi dalam bidang aritmatika, aljabar, teori bilangan, hingga probabilitas.
Model AI itu dikembangkan oleh tim Alibaba Cloud Intelligence sebagai versi paling canggih dari keluarga model Qwen3, dengan kapasitas lebih dari satu triliun parameter.
Qwen3-Max-Thinking dirancang khusus untuk memperkuat kemampuan penalaran dan pemecahan masalah kompleks, yakni dua aspek yang menjadi tolok ukur utama keunggulan AI.
Kinerja Qwen3-Max-Thinking kini menyamai bahkan menantang dominasi GPT-5 Pro milik OpenAI, yang sebelumnya juga mencatat hasil sempurna di kompetisi serupa. Menurut laporan dari Intuition Labs, pencapaian seperti ini mencerminkan kemajuan besar dalam bidang penalaran logis, area yang menjadi fokus utama riset AI global saat ini.
Hasil kompetisi ini disebut membuktikan Cina menjadi salah satu pemain utama dalam pengembangan kecerdasan buatan alias AI. Sebab, dalam beberapa tahun terakhir, perusahaan-perusahaan Cina seperti Alibaba, Baidu, dan Tencent terus meningkatkan kemampuan model mereka untuk bersaing dengan raksasa teknologi Barat.
Sebelumnya, model Qwen3-Max juga sempat mencuri perhatian setelah mengungguli sejumlah AI besar dunia, termasuk Anthropic Claude Opus 4, DeepSeek V3.1, xAI Grok 4, dan OpenAI GPT-5 Pro, dalam berbagai pengujian internal.
Bahkan, dalam simulasi pasar uang kripto dengan modal awal US$10.000, model ini mencatat keuntungan 22,3% dalam dua minggu, sementara GPT-5 justru mencatat kerugian hingga 62,7%.
Model ini kini sudah tersedia untuk pengguna umum melalui platform chatbot Qwen versi web dan API Alibaba Cloud. Tim pengembang menyebutkan bahwa pengembangan Qwen3-Max-Thinking masih terus berlanjut untuk meningkatkan performa dan memperluas kemampuan penalarannya
