DeepSeek Pelopori Penalaran Matematika dengan Sistem Verifikasi Mandiri

Perusahaan AI asal China, DeepSeek, baru saja meluncurkan DeepSeekMath-V2, model penalaran matematika canggih yang menetapkan standar baru dalam pemecahan masalah berbasis AI. Model ini kini tersedia open-source di Hugging Face dan GitHub.

DeepSeekMath-V2 memperkenalkan kerangka verifikasi mandiri yang tidak hanya memastikan jawaban benar, tetapi juga bukti logis yang dapat diverifikasi. Model ini berhasil meraih medali emas di Olimpiade Matematika Internasional 2025 dan Olimpiade Matematika China 2024, serta mencetak 118 dari 120 poin di Ujian Putnam 2024, jauh melampaui skor tertinggi manusia yakni 90.

Prestasi ini diperkuat melalui IMO-ProofBench, sistem yang mengadu dua model bahasa besar, satu sebagai “pembukti” dan satu sebagai “peninjau”, untuk memastikan proses penalaran matematika yang akurat.

DeepSeek menekankan bahwa terobosan ini membuka jalur baru bagi pengembangan AI matematika yang lebih kuat dan andal, di mana AI tidak hanya memberikan jawaban yang benar, tetapi juga proses penalaran yang tervalidasi.

Dikutip dari antaranews

Related Posts