DeepSeek Pelopori Penalaran Matematika dengan Sistem Verifikasi Mandiri

sekilas.co – Perusahaan kecerdasan buatan (artificial intelligence/AI) asal China, DeepSeek, baru-baru ini meluncurkan DeepSeekMath-V2, sebuah model penalaran matematika inovatif yang menetapkan tolok ukur kinerja baru dan mendorong batas kemampuan pemecahan masalah berbasis AI.

Model terbaru ini, yang kini menjadi sumber terbuka (open-source) di Hugging Face dan GitHub, memperkenalkan kerangka kerja verifikasi mandiri yang dirancang untuk memastikan tidak hanya jawaban yang benar, tetapi juga bukti yang logis dan dapat diverifikasi.

Prestasinya mencakup capaian setara medali emas pada Olimpiade Matematika Internasional (International Mathematical Olympiad/IMO) 2025 dan Olimpiade Matematika China (Chinese Mathematical Olympiad/CMO) 2024.

Model tersebut juga meraih skor 118 dari 120 poin dalam Ujian Putnam 2024 yang sangat kompetitif, jauh melampaui skor tertinggi manusia yang berada di angka 90.

Keunggulan model ini semakin ditegaskan melalui IMO-ProofBench, yang membuatnya melampaui model seperti DeepThink milik DeepMind. Sistem tersebut mempertemukan dua model bahasa besar, di mana satu bertindak sebagai “pembukti” yang menghasilkan bukti matematika, sementara yang lain berperan sebagai “peninjau” yang menilai penalarannya.

Menurut tim DeepSeek, mekanisme ini mengatasi keterbatasan kritis pada pencapaian AI saat ini, di mana jawaban akhir yang benar tidak selalu menjamin proses penalaran yang tepat.

DeepSeek menyatakan bahwa terobosan ini menetapkan penalaran matematika dengan verifikasi mandiri sebagai jalur yang layak dan menjanjikan menuju pengembangan sistem AI matematika yang lebih kuat serta lebih andal.

Artikel Terkait

Social Network