DeepSeek представив нову математичну модель DeepSeekMath-V2, систему, що працює на принципово новій архітектурі самоконтролю. Він заснований на взаємодії двох мовних моделей: одна генерує рішення проблеми, інша крок за кроком перевіряє логічність і обґрунтованість кожного кроку.
Розробники пояснюють, що саме ця властивість усуває ключову проблему сучасного ШІ – здатність давати правильні відповіді, але з помилками в міркуваннях. DeepSeekMath-V2 не тільки знаходить правильний результат, але й підтримує його правильними та офіційно підтвердженими аргументами.
Результати випробувань підтверджують проривний рівень системи. У завданнях Патнема на 2024 рік модель набрала 118 балів зі 120, що значно перевищує людський рекорд (близько 90 балів).
DeepSeekMath-V2 також продемонстрував рівень золотих медалістів Міжнародної математичної олімпіади 2025 року та Китайської математичної олімпіади 2024 року. Такі показники свідчать про серйозний крок вперед у використанні штучного інтелекту для вирішення складних логічних і формалізованих математичних задач.
Джерело
