Китайська компанія DeepSeek буквально рік тому здивувала ринок своєю першою великою моделлю, а зараз представила два новинки – V3.2 і експериментальний V3.2-Speciale. У компанії стверджують, що вони можуть конкурувати, а іноді навіть перевершити GPT-5 і Gemini 3 Pro.
DeepSeek — це ефективність. На відміну від американських лабораторій, які використовують великі кластери дорогих мікросхем, компанія каже, що її методи навчання можуть досягти високого рівня інтелекту на менш потужному апаратному забезпеченні. Навіть стандартна модель містить інструменти для логічного мислення, без необхідності спеціальних режимів.

Особливу увагу привертає V3.2-Speciale. Згідно з DeepSeek, він перевершує GPT-5 у внутрішніх тестах і знаходиться на одному рівні з Gemini 3 Pro у складних логічних завданнях. Як приклад компанія наводить високі результати моделей на Міжнародній олімпіаді з математики та інформатики 2025, результати якої були опубліковані у відкритому доступі.
Компанія пояснює свій успіх двома інноваціями: вдосконаленим механізмом концентрації уваги для ефективної роботи з довгими текстами та передовим навчанням підкріплення для вирішення понад 85 000 складних проблем. DeepSeek V3.2 тепер доступний на веб-сайті, у мобільних додатках та API.
Джерело
