Китайская компания DeepSeek анонсировала выпуск новой версии своей специализированной модели искусственного интеллекта — Prover v2, предназначенной для решения математических задач. Обновлённая модель продемонстрировала высокие результаты на профильных бенчмарках и превзошла предыдущие версии.
Prover v2 основана на архитектуре трансформеров и оптимизирована для обработки математических доказательств и решений. Она предназначена для участников олимпиад, разработчиков в сфере искусственного интеллекта и исследователей, занимающихся формальными доказательствами и теорией чисел.
Модель продемонстрировала лучший результат на тестах MiniF2F, часто используемых для оценки ИИ-систем по решению математических задач. В частности, Prover v2 превзошла такие модели, как GPT-4 и Claude 2.1 по ряду метрик, связанных с решением задач высокого уровня сложности.
DeepSeek также опубликовала исходный код и веса модели на GitHub, что делает её доступной для широкой исследовательской аудитории, а также планирует использовать наработки в дальнейших версиях своего продукта.
Согласно заявлению компании, разрабатываемые технологии могут быть полезны для автоматизации математических исследований, в образовании и развитии систем поддержки принятия решений.