DeepSeek представил модель V4: 1,6 триллиона параметров и контекст в миллион слов

Китайский стартап в области искусственного интеллекта DeepSeek, в январе прошлого года поразивший мир своим недорогим чат-ботом, наконец выпустил предварительную версию новой модели V4 в пятницу, 20 декабря.

В заявлении компании в социальных сетях говорится, что новая модель «поддерживает сверхдлинный контекст в один миллион слов». Эта функция позволяет модели обрабатывать огромные объемы текста одновременно.

DeepSeek-V4 доступен в двух версиях: V4-Pro с 1,6 триллиона параметров и более дешевая V4-Flash с 284 миллиардами параметров. Параметры определяют способность модели принимать решения.

Согласно заявлению компании, «в бенчмарках знаний DeepSeek-V4-Pro значительно превосходит другие модели с открытым исходным кодом и лишь немного уступает лучшей закрытой модели — Gemini-Pro-3.1 от Google».

Выпуск предварительной версии позволяет компании собрать отзывы из реального мира перед финализацией модели.

Напомним, что DeepSeek вызвал ажиотаж в январе 2025 года, представив генеративный ИИ-чат-бот, способный конкурировать с американскими продуктами, такими как ChatGPT, но при этом требующий значительно меньше вычислительных мощностей и средств.

Однако компания также столкнулась с противоречиями. Например, ее чат-бот уклоняется от ответов на политически чувствительные темы, такие как подавление протестов на площади Тяньаньмэнь в 1989 году, что поднимает вопросы о цензуре.

Стартап из Ханчжоу также обвиняется Соединенными Штатами и их американскими конкурентами в неправомерных и незаконных действиях. В четверг Белый дом заявил, что китайские субъекты проводят «кампании дистилляции промышленного масштаба для кражи американского ИИ».

Пекин отверг эти «необоснованные обвинения», добавив, что Китай «придает большое значение защите прав интеллектуальной собственности».

Source: www.dw.com

Мир

DeepSeek представил модель V4: 1,6 триллиона параметров и контекст в миллион слов

Последние новости

Последние новости