Alibaba бросила вызов DeepSeek, выпустив новую модель ИИ

Alibaba випустив власний ШІ
Источник: Pexels

Китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по ее заявлению, превосходит разработку DeepSeek-V3.

Интересно, что релиз состоялся в первый день празднования Китайского Нового года, когда большинство жителей страны отдыхают. Это может свидетельствовать о давлении, которое вызвал стремительный успех DeepSeek за последние три недели, заставляя Alibaba и других китайских разработчиков ускорять обновление своих моделей.

Qwen 2.5-Max от Alibaba — что известно

По данным облачного подразделения Alibaba, модель Qwen 2.5-Max “почти по всем показателям” превосходит GPT-4o, DeepSeek-V3 и Llama-3.1-405B — самые современные модели от OpenAI и Meta.

Сейчас смотрят

В последнее время китайский стартап DeepSeek вызвал ажиотаж в мире технологий. Его модель DeepSeek-V3, представленная 10 января, а также выпущенная 20 января R1, всколыхнули рынок и вызвали беспокойство в Кремниевой долине. Инвесторы начали сомневаться в необходимости многомиллиардных вложений в разработку искусственного интеллекта, поскольку DeepSeek предлагает значительно более дешевые решения.

На фоне успеха DeepSeek конкуренты пытаются улучшить собственные модели. ByteDance, владелец TikTok, всего через два дня после запуска DeepSeek-R1 выпустила обновление к своей флагманской модели искусственного интеллекта. По словам компании, ее модель превзошла OpenAI o1 в тесте AIME, который оценивает способность ИИ выполнять сложные задачи.

Влияние DeepSeek на сегмент ИИ в Китае

Ранее, в мае 2023 года, DeepSeek выпустила DeepSeek-V2, что стало причиной ценовой войны в Китае. Благодаря открытому коду и беспрецедентно низкой стоимости — всего 1 юань ($0,14) за 1 млн токенов — другие китайские компании, включая Alibaba, Baidu и Tencent, были вынуждены значительно снизить цены на свои модели.

Основатель DeepSeek Лян Вэньфэн в редком интервью китайскому медиа Waves в июле заявил, что компания не занимается ценовыми войнами, поскольку ее основная цель — достижение AGI (искусственного общего интеллекта). В отличие от технологических гигантов с их сложными управленческими структурами, DeepSeek работает как исследовательская лаборатория с небольшой командой молодых выпускников и докторантов.

Лян также отметил, что крупные корпорации могут быть не лучшими игроками в будущем развитии искусственного интеллекта, ведь их расходы высоки, а инновации имеют ограничения.

Если вы увидели ошибку в тексте, пожалуйста, выделите фрагмент текста и нажмите Cntrl + Entr.
Знайшли помилку в тексті?
Помилка