💬 Новейшая модель искусственного интеллекта QwQ-32B-Preview от Alibaba превосходит o1 от OpenAI в некоторых тестах

Новейшая модель искусственного интеллекта QwQ-32B-Preview от Alibaba превосходит o1 от OpenAI в некоторых тестах 👑 Premium-робот: получай более 20-ти торговых идей в день!
Размер текста

Новейшая модель искусственного интеллекта QwQ-32B-Preview от Alibaba превосходит o1 от OpenAI в некоторых тестах

Поскольку конкуренция в сфере искусственного интеллекта усиливается, китайский розничный гигант Alibaba представил свой QwQ-32B-Preview, который, как сообщается, превосходит серию o1 от OpenAI.

Сообщается, что последняя модель превосходит модели OpenAI o1-preview и o1-mini по некоторым конкретным тестам, таким как тесты AIME и MATH, которые оценивают производительность моделей ИИ при решении логических головоломок и математических задач.

По словам розничного гиганта, новая модель Alibaba способна решать более сложные и запутанные проблемы по сравнению с обычными большими языковыми моделями (LLM), такими как ChatGPT-4 и Claude 3.5.

Статья Benzinga указывает, что QwQ-32B-Preview — один из немногих, доступных по разрешительной лицензии, что позволяет пользователям загружать и использовать его. Модель теперь доступна на платформе разработки ИИ Hugging Face.

Однако Alibaba опубликовала некоторые компоненты модели, чтобы ограничить полное воспроизведение модели или понимание ее работы.

Последняя модель Alibaba может похвастаться 32,5 миллиардами параметров, что позволяет ей обрабатывать подсказки объемом до 32 000 слов. Благодаря значительным возможностям модели и полуоткрытому доступу новый участник Alibaba готовит почву для преобразующего скачка в технологиях рассуждений ИИ.

Несмотря на прозрачное заявление Alibaba, подчеркивающее сложность ее модели, OpenAI сохранила количество своих параметров в тайне.

Появление этой модели приходится на время, когда OpenAI делает значительные шаги в секторе ИИ. В октябре оценка OpenAI подскочила до 157 миллиардов долларов после успешного раунда финансирования.

Ранее на этой неделе сообщалось, что группа SoftBank (SFTBF) увеличила свою долю в производителе ChatGPT путем выкупа акций у сотрудников на сумму 1,5 млрд долларов.

Сообщается также, что OpenAI изучает возможность разработки собственного веб-браузера, чтобы составить конкуренцию дочернему браузеру Alphabet Google Chrome после давления со стороны Министерства юстиции США с требованием его продажи.

Хотя новая модель обладает некоторыми уникальными сильными сторонами, у нее также есть ограничения. По словам группы, у QwQ-32B-Preview есть такие проблемы, как неожиданные переключения языка, которые могут потенциально сбивать пользователей с толку. Модель также плохо справляется с задачами, требующими здравого смысла, что характерно для многих систем ИИ.

По данным AutoGPT, модель может зацикливаться на логических циклах, что приводит к задержке ответов.

Несмотря на свои недостатки, его возможности рассуждения позволяют ему самостоятельно проверять факты, тем самым сокращая количество ошибок, но увеличивая время принятия решения.

Рассматривая задачи и этапы планирования, модель Alibaba избегает некоторых ловушек, которые влияют на традиционные системы ИИ. Но этот подход требует дополнительного времени, что может ограничить применение в реальном времени.

По словам Бензинги, ответы QwQ-32B-Preview соответствуют китайским нормативным стандартам и избегают политически чувствительных тем.

Например, на такие политически деликатные темы, как Тайвань, будут даны ответы, соответствующие позиции китайского правительства.

Кроме того, запросы о таких событиях, как площадь Тяньаньмэнь, не приводят к появлению ответов, что свидетельствует об осторожном подходе к разработке модели.

Хотя это может быть идеальным для китайского рынка, это также может ограничить его привлекательность на мировом рынке. Тем не менее, эта модель является значительным шагом в мир рассуждающего ИИ. Хотя ее ограничения могут сузить ее глобальную привлекательность, другие ее компоненты, такие как логика и полуоткрытая природа, делают ее серьезным конкурентом для OpenAI.

По данным AutoGPT, QwQ-32B-Preview освещает потенциал и проблемы этой захватывающей области, в которой лаборатории искусственного интеллекта по всему миру работают над совершенствованием технологии рассуждений.

Ограничение / снятие ответственности (дисклеймер): Вся информация на этом сайте предоставляется исключительно в информационных целях и не является предложением или рекомендацией к покупке, продаже или удержанию каких-либо ценных бумаг, акций или других финансовых инструментов. Авторы контента не несут ответственности за действия пользователей, основанные на предоставленной информации. Пользователи обязаны самостоятельно оценивать риски и проконсультироваться со специалистами перед принятием каких-либо инвестиционных решений. Вся информация на сайте может быть изменена без предварительного уведомления.

Свежие новости по теме: Криптовалюта, NFT и криптобиржи

🚀