Grok 4 от xAI: ИИ нового уровня с рекордом на Humanity's Last Exam
Команда Илона Маска вывела на рынок новую модель искусственного интеллекта Grok 4, а также ее продвинутую версию Grok 4 Heavy.
Эти системы уже успели установить рекорды на ряде тестов, включая крайне сложный экзамен Humanity's Last Exam, где Grok 4 Heavy достиг 50,7% точности при использовании вычислительных инструментов и многомодельного взаимодействия. Обычная версия Grok 4 показала 25,4% в стандартном режиме и 44,4% — при подключении ко внешним инструментам.
Инженеры компании сделали акцент на развитии рассуждений: в новой версии на обучение reasoning-навыков было направлено в 10 раз больше ресурсов, чем раньше. При этом архитектура осталась прежней: Grok 4 базируется на той же модели, что и Grok 3, однако первая обучалась значительно дольше.
Увеличен и контекст: модель способна обрабатывать до 256 тысяч токенов. Мультимодальность пока отстает, но в xAI пообещали устранить этот пробел в следующих релизах.
Стоимость API осталась прежней, но за счет «разговорчивости» Grok 4 его использование может обходиться дороже аналогов. Подписка на обычную версию стоит $30 в месяц, продвинутая — $300. В ближайшие недели ожидается запуск специализированной версии Grok 4 Coder, предназначенной для разработчиков.
Также стало известно, что xAI готовится начать обучение видеомодели на более чем 100 тысяч чипов GB200, а в прошлом месяце компания привлекла $10 миллиардов инвестиций и кредитных средств для расширения своего суперкомпьютера Colossus.