Nvidia презентует Alpamayo-R1: новый шаг к умному автономному вождению

На конференции NeurIPS AI, проходившей в Сан-Диего, Калифорния, компания Nvidia представила Alpamayo-R1 — открытую языковую модель для визуального мышления, созданную для автопилотирования.

Эти искусственные нейронные сети способны анализировать как текст, так и изображения, что позволяет транспортным средствам «осознавать» окружающую среду и принимать решения на основе полученной информации.

Новая модель опирается на «рассуждающую» архитектуру под названием Cosmos-Reason. Серия моделей Cosmos была запущена в январе, а в августе компания выпустила дополнительные решения.

«Ранее существующие модели автономного вождения сталкивались с трудностями в сложных дорожных ситуациях, таких как перекрестки с множеством переходов, предстоящие закрытия полос или автомобили, припаркованные на велосипедных дорожках. Рассуждающие функции придают автономным транспортным средствам логику, что позволяет им управлять так же, как люди», — отметили специалисты компании.

Технологии, такие как Alpamayo-R1, играют ключевую роль для компаний, стремящихся достичь четвертого уровня автономного вождения, как указано в блоге Nvidia.

Модель рассматривает все возможные маршруты и сценарии, а затем использует контекстную информацию для выбора наилучшего пути.

Nvidia надеется, что новый инструмент добавит автономным транспортным средствам «здравый смысл», что ускорит процесс принятия сложных решений во время вождения.

Эта модель уже доступна на GitHub и Hugging Face. Вместе с ней компания также опубликовала пошаговые инструкции, ресурсы для инференса и посттренировочные рабочие процессы под общим названием Cosmos Cookbook.

Предоставленные материалы помогут разработчикам максимально эффективно использовать и обучать нейросети под специфические задачи.

Nvidia заявила о «практически неограниченных возможностях» приложений, основанных на Cosmos. Среди последних примеров компания упоминает:

Компания также акцентирует внимание на физическом искусственном интеллекте как на новом направлении для своих ИИ-процессоров. Генеральный директор Nvidia Дженсен Хуанг не раз подчеркивал, что эта сфера станет следующей этапом развития ИИ.

Чипмейкер нацелен на сектор робототехники. В августе он запустил новый модуль Jetson AGX Thor стоимостью $3499, которого компания называет «мозгом робота».

В октябре Хуанг заявил, что искусственный интеллект достиг новой «спирали успеха». Он отметил, что значительные улучшения в нейросетях приводят к росту инвестиций в технологии, а это, в свою очередь, еще больше развивает данное направление.

Стоит отметить, что в третьем квартале выручка Nvidia составила $57 миллиардов, что на 62% превышает показатели аналогичного периода прошлого года.