NVIDIA ускорила разработку генеративных моделей AI

Обновлено 14 января 2025 - 2 месяца назад. Blogs.nvidia.com.

Оглавление

Оптимизированные NVIDIA модели Foundation ускоряют инновации
Ускоренная настройка и развертывание

Разработчики могут экспериментировать с новыми моделями NVIDIA AI Foundation прямо из браузера, тестировать в своих приложениях с помощью конечных точек NVIDIA AI Foundation Endpoints, а затем настраивать их, используя свои уникальные бизнес-данные.

Сегодняшний ландшафт бесплатных больших языковых моделей (LLM) с открытым исходным кодом напоминает шведский стол для предприятий. Такое изобилие может оказаться непосильным для разработчиков, создающих собственные приложения генеративного ИИ, поскольку им приходится ориентироваться на уникальные требования к проекту и бизнесу, включая совместимость, безопасность и данные, используемые для обучения моделей.

NVIDIA AI Foundation Models - коллекция предварительно обученных моделей корпоративного уровня - дает разработчикам возможность начать работу по внедрению генеративного ИИ в корпоративные приложения.

Оптимизированные NVIDIA модели Foundation ускоряют инновации

Модели NVIDIA AI Foundation можно использовать через простой пользовательский интерфейс или API, прямо из браузера. Кроме того, к этим моделям можно обращаться через конечные точки NVIDIA AI Foundation Endpoints для тестирования производительности моделей в корпоративных приложениях.

Доступные модели включают ведущие модели сообщества, такие как Llama 2, Stable Diffusion XL и Mistral, которые отформатированы, чтобы помочь разработчикам упростить настройку с собственными данными. Кроме того, модели были оптимизированы с помощью NVIDIA TensorRT-LLM для обеспечения высочайшей пропускной способности и минимальной задержки, а также для работы в масштабе на любом стеке с ускорением NVIDIA GPU. Например, модель Llama 2, оптимизированная с помощью TensorRT-LLM, работает почти в 2 раза быстрее на NVIDIA H100.

Новое семейство базовых моделей NVIDIA Nemotron-3 8B поддерживает создание самых передовых корпоративных приложений для чатов и вопросов и ответов для широкого спектра отраслей, включая здравоохранение, телекоммуникации и финансовые услуги.

Модели являются отправной точкой для создания безопасных, готовых к производству приложений генеративного ИИ, обучаются на ответственных наборах данных и работают с производительностью, сопоставимой с гораздо более крупными моделями. Это делает их идеальными для развертывания на предприятиях.

Многоязыковые возможности являются ключевым отличием моделей Nemotron-3 8B. Из коробки эти модели поддерживают более 50 языков, включая английский, немецкий, русский, испанский, французский, японский, китайский, корейский, итальянский и голландский.

Ускоренная настройка и развертывание

Предприятиям, использующим генеративный ИИ в бизнес-функциях, нужен AI foundry для настройки моделей под свои уникальные приложения. AI foundry от NVIDIA включает три элемента - NVIDIA AI Foundation Models, фреймворк и инструменты NVIDIA NeMo и суперкомпьютерные сервисы NVIDIA DGX Cloud AI. Вместе они представляют собой комплексное корпоративное предложение для создания пользовательских генеративных моделей ИИ.

Важно, что предприятия владеют своими индивидуальными моделями и могут развернуть их практически в любом месте на ускоренных вычислениях с безопасностью, стабильностью и поддержкой корпоративного уровня с помощью ПО NVIDIA AI Enterprise.

Модели NVIDIA AI Foundation свободно доступны для экспериментов в каталоге NVIDIA NGC и Hugging Face, а также размещены в каталоге моделей Microsoft Azure AI.

Эта статья является экземпляром Текста-спринтера. Такие тексты отлично продвигают сайты в ТОП органического поиска Яндекс и Google. Здесь я пишу об этом более подробно.