Зачем DataStax Data API подключает каналы проверки к генеративному ИИ?
Обновлено 02 января 2025 - 6 дней назад. Forbes.com.
Программные соединения. Когда мы используем корпоративные компьютерные системы на самом эффективном уровне, мы, как правило, соединяем приложения с другими приложениями, другими службами данных, другими операционными системами и компонентами приложений. Если вы когда-нибудь сталкивались с Интернетом, то поймете, почему взаимосвязанность имеет большое значение при работе с приложениями, будь то на настольном компьютере или на смартфоне.
В самих программных приложениях часто используется ставший уже довольно стандартным подход к взаимодействию, известный как интерфейс прикладного программирования (API). Это способ создания связи и канала (некоторые сказали бы "клея") между приложениями предписанным способом (определенным в соответствии с согласованным синтаксисом), который позволяет инженерам-программистам подключать все необходимые штекеры - совсем не похоже на стереотипный образ старомодной телефонной служащей, подключающей кабели на АТС.
Компания DataStax, занимающаяся разработкой векторных баз данных в реальном времени, старается подключить все нужные провода к своему подходу к созданию генеративных приложений искусственного интеллекта. В этом месяце компания представила новый "Data API" (ранее известный как JSON API, аббревиатура, обозначающая JavaScript Object Notion, открытый стандартный формат файлов и формат обмена данными). Технология призвана служить универсальным API для разработки Retrieval Augmented Generation (RAG), который предоставляет все данные и полный стек RAG для создания генеративных приложений ИИ с высокой релевантностью и низкой задержкой.
Что такое Retrieval Augmented Generation (RAG)?
Ключ к созданию проектов по разработке генеративного ИИ, которые имеют существенную связь с внешними источниками информации для обеспечения дополнительной релевантности, своевременности и точности. RAG расширяет сферу и область применения так называемых больших языковых моделей (LLM) путем подключения LLM к внешним источникам проверенных, сертифицированных или, по крайней мере, признанных данных о знаниях. Этот подход к созданию дополнения к ИИ был изначально придуман, предложен и задокументирован родительской компанией Facebook Meta.
Кроме того, в рамках продукта Data API будет обновлен интерфейс разработчика для Astra DB, векторной базы данных компании для создания приложений ИИ производственного уровня.
"Astra DB идеально подходит для разработчиков на JavaScript и Python, упрощая векторный поиск и управление крупномасштабными данными, скрывая мощь Apache Cassandra за удобным, но мощным API", - говорит Эд Ануфф, директор по продуктам DataStax. "Этот выпуск пересматривает способы создания программными инженерами генеративных приложений ИИ, предлагая оптимизированный интерфейс, который упрощает и ускоряет процесс разработки для инженеров ИИ".
Более подробно рассматривая работу продукта, Ануфф объясняет, что новый API и опыт работы с векторными данными делают петабайтные масштабы открытой базы данных Apache Cassandra доступными для разработчиков на JavaScript и Python в более интуитивно понятной форме для разработки ИИ. Ставя во главу угла простоту использования, DataStax утверждает, что теперь, используя поисковую систему JVector, мы можем получить на 20% более высокую релевантность, в 9 раз более высокую пропускную способность и до 74 раз более быстрое время отклика по сравнению с другими векторными базами данных. В стремлении упростить процесс разработки технология теперь представляет собой приборную панель, более эффективную загрузку данных (ведь их ввод - это всегда головная боль), а также инструменты исследования данных и интеграцию с другими фреймворками AI и машинного обучения (ML).
Готовый API искусственного интеллекта
"Разработчики программных приложений могут использовать Data API для создания готовой экосистемы ИИ, которая упрощает интеграцию с основными партнерами по генеративному ИИ, такими как LangChain, OpenAI, Vercel, Vertex AI от Google, AWS, Azure и основными платформами, поддерживая при этом широкий спектр стандартов безопасности и соответствия", - подтвердили Ануфф и его команда. Любой разработчик теперь может поддерживать передовые техники RAG, такие как FLARE [Forward Looking Active REtrieval Augmented Generation] и ReAct, которые должны синтезировать множество ответов и при этом соблюдать SLA по задержкам".
Заглядывая вперед, мы говорим о генеративном ИИ с RAG, который способен делать больше и быть более точным. Мы также говорим о дополнительных техниках, наложенных на RAG, которые делают его более способным знать, "когда" и "если" искать дополнительную информацию в будущем. Другими словами, мы говорим о том, как сделать ИИ более интеллектуальным.
Судя по тому, что мы видим в DataStax - а фактор удобства использования достаточно приятен, но давайте посмотрим глубже - это тот момент, когда мы начинаем продвигать приложения генеративного ИИ вперед с поддержкой векторных баз данных, на которые они опираются как на жизненную силу, и делать их очень гибкими в развертывании данных в реальном времени. Опыт Astra DB позволяет мгновенно запрашивать обновления данных в реальном времени как для векторных, так и для невекторных данных, так что давайте вспомним, откуда мы пришли.
Будет ли теперь телефонная станция с AI API работать бесперебойно (это слово так любят использовать поставщики технологий) и обеспечивать идеальное соединение каждый раз, без пересечений линий и кристально чистый прием от начала и до конца? Только дурак поставит на такой уровень совершенства, даже с искусственным интеллектом в комплекте... подождите, пожалуйста, абонент.
Эта статья является экземпляром Турбо-текста. Такие тексты отлично продвигают сайты в ТОП органического поиска Яндекс и Google. Здесь я пишу об этом более подробно.
Искренне Ваш,
Nikita Interactive
Это реальная история!
Раздел с Турбо-текстами привлек 18 090 пользователей за 9 месяцев.
На новом сайте. Без ссылок.
Измеримые результаты и устойчивый успех.