Как Sparkify от Google использует Gemini и Veo 3?
Обновлено 09 июля 2025 - 20 дней назад. Источник - Testingcatalog.com.

Google продолжает развивать свой эксперимент Sparkify, впервые представленный на Google I/O и пока доступный только через лист ожидания. Sparkify позиционируется как самостоятельный инструмент, а не просто продолжение предыдущих проектов, таких как Google Illuminate, который стал пионером в создании подобных образовательных видео, созданных искусственным интеллектом. Интерфейс состоит из трех основных разделов: Explore, Generate и My Library.

На странице Explore представлены тематические короткие видеоролики, обычно продолжительностью около двух минут, например, о происхождении напитков или причудливых достопримечательностях, созданные с помощью искусственного интеллекта в различных визуальных стилях, таких как мультфильм, оригами, аниме и реализм. Видео могут быть вертикальными или горизонтальными, что очень похоже на форматы TikTok или Instagram Reels. Каждое видео сочетает в себе звук и визуальные эффекты, чтобы рассказать короткую историю или объяснить тему. Последовательное использование одних и тех же персонажей в разных видеороликах наводит на мысль о новом подходе к их сохранению и воспроизведению, на основе подсказок или шаблонов.
В основе Sparkify лежат новейшие модели искусственного интеллекта Google - Gemini и Veo. Включение Gemini намекает на более сложный конвейер, который, вероятно, занимается сборкой контента и структурированием истории, в то время как Veo обеспечивает генерацию видео. При опробовании функции генерации пользователям предлагаются элементы управления, позволяющие задать тему, визуальный стиль и настроение. На выбор предлагаются такие варианты, как фетр, глина, оригами, 3D-мультфильм, аниме и реализм, а также такие настроения, как восхитительное, спокойное или смешное. На данном этапе, фактический результат представляет собой статичное демонстрационное видео, не реагирующее на подсказки пользователя, что оставляет без ответа ключевые вопросы об эффективности подсказок и ограничениях модели.

Учитывая длину и качество выходных данных Sparkify, есть предположение, что он генерирует более короткие клипы, а затем сшивает их вместе. Возможно, здесь работает технология сшивки от Gemini. Такой подход позволит создавать более длинные и цельные истории, не выходя за рамки существующих ограничений генеративного ИИ на длину видео. Согласованность дизайна персонажей в видеороликах поддерживает идею о том, что создатели могут разрабатывать фирменных персонажей или темы для социальных сетей, создавая новые типы каналов контента, под управлением ИИ.
Пока что Sparkify остается экспериментом только для приглашенных и не имеет даты выхода. Его нынешний статус отражает постоянное внимание Google к медиа-инструментам, управляемым искусственным интеллектом, и позволяет понять, как Gemini и Veo могут быть использованы для быстрого создания тематических видеороликов для образования или развлечений. TestingCatalog следит за тем, как эти видео, созданные искусственным интеллектом, работают на таких платформах, как TikTok, поскольку Google продолжает дорабатывать их перед широким распространением.
Эта статья является экземпляром CROSS-текста. Такие тексты отлично продвигают сайты в ТОП органического поиска Яндекс и Google. Здесь я пишу об этом более подробно.

Искренне Ваш,
Nikita Interactive
Комментарии (0)
Ссылки по теме
Это реальная история!
Раздел с CROSS-текстами дополнительно привлек 18 090 пользователей за 9 месяцев.
На новом сайте. Без ссылок.