С тех пор как OpenAI представила Sora в 2024 году, генеративный искусственный интеллект для создания видео обещал дать возможность со временем создавать реалистичные видеоролики из простых текстовых подсказок. Теперь в игру вступила компания Google, запустившая впечатляющий инструмент под названием Gemini Veo 3, способный создавать дезинформацию катастрофических масштабов.

Недавно я протестировал последнюю, широко разрекламированную модель генерации видео Google Gemini - Veo 3. Включенная в дорогостоящий тарифный план Gemini AI Ultra стоимостью $250 в месяц, Veo 3 способна воспроизводить в движении небольшие, тонко детализированные объекты, такие как нарезанный лук, и генерировать сопровождающее их реалистичное аудио. Это происходит не всегда идеально, но при тщательной калибровке и достаточном количестве генераций Вы можете использовать Veo 3 для создания чего-то, на первый взгляд неотличимого от реальности.

Да, это крутая, глубоко впечатляющая новая технология. Но это и нечто большее. Veo 3 уже представляет собой серьезную угрозу - при этом, всего одно небольшое обновление может произвести революцию в создании подделок, преследовании в Интернете и распространении дезинформации.

Как только Veo 3 получит функцию загрузки изображений, начнется эра дезинформации

При всех улучшениях Veo 3 по сравнению с его предшественником Veo 2, ему не хватает одной ключевой функции: возможности генерировать видео на основе загруженных вами изображений.

Например, с помощью Veo 2 я могу загрузить свою фотографию и создать видео, на котором я работаю за компьютером. Учитывая, что Veo 2 и инструмент Google для создания анимации с помощью искусственного интеллекта Whisk поддерживают эту функцию, кажется, что и Veo 3 в конечном итоге получит ее.

Это означает, что любой человек сможет создавать реалистичные видеоролики, в которых знакомые ему люди делают и говорят то, чего они никогда не делали и, вероятно, никогда не сделают.

Последствия этого очевидны, когда фейковое видео ежедневно распространяются в социальных сетях как лесной пожар. Вам не нравится ваш начальник? Отправьте в отдел кадров ролик, на котором он делает что-то неподобающее. Хотите распространить фальшивые новости? Опубликуйте фальшивую пресс-конференцию. Ненавидите свою бывшую? Запечатлейте, как она делает что-то неподобающее, и разошлите это всей её семье. Единственные реальные ограничения - это ваше воображение и ваши моральные принципы.

Если для создания видео с реальным звуком требуется всего несколько кликов, а стоит оно немного (или вообще ничего), сколько людей будут злоупотреблять этой функцией? Даже если речь идет о ничтожном меньшинстве пользователей, это все равно создает большой потенциал для хаоса.

Google несерьезно относится к модерации

Как и следовало ожидать, Google накладывает некоторые ограничения на то, что можно и чего нельзя делать с помощью Gemini. Однако, похоже, что компания является недостаточно строгой в этом отношении.

Из всех чат-ботов, которые я тестировал в крупных технологических компаниях, Gemini от Google, имеет самые слабые ограничения. В теории, он не должен генерировать сексуализированный контент, но по вашему запросу он предоставит изображение человека в пляжном или нижнем белье. Gemini не должен пропагандировать незаконную деятельность, но если вы попросите, он выдаст список лучших торрент-сайтов.

ChatGPTJailbreak subbreddit sorted by top

Что происходит, когда и без того слабые ограничения Google наталкиваются на онлайн-сообщество, намеренное их нарушить? Возьмем, к примеру, ChatGPTJailbreak, который входит в топ-2% сабреддитов по размеру. Это сообщество посвящено "разблокировке ИИ в разговоре, чтобы заставить его вести себя так, как он обычно не вел бы себя из-за встроенных защитных механизмов". Что единомышленники будут делать с Veo 3?

Как справиться с новой нормой Veo 3

На каждую систему водяных знаков для контента SynthID AI, представленную Google, появляются сторонние сайты и онлайн-руководства по удалению водяных знаков. На каждый чатбот с ограничениями и защитами находится свой FreedomGPT без них. Даже если Google заблокирует Gemini таким количеством фильтров, что вы даже не сможете создать видео с милым котенком, мало что остановит хакеров и желающих избавиться от цензуры чат-ботов, когда создание видео в стиле Veo 3 станет мейнстримом.

Десятилетиями в сети появлялись небрежные, отфотошопленные изображения, на которых реальные люди делали то, чего они никогда не делали, - это просто часть жизни в цифровую эпоху. Соответственно, вы должны проверять на достоверность все, что видите в сети, что кажется слишком ужасным или слишком хорошим, чтобы быть правдой. Это новая норма для генерации видео Veo 3: вы не можете воспринимать любой видеоклип, который вы видите, как реальную вещь, если он не от авторитетной новостной организации или другой третьей стороны, которой вы можете доверять.

Генерация видео в Veo 3 от Gemini - это только первый шаг к широкодоступной, действительно реалистичной генерации видео с помощью ИИ. Модели видеогенераторов ИИ будут становиться все более реалистичными, предлагать все больше функций и распространяться все шире. Уже прошли те времена, когда видеодоказательство чего-либо было неопровержимой истиной. Если правда еще не умерла, то теперь она требует тщательной проверки.

Эта статья является экземпляром CROSS-текста. Такие тексты отлично продвигают сайты в ТОП органического поиска Яндекс и Google. Здесь я пишу об этом более подробно.

Nikita Interactive, founder

Искренне Ваш,

Nikita Interactive

Комментарии (0)

Ссылки по теме

Это реальная история!

Раздел с CROSS-текстами дополнительно привлек 18 090 пользователей за 9 месяцев.

На новом сайте. Без ссылок.