Что такое SORA AI? Это инструмент для генерации видео по текстовому запросу. Уточню, что это не первая такая разработка. Можно вспомнить Runaway ML Gen 2, который, несмотря на недостатки с пальцами и ошибками при крупном плане, выдает хороший результат. Или Genmo, способный создавать плавную анимацию одиночных объектов, но пасующий в ситуации, если их несколько. Ключевое отличие разработки Open AI в том, что она генерирует видео в высоком качестве и в любом стиле, при этом не теряет нить сюжета. SORA AI обучают на пространственно-временных патчах — то есть разбивают видео на кубы с характеристиками, и нейросеть на основе этого должна предсказать патч. Результат этого и выдается по запросу. Технология позволила расширить видеотеку, по которой можно обучаться.
Попробуем представить перспективы применения этого инструмента. Не нужно иметь специальное образование, чтобы писать запросы для нейросети, так как она сама переформулирует заданное под свою задачу. Сейчас ИИ выдает несколько секунд видео, которые в каждом последующем запросе можно развивать до нужного хронометража. Однако людям удалось научить ИИ не совершать ошибку, изображая человека с большим, чем пять количеством пальцев на одной руке и ноге, поэтому преодоление этого барьера — вопрос времени.
Сторонние разработчики реализовали возможность добавлять к видео звук, прокачав возможности пользователя. Пройдет немного времени и другие нейросети (Chat GPT, Character.ai) смогут писать полноценные сценарии с сюжетными поворотами и собственной философией.
Разумеется, это повлияет на индустрию развлечений. В создании коротких видео заинтересованы анимационные студии — подобный инструмент поможет им ускорить и удешевить процесс производства контента. Внешний вид, походка, особенности движений, физика тела персонажей — все это смогут генерировать нейросети.
Также SORA AI повлияет на разработку игр, в особенности тех, где используется открытый мир. Для их создания разработчики применяют процедурную генерацию, когда ландшафт, окружение, персонажи и другие детали генерируется автоматически, что помогает сэкономить время и человеческие ресурсы дизайнеров. Однако для генерации применяется ограниченный набор элементов и скриптов, что выливается в однообразие. Нейросеть поможет решить эту проблему. Эксперты отмечают, что подобная практика лишь вопрос времени, а студии уже вовсю интегрируют инструменты ИИ в процесс разработки игр.
Сейчас генеративный ИИ позиционируется как инструмент, но некоторые вещи он уже может делать полностью самостоятельно, обеспечивая приличный результат. Это подтверждают в том числе примеры использования нейросетей в кинопроизводстве, играх и рекламе.
Приведу пример российского сериала «ПМЖейсон», где «приняли участие» Джейсон Стейтэм и Киану Ривз — с помощью технологии дипфейка их лица наложили на лица настоящих актеров. Голографические концерты казались вам странностью? То ли еще будет! Поскольку шоу легкое и юмористического характера, то аудитория восприняла его тепло, о чем говорят положительные отзывы. Некоторые пользователи не смогли отличить дипфейк от реальности и спрашивали, как удалось зазвать звезд в Россию.
ИИ применяется и для написания сценариев. В частности, нейросеть самостоятельно придумала время, место, реплики и ситуации для сериала «Сидоровы». Режиссер рассказал, что если бы ситуации, придуманные нейросетью, не обыгрывались съемочной группой и актерами, то смотреть такое было бы очень сложно. Сценарий часто бывает лишен логической основы, а действия героев не всегда обоснованы, хотя именно это и способствовало появлению забавных ляпов на съемочной площадке. Получается, что продуктивная интеграция ИИ в творчество возможна.
Также интересный пример: недавно нейросеть Arcads, которая специализируется на создании гиперреалистичных видео, выложила в сеть одно из таких. При просмотре действительно сложно понять, что это все - сгенерировано, многих пользователей напугала настолько правдоподобная замена блогерам. Однако оказалось, что это все же реальная актриса, а вот ее лицо доработала нейросеть. Самостоятельно ИИ пока не может полностью создавать целые и независимые видео, но с помощью людей - вполне. Разработчики предлагают использовать технологию нейросетевых блогеров для создания рекламных кампаний и уникальных персонажей.
В отношении SORA AI высказываются обоснованные опасения. Из комментариев относительно нового инструмента я выделила следующие: возможность использования фотографий без разрешения владельца для генерации запрещенного контента; сокращение рабочих мест; появление новых сложных мошеннических схем; размытие рамок авторского права.
Для того, чтобы защититься от фейков и мошенничества с использованием инструментов ИИ, многие страны внедряют законодательные ограничения в данной сфере. Ведь главная проблема SORA AI и ей подобных в том, что люди не ощущают себя в безопасности. Для того, чтобы вернуть ощущение контроля над ситуацией, платформы вводят обязательным правилом маркировку ИИ-контента.
Впрочем, SORA AI и должна настораживать, ведь это серьезный шаг к чему-то принципиально новому.