На недавней презентации Google анонсировала новейшие модели искусственного интеллекта — Veo 3 и Imagen 4, которые обещают революционизировать создание контента. Новинки интегрированы в сервиса Flow, предоставляя пользователям возможность создавать видео и изображения высокой детализации и реализма с помощью нейросетей.
Veo 3 является передовой моделью для генерации видео с улучшенной физикой и поддержкой 4K разрешения. Она обеспечивает нативную генерацию аудио, включая речь персонажей, фоновые звуки и музыкальные композиции, как было продемонстрировано в начале презентации. Также поддерживается использование кинематографических команд для большей гибкости в создании видео.
Imagen 4 концентрируется на создании изображений с высокой степенью детализации и разрешением 2K. Эта модель может генерировать широкий спектр стилей — от фотореалистичных изображений до абстрактных композиций.
Музыкальный AI Sandbox, использующий модель Lyria 2, позволяет создавать музыку по текстовым запросам пользователей. Новый инструмент способен не только создавать оригинальные композиции, но и производить ремиксы существующих треков.
Все созданные материалы обозначаются SynthID водяными знаками, удостоверяя, что они были сгенерированы с помощью нейросетевого интеллекта. По словам представителей компании, Google активно сотрудничает с киноиндустрией и музыкантами, чтобы сделать инновационные AI-инструменты доступными для широкой общественности.