Нейросеть Google Gemini научилась «фотошопить» изображения

Компания Google представила новую функцию для своей нейросети Gemini, которая теперь способна редактировать изображения прямо в окне чата с пользователем. Обновлённая модель успешно использует возможности так называемой генерации изображений на основе текста и модификации уже существующих картинок.

С помощью новой функции пользователи могут предоставлять изображение и описывать, какие изменения они хотят внести — например, убрать или добавить объект, поменять фон или изменить цветовую гамму. Gemini интерпретирует эти инструкции и моментально создаёт обновлённую версию изображения.

На демонстрации представители Google показали, как нейросеть удаляет с фотографии предметы, добавляет новые элементы и корректирует композицию, сохраняя общий стиль. При этом пользователю предлагается несколько вариантов результата, из которых он может выбрать наиболее подходящий.

Функция работает в интерфейсе Gemini Advanced — версии чат-бота на базе Gemini 1.5 Pro. В ближайшее время компания планирует интегрировать этот инструмент в другие продукты, включая Google Фото и Google Документы.

По мнению экспертов, нововведение может серьёзно повлиять на область визуального контента, упростив редактирование для как профессиональных дизайнеров, так и для простых пользователей.

Ожидается, что обновление станет доступно широкой публике в ближайшие недели.

Фото аватара

Олег Козлов

Разработчик.
Веб-фреймворки: Symfony, Strapi, Django
Также увлекаюсь NoCode & AI решениями.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *