Компания Google представила новую функцию для своей нейросети Gemini, которая теперь способна редактировать изображения прямо в окне чата с пользователем. Обновлённая модель успешно использует возможности так называемой генерации изображений на основе текста и модификации уже существующих картинок.
С помощью новой функции пользователи могут предоставлять изображение и описывать, какие изменения они хотят внести — например, убрать или добавить объект, поменять фон или изменить цветовую гамму. Gemini интерпретирует эти инструкции и моментально создаёт обновлённую версию изображения.
На демонстрации представители Google показали, как нейросеть удаляет с фотографии предметы, добавляет новые элементы и корректирует композицию, сохраняя общий стиль. При этом пользователю предлагается несколько вариантов результата, из которых он может выбрать наиболее подходящий.
Функция работает в интерфейсе Gemini Advanced — версии чат-бота на базе Gemini 1.5 Pro. В ближайшее время компания планирует интегрировать этот инструмент в другие продукты, включая Google Фото и Google Документы.
По мнению экспертов, нововведение может серьёзно повлиять на область визуального контента, упростив редактирование для как профессиональных дизайнеров, так и для простых пользователей.
Ожидается, что обновление станет доступно широкой публике в ближайшие недели.