Gemini 2.0 Flash упрощает создание и редактирование изображений
Google представила обновленную нейросеть Gemini 2.0 Flash, которая теперь способна генерировать и редактировать изображения по текстовым запросам.
Пользователи могут вносить изменения в изображения в формате диалога, сохраняя контекст на протяжении всей беседы.
Обычно в ответ на просьбу исправить картинку ИИ-модели создают новую генерацию, при этом она может сильно отличаться от исходника. Gemini 2.0 Flash же редактирует первоначальное изображение.
Основные функции Gemini 2.0 Flash:
-
Генерация изображений по тексту: модель создает визуальный контент на основе текстовых описаний, что полезно для иллюстрации рецептов или создания персонажей для игр.
-
Редактирование изображений в реальном времени: пользователи могут изменять конкретные элементы изображения без полной регенерации, что делает процесс редактирования более интуитивным.
- Раскрашивание и замена фона: модель способна раскрашивать черно-белые фотографии и заменять фон на изображениях, что расширяет возможности для творчества.
Опробовать Gemini 2.0 Flash можно в AI Studio от Google, выбрав в настройках «Формат вывода» опцию «Изображение и текст».