Google выпустила Gemini 2.0
Google представила новую версию своей модели Gemini — 2.0, которая стала важным шагом в развитии мультивводов и интеграции ИИ в повседневные задачи. Вот ключевые новшества и их возможности.
Gemini 2.0 Flash — это новая экспериментальная модель с улучшенной производительностью, работающая в два раза быстрее предыдущей версии Gemini 1.5 Pro. Она поддерживает:
- мультивводы и выводы: работа с текстом, изображениями, видео и аудио, включая их генерацию.
- реализацию кодов и интеграцию с интернетом: выполнение пользовательских функций и нативный поиск в Google.
- генерацию изображений: модель может не только создавать изображения, но и редактировать их в контексте без использования сторонних инструментов (функция доступна только бета-тестерам, полноценный релиз для всех обещают в начале следующего года).
Новый Streaming API: фантастика в реальном времени
Особенность Gemini 2.0 — Streaming API, который позволяет работать с аудио- и видеопотоками в реальном времени:
- дновременная обработка звука и изображения: модель может анализировать потоковые данные, будь то изображение с камеры, видеозапись или захват экрана.
- голосовые ответы: поддержка многозадачного текст-в-голос (TTS), что делает взаимодействие естественным.
- исполнение кода и интернет-поиск: выполнение команд, поиск информации и взаимодействие с данными через API.
Подключив стрим с камеры или экрана, можно получить мгновенный анализ и рекомендации.
Приложения для разработчиков
Gemini 2.0 Flash доступна разработчикам через Google AI Studio, Vertex AI и Multimodal Live API. Инструменты включают:
- глубокое исследование (Deep Research): помогает структурировать сложные данные и создавать отчёты.
- мгновенный мультимодальный ввод: текст, изображения, аудио и видео для создания интерактивных приложений.
Новые исследовательские проекты
Google представила три новых прототипа на базе Gemini 2.0:
- Project Astra: универсальный ассистент, поддерживающий мультиязыковый диалог, работу с акцентами и использование инструментов Google.
- Project Mariner: AI для браузера, который анализирует содержимое страниц и выполняет задачи, такие как заполнение форм.
- Jules: ассистент для разработчиков, интегрированный с GitHub, автоматизирующий написание кода.