Обновлено 12.12.2024 Новости #Нейросети #Google

Google выпустила Gemini 2.0

Google представила новую версию своей модели Gemini — 2.0, которая стала важным шагом в развитии мультивводов и интеграции ИИ в повседневные задачи. Вот ключевые новшества и их возможности.

Gemini 2.0 Flash — это новая экспериментальная модель с улучшенной производительностью, работающая в два раза быстрее предыдущей версии Gemini 1.5 Pro. Она поддерживает:

  • мультивводы и выводы: работа с текстом, изображениями, видео и аудио, включая их генерацию.
  • реализацию кодов и интеграцию с интернетом: выполнение пользовательских функций и нативный поиск в Google.
  • генерацию изображений: модель может не только создавать изображения, но и редактировать их в контексте без использования сторонних инструментов (функция доступна только бета-тестерам, полноценный релиз для всех обещают в начале следующего года).

Новый Streaming API: фантастика в реальном времени

Особенность Gemini 2.0 — Streaming API, который позволяет работать с аудио- и видеопотоками в реальном времени:

  • дновременная обработка звука и изображения: модель может анализировать потоковые данные, будь то изображение с камеры, видеозапись или захват экрана.
  • голосовые ответы: поддержка многозадачного текст-в-голос (TTS), что делает взаимодействие естественным.
  • исполнение кода и интернет-поиск: выполнение команд, поиск информации и взаимодействие с данными через API.

Подключив стрим с камеры или экрана, можно получить мгновенный анализ и рекомендации. 

Приложения для разработчиков

Gemini 2.0 Flash доступна разработчикам через Google AI Studio, Vertex AI и Multimodal Live API. Инструменты включают:

  • глубокое исследование (Deep Research): помогает структурировать сложные данные и создавать отчёты.
  • мгновенный мультимодальный ввод: текст, изображения, аудио и видео для создания интерактивных приложений.

Новые исследовательские проекты

Google представила три новых прототипа на базе Gemini 2.0:

  1. Project Astra: универсальный ассистент, поддерживающий мультиязыковый диалог, работу с акцентами и использование инструментов Google.
  2. Project Mariner: AI для браузера, который анализирует содержимое страниц и выполняет задачи, такие как заполнение форм.
  3. Jules: ассистент для разработчиков, интегрированный с GitHub, автоматизирующий написание кода.

Свежие новости

Все новости

В нашем Telegram-канале свежие новости о SMM, создании контента и креаторах. Около 5 постов в неделю. Кратко и с картинками.

Подписаться