ИИ Google научился обрабатывать большие объемы текста и видео

Google представил обновленную версию своей модели искусственного интеллекта (ИИ) под названием Gemini 1.5 Pro, которая, по заявлению компании, способна обрабатывать больше текста и видео по сравнению с продуктами конкурентов. Новая модель будет доступна клиентам облачных услуг и разработчикам для тестирования и создания коммерческих приложений.

С момента успеха ChatGPT от OpenAI в конце 2022 года, Google стремится продемонстрировать свою силу в передовых технологиях генеративного ИИ. Gemini 1.5 Pro, среднеразмерная версия новой модели ИИ, демонстрирует производительность, сопоставимую с более крупной моделью Gemini 1.0 Ultra.

Модель способна обрабатывать запросы, касающиеся до часа видео, 11 часов аудио или более 700 000 слов в документе. Google утверждает, что это «самое длинное окно контекста» среди крупных моделей ИИ. Тем не менее, Google признает, что, как и все генеративные модели, Gemini 1.5 Pro не всегда дает идеальные ответы, иногда медленно работает и не всегда понимает намерения пользователей.

В предварительной версии Google продемонстрировала, как Gemini 1.5 Pro обрабатывает запросы на поиск цитат в транскриптах событий, таких как полет Apollo 11, или сцены в фильме Бастера Китона, исходя из грубого эскиза. Google также сообщила о расширении доступа к крупной модели Gemini 1.0 Ultra для более широкого круга клиентов.

Источник: Ferra