Apple представила открытую модель ИИ для редактирования изображений

Apple продемонстрировала свои возможности в области искусственного интеллекта (ИИ) с новой открытой моделью MLLM-Guided Image Editing (MGIE) для редактирования изображений. Эта модель использует мультимодальные модели больших языков (MLLM), чтобы интерпретировать текстовые команды при редактировании изображений.

С помощью MGIE пользователь может редактировать фотографии, вводя текстовые команды. Например, можно попросить улучшить изображение пиццы, и ИИ интерпретирует это как «добавить овощные топпинги» и редактирует фото соответственно.

Помимо значительных изменений, MGIE также умеет обрезать, изменять размер и вращать фотографии, а также улучшать их яркость, контраст и цветовой баланс. Этот инструмент также может редактировать конкретные области фотографии, изменять внешность человека или удалять элементы из заднего плана.

Модель была представлена в открытый доступ через GitHub, и пока не ясно, планирует ли Apple интегрировать полученные знания в свои продукты.

Apple

Источник: Ferra