ИИ-редактор изображений Apple может опробовать кто угодно

Apple совместно с исследователями из Калифорнийского университета в Санта-Барбаре (UCSB) представила инструмент для редактирования фотографий с помощью искусственного интеллекта под названием Multimodal Large Language Model Guided Image Editing (MGIE). Пока инструмент официально не выпущен, но любопытные пользователи уже могут поэкспериментировать с ним на GitHub.

В отличие от традиционного программного обеспечения для редактирования изображений, MGIE использует ИИ для интерпретации текстовых инструкций для редактирования изображений. Этот подход направлен на улучшение взаимодействия пользователя с системой искусственного интеллекта, что приводит к более «точным и детальным» результатам редактирования.

По словам исследователей, MGIE использует ИИ для уточнения инструкций пользователя, делая их более явными и описательными. Этот дополнительный уровень интерпретации значительно улучшает процесс редактирования, что продемонстрировали экспериментальные результаты, опубликованные на сайте arXiv.

Хотя официальный релиз MGIE остается под вопросом, Apple выложила версию программы с открытым исходным кодом на GitHub. Заинтересованные пользователи могут получить доступ к инструменту и поэкспериментировать с его возможностями, запустив его даже локально на своем ПК или воспользовавшись версией, размещенной на Hugging Face. Однако стоит отметить, что в периоды пиковой нагрузки инструмент может работать медленно.

Источник: Ferra