В Китае создали нейросеть, которая по текстовому описанию создаёт короткие видео — “гифки».
Система называется CogVideo. Нейросеть обучили на основе 5,4 млн пар текстов-видео. На основании текста алгоритм создаёт GiF с частотой кадров 32 за 4 секунды.
Китайские специалисты используют наработки DALL-E 2 от OpenAI и Imagine от Google, генерирующую изображения по текстовому описанию, а DALL-E 2 улучшает их качество.
Источник: Ferra