Новий інструмент штучного інтелекту (ШІ) може генерувати зображення менш як за дві секунди. Для його роботи не потрібне дороге обладнання.
Південнокорейські вчені використовували спеціальну техніку, відому як дистиляцію знань, для стиснення розміру моделі генерації зображень з відкритим вихідним кодом Stable Diffusion XL. Вона має 2,56 млрд параметрів, або змінних, які ШІ використовує для навчання.
Найменша версія нової моделі, яку розробники назвали KOALA, має всього 700 млн параметрів. Вона досить компактна, щоб працювати швидко та без необхідності дорогого та енергоємного обладнання.
Інструмент може працювати на недорогих графічних процесорах (GPU) та вимагає приблизно 8 ГБ оперативної пам’яті для обробки запитів.
Під час експериментів KOALA генерувала зображення на основі промту «зображення астронавта, який читає книгу під місяцем на Марсі» за 1,6 секунди. Згідно з заявою, DALL·E 2 від OpenAI потрібно на те саме завдання 12,3 секунди, а DALL·E 3 — 13,7 секунди.
Інженери опублікували результати роботи у статті на базі даних препринтів arXiv . Вони також зробили проєкт доступним через репозиторій штучного інтелекту з відкритим кодом Hugging Face.
Джерело: Cikavosti