Улучшенная модель генерации изображений по текстовому описанию будет доступна всем пользователям без ограничений в ближайшее время.
Сбер усовершенствовал свою нейросеть, которая создаёт изображения по текстовому описанию на русском и английском языках. Обновлённая версия Kandinsky 3.1 дообучена на увеличенном датасете изображений, что позволило повысить качество генераций. Первым доступ к Kandinsky 3.1 получил ограниченный круг пользователей: художники, дизайнеры, блогеры.
Александр Ведяхин, первый заместитель Председателя Правления Сбербанка: «Сегодня ровно год, как вышла версия Kandinsky 2.1. За это время мы постоянно развивали нашу нейросеть, которая помогает людям создавать новые образы и даёт абсолютно каждому феноменальные возможности для творчества. По сравнению с предыдущей моделью Kandinsky 3.1 стал ещё быстрее, удобнее и реалистичнее. Kandinsky 3.1 — это гибкий, многофункциональный и абсолютно бесплатный инструмент, который превратит любого человека в художника и творца. Скоро все желающие смогут протестировать новые возможности нейросети. Как и предыдущие версии, модель будет бесплатной и доступна на разных поверхностях».
![](https://api.top68.ru/attachments/ccd8438c7b3dabfbe03bfbeddc412ae68df06c24/store/crop/0/0/1284/856/1284/856/0/c4e9cd7ee74ecf615f660b3d24b5f13769219459235738c53ea2173e8ad4/Kandinsky2_%D1%84%D0%BE%D1%82%D0%BE+%D0%BF%D1%80%D0%B5%D1%81%D1%81-%D1%81%D0%BB%D1%83%D0%B6%D0%B1%D1%8B+%D0%A1%D0%B1%D0%B5%D1%80%D0%B0.png)
![](https://api.top68.ru/attachments/ccd8438c7b3dabfbe03bfbeddc412ae68df06c24/store/crop/0/0/1284/856/1284/856/0/c4e9cd7ee74ecf615f660b3d24b5f13769219459235738c53ea2173e8ad4/Kandinsky2_%D1%84%D0%BE%D1%82%D0%BE+%D0%BF%D1%80%D0%B5%D1%81%D1%81-%D1%81%D0%BB%D1%83%D0%B6%D0%B1%D1%8B+%D0%A1%D0%B1%D0%B5%D1%80%D0%B0.png)
Одной из ключевых особенностей версии стала более высокая скорость генерации картинок: время одной генерации сократилось почти в 10 раз, а разрешение генераций можно повысить до 4K. Также появилась возможность улучшения текстового запроса с помощью языковой модели. Пользователям снова будут доступны функции создания различных вариаций изображений, смешивание картинок и текста, создание стикерпаков и возможность вносить локальные изменения на картинке, не меняя всей композиции сцены (ControlNet).
Узнать технические детали о модели, подходах к обучению и посмотреть примеры генераций можно в статье на «Хабре».
![](https://api.top68.ru/attachments/e4643052bade74b2a1921fdaf25efeb3dfed4a95/store/crop/18/0/1462/975/1462/975/0/90ded4d9f11b669443addfd2c2f39dd0c938b27a1c1f122b278eb5a6f22b/Kandinsky3_%D1%84%D0%BE%D1%82%D0%BE+%D0%BF%D1%80%D0%B5%D1%81%D1%81-%D1%81%D0%BB%D1%83%D0%B6%D0%B1%D1%8B+%D0%A1%D0%B1%D0%B5%D1%80%D0%B0.png)
![](https://api.top68.ru/attachments/e4643052bade74b2a1921fdaf25efeb3dfed4a95/store/crop/18/0/1462/975/1462/975/0/90ded4d9f11b669443addfd2c2f39dd0c938b27a1c1f122b278eb5a6f22b/Kandinsky3_%D1%84%D0%BE%D1%82%D0%BE+%D0%BF%D1%80%D0%B5%D1%81%D1%81-%D1%81%D0%BB%D1%83%D0%B6%D0%B1%D1%8B+%D0%A1%D0%B1%D0%B5%D1%80%D0%B0.png)
Также в ближайшее время появится новая модель Kandinsky Video 1.1 для генерации видео по текстовым описаниям. Удалось существенно повысить качество генераций за счет увеличения объема обучающего датасета пар «текст-видео» и архитектурных улучшений модели. Внесённые изменения также позволили повысить разрешение видео в два раза по сравнению с Kandinsky Video 1.0.
Модель разработана командой Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённых датасетах Sber AI и компании SberDevices.