Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском

Сбер представил обновленную версию нейросети Kandinsky Image — теперь генератор изображений умеет создавать картинки с надписями на русском языке.

Отныне Kandinsky Image поддерживает создание текста на кириллице, вписанный в контекст изображения. То есть надписи генерируются не просто поверх картинки, а органично сочетаются с окружением, материалами и освещением. Например, можно создать изображение с текстом, нарисованным на стене, выпиленным из дерева, отлитым из металла, вышитым, связанным или выложенным лепестками роз.

Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском

Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском

Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском

Разработчики сообщили, что для новой функции Kandinsky Image пришлось дообучить на базе данных из 10 млн изображений с русским текстом, написанным самыми разными способами, чтобы модель различала печатные, прописные и какие угодно буквы.

На данный момент процесс обучения продолжается — нейросеть все еще может генерировать с ошибками, особенно если требуется картинка с длинной надписью. Однако в «Сбере» предоставляют гарантию — неудачные генерации не расходуют дневной лимит, так как их можно «вернуть» в течение 14 дней с момента создания.

Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском

Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском

Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском

Потестировать новую версию Kandinsky Image самостоятельно уже можно в Telegram-боте Kandinsky и во всех ботах GigaChat (Telegram, ВКонтакте, Одноклассники, MAX), а также в веб-версии.

  • Сбербанк
  • Искусственный интеллект
  • Нейросети

Источник: hi-tech.mail.ru

Like this post? Please share to your friends:
QuestionAI
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: