Pull to refresh

В Nvidia показали обучение нейросетей на небольшом наборе данных

Reading time2 min
Views2.4K
image

В Nvidia Research представили модель искусственного интеллекта, которая использует ограниченный набор данных для обучения генеративных нейросетей и способна подражать известным художникам.
Total votes 6: ↑5 and ↓1+4
Comments0

Дизайнер нагенерировал жуков нейросетью StyleGAN

Reading time2 min
Views11K

Источник: cunicode

Бернат Куни, исследователь в области цифрового дизайна и экодизайна, работающий в студии cunicode, обучил нейросеть на иллюстрациях жуков, которые он взял из энциклопедии. После этого машина смогла сгенерировать собственные изображения.
Читать дальше →
Total votes 20: ↑16 and ↓4+12
Comments9

Нейродайджест: главное из области машинного обучения за декабрь 2021

Reading time4 min
Views4.6K

Генерация 3D-моделей из текстового описания и видеозаписей, сделанных на обыкновенный смартфон, конкурент DALL-E, ускоренная GAN-инверсия и многое другое в подборке материалов за декабрь, а также небольшие новости о будущем дайджеста.

Перейти к обзору
Total votes 12: ↑12 and ↓0+12
Comments7

Подборка статей о машинном обучении: кейсы, гайды и исследования за октябрь 2020

Reading time6 min
Views4.3K


В октябре традиционно в центре внимания вновь GPT-3. С моделью от OpenAI связано сразу несколько новостей — хорошая и не очень.
Читать дальше →
Total votes 15: ↑15 and ↓0+15
Comments1

Neural network Telegram bot with StyleGAN and GPT-2

Reading time3 min
Views5.1K

The Beginning


So we have already played with different neural networks. Cursed image generation using GANs, deep texts from GPT-2 — we have seen it all.


This time I wanted to create a neural entity that would act like a beauty blogger. This meant it would have to post pictures like Instagram influencers do and generate the same kind of narcissistic texts. \


Initially I planned to post the neural content on Instagram but using the Facebook Graph API which is needed to go beyond read-only was too painful for me. So I reverted to Telegram which is one of my favorite social products overall.


The name of the entity/channel (Aida Enelpi) is a bad neural-oriented pun mostly generated by the bot itself.


One of the first posts generated by Aida

Read more →
Rating0
Comments1

ComputerVision и стиль

Reading time9 min
Views22K

Несколько месяцев назад я писал статью про тихую революцию в ComputerVision - про трансформеры. А сейчас я хочу поговорить про другую революцию в CV. Уже не такую тихую (статьи тут куда более известные). Рассказ будет про GAN'ы. Как ими сегодня умеют управлять, и что достигли. В первую очередь это StyleGan и его производные.
В последний год-полтора появилось много различных способов управлять GAN-сетями и улучшилось их качество. Ещё чуть чуть и… Что? Можно будет генерить фильмы по описанию? Игры? Нужно ли будет рисовать крутые текстуры, или их можно будет создать?Попробую показать куда дошла современная технология, и чего ожидать от GAN’ов.

Читать далее
Total votes 66: ↑66 and ↓0+66
Comments13

Обучение рукописной OCR на синте от GAN'ов

Reading time13 min
Views6.3K

Модели распознавания печатного текста (например, с фотографий документов) дают довольно высокие результаты. Это происходит за счёт ограниченного набора шрифтов, цель которых – быть максимально понятными человеку, а также благодаря генерации простой синтетики в виде печати разнообразными шрифтами текста на каком-нибудь фоне.

С распознаванием рукописных материалов дело немного сложнее. У каждого человека свой почерк, который ещё и может меняться с течением времени. Причём вариативность почерков довольно существенная, и часто мы с трудом читаем то, что написал, скажем, врач или ребёнок. Человек с течением жизни может сформировать свои привычки писать ту или иную букву определённым образом (конкретной высоты, наклона, формы и др.), причем эта буква будет такой только у одного человека. Подобную синтетику уже нельзя сымитировать, накладывая печатные шрифты на фон.

Тут же возникает трудность и с разметкой (которой особенно мало на русском языке). Например, при работе с рукописями Петра I пришлось задействовать историков. Конечно, это особый случай документов начала XVIII века, но даже в простых датасетах важно иметь дублирующую разметку нескольких человек для исправления ошибок, которые нередко совершают разметчики при чтении рукописного текста.

Мы в Sber AI заинтересовались идеей генерации синтетических рукописных изображений с помощью GAN, и в этой статье предлагаю рассмотреть несколько таких моделей. А также попробуем сгенерировать синтетику, используя одну из архитектур, и посмотрим, как сильно дополнительные данные улучшают качество OCR-модели (Optical Character Recognition).

Читать далее
Total votes 14: ↑14 and ↓0+14
Comments3

От Style Transfer до диффузии: эволюция визуальных эффектов на смартфонах

Level of difficultyMedium
Reading time11 min
Views2.2K


Четыре года я занимаюсь разработкой различных спецэффектов для фото и видео в мобильных приложениях. Вроде бы это локальная и как бы несерьезная тема, но одну только плачущую маску в Snapchat посмотрели 9 млрд раз. Такие штуки пользуются бешеной популярностью и здорово повышают виральность мобильных приложений, но с каждым годом удивлять людей становится все сложнее.


В этой статье я разберу эволюцию видеоэффектов, поделюсь наблюдениями и раскрою пару инсайдов о том, как перенести стилизацию изображения из StableDiffusion на смартфоны.

Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments1