Pull to refresh
10
0.2

Пользователь

Send message

Обнаружение ботов в социальных сетях при помощи методов машинного обучения

Reading time13 min
Views5.9K

Почти все мы пользуемся социальными сетями. А почему бы и не пользоваться? Они ведь предоставляют так много возможностей! Взять ту же сеть ВКонтакте: можно пообщаться с друзьями, поделиться с подписчиками фотографиями только что сделанного крабового салата, посмотреть видео с котом соседа, вырастить огурцы на виртуальной ферме в каком-нибудь приложении… Сказка! Ой, а кто это в друзья добавляется?

Читать далее
Total votes 16: ↑16 and ↓0+16
Comments5

Как реализовать символьную языковую рекуррентную нейронную сеть

Reading time12 min
Views4.4K


В одном своём гисте Андрей Карпаты сделал кое-что впечатляющее. Чуть больше чем в 100 строках кода на Python — без тяжеловесных фреймворков для машинного обучения — он прописал довольно полную реализацию языковой модели для обучения символьно-ориентированных рекуррентных нейросетей (РНС). Гист включает полное обучение методом обратного распространения с оптимизацией Adagrad. Подробности — к старту флагманского курса по Data Science.

Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments0

Бесплатные системы управления проектами: 15 систем, 70 функций

Reading time9 min
Views5.7K

Привет! Продолжаю стабильно выходить на связь с Хабром раз в несколько лет =) Благо есть повод – пару месяцев назад перешел в новую контору, где снова надо было наладить работу целого отдела сотрудников на удаленке, который раньше как-то справлялся без системы управления задачами. 

И потому я решил повторно провести рисерч на эту тему, чтобы посмотреть как изменился рынок и не появилось ли на нем что-то новенькое и интересное. 

А изменилось на российском рынке систем управления проектами за минувший год чуть менее, чем всё. И это помимо того, что успело измениться еще раньше. Мы с командой перепробовали десятки новых и старых систем. Искали бесплатные и доступные в РФ. Составили себе подборку из 15 систем, и для особо нетерпеливых – свели в одну таблицу по возможностям бесплатных версий. 

Читать далее
Total votes 7: ↑5 and ↓2+3
Comments4

Понимают ли нейронные модели грамматику человеческого языка?

Reading time11 min
Views2.6K

В лингвистике принято считать, что основным свойством языковой способности человека является возможность определять, насколько грамматически корректно предложение. Подобные суждения говорящих о правильности языкового высказывания получили название «оценок грамматичности/ приемлемости». Лингвисты используют суждения о грамматичности для исследования синтаксической структуры предложений.

Читать далее
Total votes 7: ↑7 and ↓0+7
Comments8

Как нарисовать барашка или прикладное нейрохудожество

Reading time7 min
Views7.8K

Потихоньку начнём разговор для понимания приёмов и возможностей нейросетевых инструментов. Они с нами навсегда, неплохо бы разобраться в самом начале.
Для примера выберем, конечно же, девчонок.

Prompth: full frontal, stunning blonde, (perfect face), suggestive, bright smile, gorgeous hair, squat,

Negative prompt: paint, anime, cartoon, art,drawing,3d render, digital painting, body out of frame, ((deformed)), (cross–eyed), (closed eyes), blurry, (bad anatomy), ugly, disfigured, ((poorly drawn face)), (mutation), (mutated), (extra limbs), (bad body)

Перед началом генерирования у вас есть много разных настроек и возможностей . Например запрос может быть и отрицательным - negative prompt, фактически запрет, очень мощный инструмент, в котором описывается чего бы вы не хотели видеть в результате. Как правило туда включают все заклинания призванные исключить появление в результирующем изображении шестипалых рук и множества других мутаций, которые только отнимают ценное время. Рисовать правильные пальцы - это вообще больное место нейросетей, поэтому их часто и не видно в сгенерированных изображениях. Впрочем, продолжим.

На картинке ниже результат работы нейросети от компании StableDiffusion, а именно запрос к парсеру img2img — инструменту, который служит для доработки уже имеющегося изображения. В качестве исходника, был взят мем из сети Интернет. Текст запроса:

Читать далее
Total votes 15: ↑12 and ↓3+16
Comments3

Релиз Invoke AI 2.0 — интерфейса и инструментария для Stable Diffusion (win/linux/mac)

Reading time2 min
Views13K

Привет всем! Сегодня состоялся релиз InvokeAI 2.0: A Stable Diffusion Toolkit, проекта, цель которого — предоставить энтузиастам и профессионалам набор надежных инструментов для создания и редактирования изображений с помощью нейросети. InvokeAI требует всего ~3,5 Гб видеопамяти для создания изображений 512x768 пикселей (и еще меньше для 512х512), и совместим с Windows/Linux/Mac с M1 и M2.

Вау, как круто!
Total votes 24: ↑24 and ↓0+24
Comments17

Как создать переводчик, который переводит лучше, чем Google Translate

Reading time8 min
Views27K

Помню, как еще в школе на Basic я писал программу-переводчик. И это было то время, когда ты сам составлял словарь, зашивал перевод каждого слова, а затем разбивал строки на слова и переводил каждое слово в отдельности. В то время я, конечно же, не мог и представить, как сильно продвинутся технологии, и программы-переводчики станут в основе использовать механизмы глубокого обучения с архитектурой трансформера и блоками внимания.

В этот раз я решил окунуться немного в прошлое и сделать то, что хорошо сделать тогда у меня не получилось.

Читать далее
Total votes 61: ↑61 and ↓0+61
Comments48

Диффузионные Нейросети — самый актуальный подход к генерации изображений

Reading time6 min
Views22K

Метод обратной диффузии поистине является самым нашумевшим в этом году методом генерации изображений нейросетями. Его используют: DALLE 2, Midjourney, imagen и другие актуальные модели 2022 года.

В данной статье мы подробно изучим, что под капотом самых современных генеративных моделей и даже напишем небольшую свою.

Под катом будет много кода, программирования, математики, в общем — всё, как вы любите.
Читать дальше →
Total votes 38: ↑35 and ↓3+47
Comments5

Первый нейросетевой переводчик для эрзянского языка

Reading time10 min
Views12K

Эрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей.
Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и целые предложения.

Пока её качество оставляет желать лучшего, но пробовать пользоваться уже можно.
Как я собирал для этого тексты и обучал модели – под катом.

Читать далее
Total votes 55: ↑54 and ↓1+68
Comments20

Загадка появления ранних сверхмассивных чёрных дыр решена

Reading time9 min
Views31K

Загадка появления ранних сверхмассивных чёрных дыр много лет ставила в тупик астрономов. И вот, наконец, мы поняли, откуда они появились.




Всего на 0,15 квадратных градусах небосвода можно найти множество участков, содержащих большое количество галактик, группирующихся в скопления и филаменты, между которыми есть лишь пустоты, или войды. Каждая светлая точка на этом снимке – это сверхмассивная чёрная дыра (да, их настолько много). Этот участок космоса назвали ECDFS, поскольку ранее его рассматривали в рамках проекта Extended Chandra Deep Field South – это новый взгляд в рентгеновском диапазоне на изученный ранее участок.

Что, если бы мы могли заглянуть в прошлое любого человека с нашей планеты и увидеть их в возрасте 5 лет? Можно ожидать, что мы увидим различные варианты их характеристик: некоторые будут выше, некоторые – ниже, некоторые тяжелее, некоторые – легче, у некоторых будут ступни крупнее, у некоторых – меньше, и т.п. Однако логично будет предположить, что все они будут похожи на пятилетних людей. Вы бы удивились, увидев кого-то похожего на подростка, на молодого человека или на взрослого. Тогда у вас возник бы закономерный вопрос: отражает ли то, что вы увидели, реальность.
Читать дальше →
Total votes 46: ↑43 and ↓3+56
Comments14

Искусственный интеллект. Следующий уровень в «игре»

Reading time5 min
Views8.1K

Здравствуйте Хабр. Просматривал ленту вечерком и наткнулся на очередную статью про ИИ:

Что мы действительно (не)знаем о наличии сознания у сверхбольших нейросетей?

И, честно говоря, в очередной раз в статье пытаются ответить на вопрос - который, по-моему, ИМХО уже давно имеет ответ. Ну не интересно читать об одном и тоже каждый раз. Это как пройденный уровень в игре. И главное - есть следующий уровень. Интересный. Т.е. есть следующий вопрос. Обсуждение, которого и хотелось бы услышать. Начал писать комментарий. Но по мере увеличения количества текста понял - опубликую его отдельной статьёй. Потому как в ответах на изначальный топик, он просто потеряется. А мне хотелось бы увидеть обсуждение. Какие на сегодня есть подвижки в вопросе, который я подымаю, как следующий цепочке вопросов по проблеме создания ИИ. Может мой взгляд кардинально не верен.

Повторюсь - статья ниже это коммент, который писался без всякой коррекции, выглядит сумбурно, поэтому строго не судите. Я надеюсь, что всё же смог донести свою мысль.

Читать далее
Total votes 15: ↑13 and ↓2+18
Comments232

Яндекс выложил в опенсорс YDB

Reading time16 min
Views141K
Сегодня мы выложили в опенсорс систему управления базами данных YDB — плод многолетнего опыта Яндекса в разработке систем хранения и обработки данных. Исходный код, документация, SDK и все инструменты для работы с базой опубликованы на GitHub под лицензией Apache 2.0. Развернуть базу можно как на собственных, так и на сторонних серверах — в том числе в любых облачных сервисах.



YDB решает задачи в одной из самых критичных областей — позволяет создавать интерактивные приложения, которые можно быстро масштабировать по нагрузке и по объёму данных. Мы разрабатывали её, исходя из ключевых требований к сервисам Яндекса. Во-первых, это катастрофоустойчивость, то есть возможность продолжить работу без деградации при отключении одного из дата-центров. Во-вторых, это масштабируемость на десятки тысяч серверов на чтение и на запись. В-третьих, это строгая консистентность данных.

В посте я расскажу об истории развития технологий баз данных, о том, зачем использовать YDB, как её применяют текущие пользователи и какие плюсы для всех несёт выход в опенсорс. А во второй половине поста поговорим о разных вариантах развёртывания.
Читать дальше →
Total votes 262: ↑259 and ↓3+329
Comments135

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

Reading time8 min
Views48K

hero_image


В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество.


Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом своими успехами:


  • Снизили размер модели в 2 раза;
  • Научили наши модели делать паузы;
  • Добавили один высококачественный голос (и бесконечное число случайных);
  • Ускорили наши модели где-то примерно в 10 раз (!);
  • Упаковали всех спикеров одного языка в одну модель;
  • Наши модели теперь могут принимать на вход даже целые абзацы текста;
  • Добавили функции контроля скорости и высоты речи через SSML;
  • Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;
  • Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;

Это по-настоящему уникальное и прорывное достижение и мы не собираемся останавливаться. В ближайшее время мы добавим большое количество моделей на разных языках и напишем целый ряд публикаций на эту и смежные темы, а также продолжим делать наши модели лучше (например, еще в 2-5 раз быстрее).


Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →
Total votes 130: ↑129 and ↓1+156
Comments100

Риски обесточивания Чернобыльской АЭС

Reading time3 min
Views58K

Вчера (9.03) Чернобыльская АЭС была обесточена из-за повреждения ЛЭП. Как я говорил ранее, комментируя происходящее вокруг ядерных объектов Украины сейчас, наиболее опасный объект в Чернобылськой зоне – это хранилище отработавшего ядерного топлива (ХОЯТ) с 20 тыс. топливных сборок. А потенциальный аварийный сценарий – условно фукусимский. Когда выброс радиации начался из-за перегрева топлива, охлаждение которого было нарушено из-за обесточивания станции. Но насколько тут этот сценарий реален?

Читать далее
Total votes 97: ↑90 and ↓7+120
Comments197

Пластырь на желудке: устранение дефектов ЖКТ без применения швов

Reading time10 min
Views3.2K


За последние десятилетия мы стали свидетелями стремительного развития медицинских технологий. Корень мандрагоры в качестве анестезии или трепанация черепа для выведения зла из организма уже давно ушли в прошлое и стали не более чем страшилками для студентов-медиков. Однако, несмотря на весь этот прогресс, подавляющее большинство инвазивных методов лечения сопряжено с послеоперационным наложением швов на участок, где проводился надрез. В современной медицине имеется множество разновидностей шовного материала: нерассасывающиеся нити (полиэстеры, полипропилены, шелк, капрон и т.д.), условно рассасывающиеся нити (шелк, капрон и т.д.) и даже стальные скобы. Однако, какой бы из материалов не использовался, наложение швов связано с определенными рисками для здоровья пациента, особенно если шов расположен на внутренних органах. Группа ученых из Массачусетского технологического института (США) предложили альтернативу швам в виде разработанного ими же хирургического пластыря. Из чего сделан пластырь, как он показал себя по сравнению с классическими швами, и сможет ли он их полностью заменить? Ответы на эти вопросы мы найдем в докладе ученых. Поехали.
Читать дальше →
Total votes 18: ↑17 and ↓1+22
Comments2

Оформляем README-файл профиля на GitHub

Reading time14 min
Views207K

Летом 2020 года GitHub позволила пользователям создавать персональные README-файлы и с их помощью кастомизировать свои профили. Сама платформа при создании подобного файла предлагает уже готовый шаблон, в который можно вписать свои данные. Но о какой кастомизации может идти речь, если у всех будут одинаково оформленные профили? За почти два года сообщество придумало множество различных способов выделиться и особенно оформить свою страницу на GitHub.

Читать далее
Total votes 62: ↑60 and ↓2+73
Comments25

Retrieval Transformer в картинках

Reading time6 min
Views5.8K

Резюме: Новые языковые модели могут быть намного меньше GPT-3, но при этом достигать сравнимых результатов благодаря использованию запросов к базе данных или поиску информации в Интернете. Ключевая идея заключается в том, что построение все более и более крупных моделей — не единственный способ повысить качество.


Последние несколько лет ознаменовались появлением больших языковых моделей (Large Language Models, LLM) — моделей машинного обучения, которые способствовали быстрому развитию сферы машинной обработки и генерации естественного языка. Некоторые из основных вех развития области с 2017 года включают в себя:

Читать дальше →
Total votes 4: ↑4 and ↓0+4
Comments0

30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях?

Reading time17 min
Views31K

Не так давно Сбер, а затем и Яндекс объявили о создании сверхбольших русских языковых моделей, похожих на GPT-3. Они не только генерируют правдоподобный текст (статьи, песни, блоги и т. п.), но и решают много разнообразных задач, причем эти задачи зачастую можно ставить на русском языке без программирования и дополнительного обучения — нечто очень близкое к «универсальному» искусственному интеллекту. Но, как пишут авторы Сбера у себя в блоге, «подобные эксперименты доступны только компаниям, обладающим значительными вычислительными ресурсами». Обучение моделей с миллиардами параметров обходится в несколько десятков, а то сотен миллионов рублей. Получается, что индивидуальные разработчики и маленькие компании теперь исключены из процесса и могут теперь только использовать обученные кем-то модели. В статье я попробую оспорить этот тезис, рассказав о результатах попытки обучить модель с 30 миллиардами параметров на двух картах RTX 2080Ti.

Читать далее
Total votes 35: ↑34 and ↓1+40
Comments41

Information

Rating
2,026-th
Registered
Activity