Articles / Bookmarks / Profile of kryvichh / Habr

@kryvichh

Пользователь

Profile Publications 1Comments 2.1KBookmarks 134

SolarDozor Nov 22 2022 at 10:00

Обнаружение ботов в социальных сетях при помощи методов машинного обучения

13 min

5.9K

Information Security*Machine learning*Солар corporate blogSocial networks and communities

Почти все мы пользуемся социальными сетями. А почему бы и не пользоваться? Они ведь предоставляют так много возможностей! Взять ту же сеть ВКонтакте: можно пообщаться с друзьями, поделиться с подписчиками фотографиями только что сделанного крабового салата, посмотреть видео с котом соседа, вырастить огурцы на виртуальной ферме в каком-нибудь приложении… Сказка! Ой, а кто это в друзья добавляется?

+16

honyaki Nov 16 2022 at 22:55

Как реализовать символьную языковую рекуррентную нейронную сеть

12 min

4.4K

Python*Programming*Mathematics*Skillfactory corporate blogArtificial Intelligence

Translation

В одном своём гисте Андрей Карпаты сделал кое-что впечатляющее. Чуть больше чем в 100 строках кода на Python — без тяжеловесных фреймворков для машинного обучения — он прописал довольно полную реализацию языковой модели для обучения символьно-ориентированных рекуррентных нейросетей (РНС). Гист включает полное обучение методом обратного распространения с оптимизацией Adagrad. Подробности — к старту флагманского курса по Data Science.

Читать дальше →

Barokko_von_Dau Nov 15 2022 at 11:05

Бесплатные системы управления проектами: 15 систем, 70 функций

9 min

5.7K

Development Management*Project management*Agile*Product Management*Remote work

Привет! Продолжаю стабильно выходить на связь с Хабром раз в несколько лет =) Благо есть повод – пару месяцев назад перешел в новую контору, где снова надо было наладить работу целого отдела сотрудников на удаленке, который раньше как-то справлялся без системы управления задачами.

И потому я решил повторно провести рисерч на эту тему, чтобы посмотреть как изменился рынок и не появилось ли на нем что-то новенькое и интересное.

А изменилось на российском рынке систем управления проектами за минувший год чуть менее, чем всё. И это помимо того, что успело измениться еще раньше. Мы с командой перепробовали десятки новых и старых систем. Искали бесплатные и доступные в РФ. Составили себе подборку из 15 систем, и для особо нетерпеливых – свели в одну таблицу по возможностям бесплатных версий.

Xeanst Oct 20 2022 at 13:00

Понимают ли нейронные модели грамматику человеческого языка?

11 min

2.6K

Python*Machine learning*Artificial IntelligenceNatural Language Processing*Unistar Digital | Юнистар Диджитал corporate blog

В лингвистике принято считать, что основным свойством языковой способности человека является возможность определять, насколько грамматически корректно предложение. Подобные суждения говорящих о правильности языкового высказывания получили название «оценок грамматичности/ приемлемости». Лингвисты используют суждения о грамматичности для исследования синтаксической структуры предложений.

tairsu Oct 16 2022 at 11:35

Как нарисовать барашка или прикладное нейрохудожество

7 min

7.8K

Working with video*Game development*Image processing*Computer Animation*

From sandbox

Recovery Mode

Потихоньку начнём разговор для понимания приёмов и возможностей нейросетевых инструментов. Они с нами навсегда, неплохо бы разобраться в самом начале.
Для примера выберем, конечно же, девчонок.

Prompth: full frontal, stunning blonde, (perfect face), suggestive, bright smile, gorgeous hair, squat,

Negative prompt: paint, anime, cartoon, art,drawing,3d render, digital painting, body out of frame, ((deformed)), (cross–eyed), (closed eyes), blurry, (bad anatomy), ugly, disfigured, ((poorly drawn face)), (mutation), (mutated), (extra limbs), (bad body)

Перед началом генерирования у вас есть много разных настроек и возможностей . Например запрос может быть и отрицательным - negative prompt, фактически запрет, очень мощный инструмент, в котором описывается чего бы вы не хотели видеть в результате. Как правило туда включают все заклинания призванные исключить появление в результирующем изображении шестипалых рук и множества других мутаций, которые только отнимают ценное время. Рисовать правильные пальцы - это вообще больное место нейросетей, поэтому их часто и не видно в сгенерированных изображениях. Впрочем, продолжим.

На картинке ниже результат работы нейросети от компании StableDiffusion, а именно запрос к парсеру img2img — инструменту, который служит для доработки уже имеющегося изображения. В качестве исходника, был взят мем из сети Интернет. Текст запроса:

+16

netsvetaev Oct 15 2022 at 14:35

Релиз Invoke AI 2.0 — интерфейса и инструментария для Stable Diffusion (win/linux/mac)

2 min

13K

Python*Image processing*Machine learning*Artificial Intelligence

From sandbox

Привет всем! Сегодня состоялся релиз InvokeAI 2.0: A Stable Diffusion Toolkit, проекта, цель которого — предоставить энтузиастам и профессионалам набор надежных инструментов для создания и редактирования изображений с помощью нейросети. InvokeAI требует всего ~3,5 Гб видеопамяти для создания изображений 512x768 пикселей (и еще меньше для 512х512), и совместим с Windows/Linux/Mac с M1 и M2.

Вау, как круто!

+24

UtrobinMV Sep 22 2022 at 12:21

Как создать переводчик, который переводит лучше, чем Google Translate

8 min

27K

Data Mining*Machine learning*Artificial IntelligenceNatural Language Processing*Data Engineering*

Tutorial

Data Mining Season

Помню, как еще в школе на Basic я писал программу-переводчик. И это было то время, когда ты сам составлял словарь, зашивал перевод каждого слова, а затем разбивал строки на слова и переводил каждое слово в отдельности. В то время я, конечно же, не мог и представить, как сильно продвинутся технологии, и программы-переводчики станут в основе использовать механизмы глубокого обучения с архитектурой трансформера и блоками внимания.

В этот раз я решил окунуться немного в прошлое и сделать то, что хорошо сделать тогда у меня не получилось.

+61

Nikuson Oct 12 2022 at 12:00

Диффузионные Нейросети — самый актуальный подход к генерации изображений

6 min

22K

Machine learning*RUVDS.com corporate blogArtificial Intelligence

Метод обратной диффузии поистине является самым нашумевшим в этом году методом генерации изображений нейросетями. Его используют: DALLE 2, Midjourney, imagen и другие актуальные модели 2022 года.

В данной статье мы подробно изучим, что под капотом самых современных генеративных моделей и даже напишем небольшую свою.

Под катом будет много кода, программирования, математики, в общем — всё, как вы любите.

Читать дальше →

+47

cointegrated Oct 9 2022 at 13:00

Первый нейросетевой переводчик для эрзянского языка

10 min

12K

Semantics*Data Mining*Machine learning*Artificial IntelligenceNatural Language Processing*

Data Mining Season

Эрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей.
Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и целые предложения.

Пока её качество оставляет желать лучшего, но пробовать пользоваться уже можно.
Как я собирал для этого тексты и обучал модели – под катом.

+68

xpic99 Aug 12 2022 at 02:14

Как гражданину РФ открыть ИП и ТОО в Казахстане?

4 min

63K

FreelanceIT-emigration

Продолжение про релокацию бизнеса на постсоветском пространстве. К плюсам релокации в РК можно отнести многие факторы, среди которых:

SLY_G Jul 16 2022 at 12:00

Загадка появления ранних сверхмассивных чёрных дыр решена

9 min

31K

Popular sciencePhysicsAstronomy

Translation

Загадка появления ранних сверхмассивных чёрных дыр много лет ставила в тупик астрономов. И вот, наконец, мы поняли, откуда они появились.

Всего на 0,15 квадратных градусах небосвода можно найти множество участков, содержащих большое количество галактик, группирующихся в скопления и филаменты, между которыми есть лишь пустоты, или войды. Каждая светлая точка на этом снимке – это сверхмассивная чёрная дыра (да, их настолько много). Этот участок космоса назвали ECDFS, поскольку ранее его рассматривали в рамках проекта Extended Chandra Deep Field South – это новый взгляд в рентгеновском диапазоне на изученный ранее участок.

Что, если бы мы могли заглянуть в прошлое любого человека с нашей планеты и увидеть их в возрасте 5 лет? Можно ожидать, что мы увидим различные варианты их характеристик: некоторые будут выше, некоторые – ниже, некоторые тяжелее, некоторые – легче, у некоторых будут ступни крупнее, у некоторых – меньше, и т.п. Однако логично будет предположить, что все они будут похожи на пятилетних людей. Вы бы удивились, увидев кого-то похожего на подростка, на молодого человека или на взрослого. Тогда у вас возник бы закономерный вопрос: отражает ли то, что вы увидели, реальность.

Читать дальше →

+56

developer7 Jul 2 2022 at 13:55

Искусственный интеллект. Следующий уровень в «игре»

5 min

8.1K

Artificial Intelligence

Здравствуйте Хабр. Просматривал ленту вечерком и наткнулся на очередную статью про ИИ:

Что мы действительно (не)знаем о наличии сознания у сверхбольших нейросетей?

И, честно говоря, в очередной раз в статье пытаются ответить на вопрос - который, по-моему, ИМХО уже давно имеет ответ. Ну не интересно читать об одном и тоже каждый раз. Это как пройденный уровень в игре. И главное - есть следующий уровень. Интересный. Т.е. есть следующий вопрос. Обсуждение, которого и хотелось бы услышать. Начал писать комментарий. Но по мере увеличения количества текста понял - опубликую его отдельной статьёй. Потому как в ответах на изначальный топик, он просто потеряется. А мне хотелось бы увидеть обсуждение. Какие на сегодня есть подвижки в вопросе, который я подымаю, как следующий цепочке вопросов по проблеме создания ИИ. Может мой взгляд кардинально не верен.

Повторюсь - статья ниже это коммент, который писался без всякой коррекции, выглядит сумбурно, поэтому строго не судите. Я надеюсь, что всё же смог донести свою мысль.

+18

232

olalala Apr 19 2022 at 11:59

Яндекс выложил в опенсорс YDB

16 min

141K

High performance*Open source*Яндекс corporate blogDatabase Administration*GitHub*

Technotext 2022

Сегодня мы выложили в опенсорс систему управления базами данных YDB — плод многолетнего опыта Яндекса в разработке систем хранения и обработки данных. Исходный код, документация, SDK и все инструменты для работы с базой опубликованы на GitHub под лицензией Apache 2.0. Развернуть базу можно как на собственных, так и на сторонних серверах — в том числе в любых облачных сервисах.

YDB решает задачи в одной из самых критичных областей — позволяет создавать интерактивные приложения, которые можно быстро масштабировать по нагрузке и по объёму данных. Мы разрабатывали её, исходя из ключевых требований к сервисам Яндекса. Во-первых, это катастрофоустойчивость, то есть возможность продолжить работу без деградации при отключении одного из дата-центров. Во-вторых, это масштабируемость на десятки тысяч серверов на чтение и на запись. В-третьих, это строгая консистентность данных.

В посте я расскажу об истории развития технологий баз данных, о том, зачем использовать YDB, как её применяют текущие пользователи и какие плюсы для всех несёт выход в опенсорс. А во второй половине поста поговорим о разных вариантах развёртывания.

Читать дальше →

+329

135

snakers4 Apr 12 2022 at 20:58

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

8 min

48K

Machine learning*DIYSoundNatural Language Processing*Voice user interfaces*

hero_image

В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество.

Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом своими успехами:

Снизили размер модели в 2 раза;
Научили наши модели делать паузы;
Добавили один высококачественный голос (и бесконечное число случайных);
Ускорили наши модели где-то примерно в 10 раз (!);
Упаковали всех спикеров одного языка в одну модель;
Наши модели теперь могут принимать на вход даже целые абзацы текста;
Добавили функции контроля скорости и высоты речи через SSML;
Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;
Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;

Это по-настоящему уникальное и прорывное достижение и мы не собираемся останавливаться. В ближайшее время мы добавим большое количество моделей на разных языках и напишем целый ряд публикаций на эту и смежные темы, а также продолжим делать наши модели лучше (например, еще в 2-5 раз быстрее).

Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →

+156

100

Nucl0id Mar 10 2022 at 08:30

Риски обесточивания Чернобыльской АЭС

3 min

58K

Вчера (9.03) Чернобыльская АЭС была обесточена из-за повреждения ЛЭП. Как я говорил ранее, комментируя происходящее вокруг ядерных объектов Украины сейчас, наиболее опасный объект в Чернобылськой зоне – это хранилище отработавшего ядерного топлива (ХОЯТ) с 20 тыс. топливных сборок. А потенциальный аварийный сценарий – условно фукусимский. Когда выброс радиации начался из-за перегрева топлива, охлаждение которого было нарушено из-за обесточивания станции. Но насколько тут этот сценарий реален?

+120

197

Dmytro_Kikot Feb 9 2022 at 11:00

Пластырь на желудке: устранение дефектов ЖКТ без применения швов

10 min

3.2K

ua-hosting.company corporate blogPopular scienceBiotechnologiesMedical gadgetsHealth

За последние десятилетия мы стали свидетелями стремительного развития медицинских технологий. Корень мандрагоры в качестве анестезии или трепанация черепа для выведения зла из организма уже давно ушли в прошлое и стали не более чем страшилками для студентов-медиков. Однако, несмотря на весь этот прогресс, подавляющее большинство инвазивных методов лечения сопряжено с послеоперационным наложением швов на участок, где проводился надрез. В современной медицине имеется множество разновидностей шовного материала: нерассасывающиеся нити (полиэстеры, полипропилены, шелк, капрон и т.д.), условно рассасывающиеся нити (шелк, капрон и т.д.) и даже стальные скобы. Однако, какой бы из материалов не использовался, наложение швов связано с определенными рисками для здоровья пациента, особенно если шов расположен на внутренних органах. Группа ученых из Массачусетского технологического института (США) предложили альтернативу швам в виде разработанного ими же хирургического пластыря. Из чего сделан пластырь, как он показал себя по сравнению с классическими швами, и сможет ли он их полностью заменить? Ответы на эти вопросы мы найдем в докладе ученых. Поехали.

Читать дальше →

+22

daniilshat Feb 2 2022 at 22:00

Оформляем README-файл профиля на GitHub

14 min

207K

GitHub*IT careerSocial networks and communities

Летом 2020 года GitHub позволила пользователям создавать персональные README-файлы и с их помощью кастомизировать свои профили. Сама платформа при создании подобного файла предлагает уже готовый шаблон, в который можно вписать свои данные. Но о какой кастомизации может идти речь, если у всех будут одинаково оформленные профили? За почти два года сообщество придумало множество различных способов выделиться и особенно оформить свою страницу на GitHub.

+73

Kouki_RUS Jan 31 2022 at 15:47

Retrieval Transformer в картинках

6 min

5.8K

Machine learning*

Translation

Резюме: Новые языковые модели могут быть намного меньше GPT-3, но при этом достигать сравнимых результатов благодаря использованию запросов к базе данных или поиску информации в Интернете. Ключевая идея заключается в том, что построение все более и более крупных моделей — не единственный способ повысить качество.

Последние несколько лет ознаменовались появлением больших языковых моделей (Large Language Models, LLM) — моделей машинного обучения, которые способствовали быстрому развитию сферы машинной обработки и генерации естественного языка. Некоторые из основных вех развития области с 2017 года включают в себя:

Читать дальше →

it-kod Jan 25 2022 at 13:38

Отправка данных из *.XLSX в Google Sheets

3 min

8.2K

Google App Engine*Visual Basic for Applications*

From sandbox

Всем привет! Я обычный пользователь MS Excel и Google Docs, любитель-программист на VBA, App Script и JavaScript.

Durham Jul 1 2021 at 00:14

30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях?

17 min

31K

Algorithms*Machine learning*Artificial IntelligenceThe future is hereNatural Language Processing*

Technotext 2021

Не так давно Сбер, а затем и Яндекс объявили о создании сверхбольших русских языковых моделей, похожих на GPT-3. Они не только генерируют правдоподобный текст (статьи, песни, блоги и т. п.), но и решают много разнообразных задач, причем эти задачи зачастую можно ставить на русском языке без программирования и дополнительного обучения — нечто очень близкое к «универсальному» искусственному интеллекту. Но, как пишут авторы Сбера у себя в блоге, «подобные эксперименты доступны только компаниям, обладающим значительными вычислительными ресурсами». Обучение моделей с миллиардами параметров обходится в несколько десятков, а то сотен миллионов рублей. Получается, что индивидуальные разработчики и маленькие компании теперь исключены из процесса и могут теперь только использовать обученные кем-то модели. В статье я попробую оспорить этот тезис, рассказав о результатах попытки обучить модель с 30 миллиардами параметров на двух картах RTX 2080Ti.

+40

3 4 5 6