Комментарии / Профиль ivodopyanov / Хабр

Как стать автором

Пользователь

Профиль Публикации Комментарии 23Закладки

Как маленькая нейроязыковая модель в Клавиатуре победила серверные подсказки

ivodopyanov 6 авг 2023 в 20:24

RWKV похож на очередную попытку аппроксимировать n^2 связей аттеншена какой-то другой, более простой функцией. Помнится, уже ведь были какие-то линейные варианты "смотрим только по вертикали\горизонтали\диагонали", варианты с фиксированным окном контекста или с dilated (когда аттеншен на каждый 1\2\3\4\5\итд токен) контекстом. А RWKV аппроксимирует через экспоненциальное затухание.

0

Посмотреть

Как маленькая нейроязыковая модель в Клавиатуре победила серверные подсказки

ivodopyanov 5 авг 2023 в 16:35

SRU - это не какая-то новая, особенная архитектура. Это просто еще один вариант написания формулы для RNN с гейтами, как и GRU. Но там одно, очень важное отличие от LSTM и GRU - скрытое состояние не умножается на матрицу весов; умножается лишь вход. При итерировании там лишь поэлементное умножение и сложение. А это означает, что
1) можно сделать matmul на всю входную последовательность разом, перед циклом, что ускоряет процесс.

2) но самое главное - фичи получаются независимыми друг от друга => их вычисление успешно параллелится => можно ускорить за счет GPU (в отличие от LSTM и GRU).

https://arxiv.org/abs/1709.02755

0

Посмотреть

Как маленькая нейроязыковая модель в Клавиатуре победила серверные подсказки

ivodopyanov 4 авг 2023 в 17:27

Зачем использовать LSTM или GRU, когда уже давно есть SRU и SRU++?

0

Посмотреть

Восстанавливаем результаты выборов в Государственную думу 2021 года с помощью машинного обучения

ivodopyanov 14 ноя 2021 в 11:02

В своих работах, независимые электоральные аналитики показывают, что подобная картина может наблюдаться при вбросе голосов за партию, результат которой растет с явкой. Причем в ядре находятся участки с «нормальной явкой», на которых не было фальсификаций, а хвосты соответствуют участкам с «аномальной явкой», где результаты выборов недостоверны.

Кто еще из "электоральных аналитиков", кроме Шпилькина?
А еще подобная картина может наблюдаться, потому что одна партия хорошо мобилизует свой электорат, а другие - нет. Или потому что электорат сам по себе политически активный по каким-то причинам, и голосует за одну партию. Исходная предпосылка сама по себе висит в воздухе.

+3

Посмотреть

Бредогенератор: создаем тексты на любом языке с помощью нейронной сети

ivodopyanov 4 окт 2019 в 13:50

NLP на RNN? В 2019?

+2

Посмотреть

Как в офисе показать ценности компании (без плакатов и лозунгов)

ivodopyanov 12 апр 2019 в 07:39

Работаю в этом офисе. В столовую не хожу, тренажерами не пользуюсь, в настольный теннис\футбол не играю (разве что в шахматы), но мысль об их наличии греет душу.
Большой плюс, что опенспейса нет. Обычные отдельные офисы на 6-10 человек.
За 8 лет работы оставался на овертайм 1 или 2 раза. За соблюдением рабочего графика (во сколько пришел\ушел, сколько пробыл на обеде) никто не следит.
Рабочее место — обычный деревянный стол, два монитора и немного мусора. В радиусе двух метров от меня сидит только один сотрудник.
На работу хожу вообще пешком через парк минут за 20, т.к. Екб — город весьма компактный, а офис почти в центре.

+2

Посмотреть

Нейросети и философия языка

ivodopyanov 15 янв 2019 в 08:12

Каких конкретно задач?

0

Посмотреть

Нейросети и философия языка

ivodopyanov 14 янв 2019 в 16:01

А есть реальные кейсы использования векторной арифметики для эмбеддингов? А то эти «плюс король минус мужчина» встречаю исключительно как примеры.
С близостью-то понятно.

0

Посмотреть

DeOldify: программа для раскрашивания чёрно-белых изображений

ivodopyanov 6 ноя 2018 в 16:15

Интересно, как сеть раскрасит гравюры?

0

Посмотреть

Применение сверточных нейронных сетей для задач NLP

ivodopyanov 10 апр 2018 в 15:19

Самое вкусное, что было в области применения CNN к NLP — это seq2seq и ASR на сверточных сетях от Facebook.

+2

Посмотреть

Каким будет Web 3.0: блокчейн-маркетплейсы для машинного обучения

ivodopyanov 5 апр 2018 в 13:42

Ни одного упоминания про data.iota.org?

0

Посмотреть

Мульти-классификация Google-запросов с использованием нейросети на Python

ivodopyanov 12 мар 2018 в 14:34

1. Чтобы понять, 97% — это хорошо или плохо, стоило бы обучить несколько других архитектур и сравнить результаты. SVM часто отрабатывает лучше для классификации текста, чем нейронные сети

2. Вообще был бы полезен пример анализа результатов классификации и дальнешего «тюнинга». Посмотреть на precision\recall, на confusion matrix.

+1

Посмотреть

Как устроена Алиса. Лекция Яндекса

ivodopyanov 19 фев 2018 в 16:40

«Болталка», выходит, не генеративная модель?

0

Посмотреть

Blockchain глазами разработчика

ivodopyanov 31 окт 2017 в 12:03

По-моему, сильно не хватает информации про IOTA. Куда более «принципиально новый блокчейн», чем EOS. Настолько, что даже не блокчейн.

0

Посмотреть

Алиса. Как Яндекс учит искусственный интеллект разговаривать с людьми

ivodopyanov 10 окт 2017 в 12:50

NER, использование контекста при формировании ответа, само формирование ответа

+1

Посмотреть

Алиса. Как Яндекс учит искусственный интеллект разговаривать с людьми

ivodopyanov 10 окт 2017 в 12:05

«Как Яндекс научил искусственный интеллект разговаривать с людьми?» — «Мы использовали нейронные сети.»
Да вы что! Ну теперь-то все понятно. Нейронные сети, значит. Аж трехслойные. Надо будет самому попробовать.
[/sarcasm] Опять одна вода.

-2

Посмотреть

Нейросетка играет в Доту

ivodopyanov 17 янв 2017 в 08:51

Бой богат на результативные действия, поэтому вторая модель должна довольно быстро обучаться. А первую стратегию даже можно было просто захардкодить для начала.

0

Посмотреть

Нейросетка играет в Доту

ivodopyanov 17 янв 2017 в 08:47

Тоже хотел использовать DRL в турнире, но времени не было.
Мне кажется, правильнее было бы обучать две сети:
* первая отвечает за макро-стратегию — куда идти волшебнику;
* вторая отвечает за микро — боевой режим, который включается при приближении противника на некоторое расстояние.

0

Посмотреть

О новых успехах противостояния (СР УВЧ!*)

ivodopyanov 22 сен 2016 в 13:08

LSTM? А у них при этом не возникали проблемы с корреляцией данных, из-за чего experience replay вводили?

0

Посмотреть

Распознавание образов в R с использованием сверточных нейронных сетей из пакета MXNet

ivodopyanov 9 авг 2016 в 14:28

Зачем проводить обучение на R, если доступен Python? Неужто на R они тренируются быстрее?

-2

Посмотреть

1