Комментарии / Профиль cointegrated / Хабр

Как стать автором

Давид Дале @cointegrated

Разработчик / Аналитик / Data Scientist / NLPшник

Профиль Публикации 25Комментарии 88Закладки 3

Маленький и быстрый BERT для русского языка

cointegrated 10 июн 2021 в 11:30

Я пробовал для каждой пары (модель, задача) cls и пулинг, и выбирал лучший из двух вариантов. Для вашей модели у меня на STS и интентах пулинг дал более хороший результат, а на токсичности и сентименте, внезапно, cls.

+1

Посмотреть

Маленький и быстрый BERT для русского языка

cointegrated 10 июн 2021 в 11:12

Под Сбертом ты понимаешь модель sberbank-ai/sbert_large_nlu_ru и пост "Обучение модели естественного языка с BERT и Tensorflow"? Если да, то расчёта метрик по STS для русского языка я там не нашёл (может быть, проглядел). Если поделишься ссылкой, буду весьма благодарен.

0

Посмотреть

Маленький и быстрый BERT для русского языка

cointegrated 10 июн 2021 в 10:34

будет адом при поддержке или репликации

Точно реплицировать действительно сложно, т.к. я много менял ~~коней~~ методы в процессе обучения модели. Но сложности в поддержке я не вижу: созданную странным образом модель дальше можно использовать для своих задач, не задумываясь, как именно она была обучена.

Может я пропустил в статье метрики, но вроде сетка делалась для какой-то конкретной бизнес задачи.

Исходная мотивация была использовать эту сетку для классификации интентов чат-бота, и на этой задаче она работает нормально - капельку лучше, чем fasttext и пара русских BERT'ов. Будучи при этом заметно меньше их. Но датасет, на котором я качество мерял, принадлежит не мне, а клиенту, и непубличен, поэтому про него писать не стал.

1 процентный пункт прироста качества против FastText сложно обосновать.

С посылом согласен: я тоже люблю простоту. Поэтому сам долго сидел на FastText'е и на трансформеры не переходил. Но сейчас таки понемногу на них пересаживаюсь, ибо нравится лёгкость дообучения на смежные задачи.

Но фидбек принят: в следующий раз включу в бенчмарк более простые бейзлайны.

Я склонен думать, что качество все-таки надо оценивать на каких-то сложных "больших" задачах.

Да, я собираюсь на RussianSuperGlue тоже померяться.

+3

Посмотреть

Маленький и быстрый BERT для русского языка

cointegrated 10 июн 2021 в 10:11

Перестал ли банить и почему, я не знаю, не слежу за этим. Но в правилах сайта сказано, что упоминание авторами "своих персональных блогов на крупных медиа-ресурсах" допустимо.

А джинсой, насколько я знаю, называется "необъективный материал, публикация которого была тайно оплачена". За написание этого поста мне никто не платил (хоть было бы и неплохо).

+6

Посмотреть

Cross-nested ordered probit: мой первый разработческий проект, ML и эконометрика

cointegrated 23 мар 2021 в 08:13

люди, в ней работающие, не интересуются другими областями и переизобретают велосипеды

Мне кажется, это свойство вообще людей в целом.

0

Посмотреть

Создание stateful навыка для Алисы на serverless функциях Яндекс.Облака и Питоне

cointegrated 18 мая 2020 в 11:28

В tgalice я хочу прийти рано или поздно примерно к этому: сценарии навыка описываются конфигами в yaml, которые потом запускаются питонячим кодом. Эти конфиги можно править вручную, а можно — в графическом интерфейсе.
Если интересно подобным заняться — подключайся к проекту :)

0

Посмотреть

Создание stateful навыка для Алисы на serverless функциях Яндекс.Облака и Питоне

cointegrated 17 мая 2020 в 15:43

Похоже вы не очень хотели использовать Aimylogic, любопытно узнать почему?

Если честно, я просто люблю писать код самостоятельно и иметь полный контроль над ним.
Кажется, это вопрос эстетики.
Возможно, если бы конструктор Aimylogic был опенсорсным, я остановился бы на нём.

0

Посмотреть

Хакатон в Симферополе, Яндекс.Диалоги и законы чат-бото-техники

cointegrated 27 фев 2020 в 11:26

Ну если послезавтрашний зайдёт неплохо, то и большой-хардкорный когда-нибудь замутим (:

0

Посмотреть

Хакатон в Симферополе, Яндекс.Диалоги и законы чат-бото-техники

cointegrated 27 фев 2020 в 11:26

Селфи же :)

-1

Посмотреть

Как я парсил Хабр, часть 1: тренды

cointegrated 26 фев 2020 в 22:30

Таки руки не дошли доиграться, но выложил yadi.sk/d/JV5S4nUKUrkzsA

+1

Посмотреть

Создание stateful навыка для Алисы на serverless функциях Яндекс.Облака и Питоне

cointegrated 2 окт 2019 в 18:46

Я на ноде пока не успел попробовать.
Когда попробуешь — расскажи в чатике)

0

Посмотреть

Создание простого разговорного чатбота в python

cointegrated 6 авг 2019 в 23:45

Ну есть же всякие конструкторы ботов без написания кода: dialogflow, manychat, aimylogic, botpress, и так далее. Можно развлекаться)

0

Посмотреть

Создание простого разговорного чатбота в python

cointegrated 5 авг 2019 в 12:57

Или, кстати, можно в гугл колабе запускать бота (в режиме polling, как и на локальном компе). Кажется, это самый дешёвый вариант. Вот минимальный пример.

0

Посмотреть

Создание простого разговорного чатбота в python

cointegrated 4 авг 2019 в 23:15

Я знаю, что есть учёные, которые работают над поиском формулы оптимальной размерности, но, кажется, серебряной пули пока не придумали. Так что, наверное, перебор.

0

Посмотреть

Создание простого разговорного чатбота в python

cointegrated 4 авг 2019 в 23:13

Да, всё верно. Нужно соединяться из-под VPN. Спасибо за замечание, сейчас дополню.

0

Посмотреть

Создание простого разговорного чатбота в python

cointegrated 4 авг 2019 в 00:22

Да можно и без атеншна, CNN с двумя башнями (для контекста и для ответа) уже сильно лучше работает. Но интересно было, чего можно получить без нейронок и вообще без супервижна.

0

Посмотреть

Создание простого разговорного чатбота в python

cointegrated 3 авг 2019 в 11:46

Любопытно, а что создаёт такое впечатление? :)
В каком-то смысле это действительно перевод — это слепленные и немножко переписанные 5 постов из блога. Но они и исходно были на русском.

+1

Посмотреть

How linear algebra is applied in machine learning

cointegrated 22 окт 2018 в 11:00

Мне кажется, правильное решение — сделать это настраиваемым. Чтобы по умолчанию показывались все статьи, но можно было снимать галочки с языков, на которых читать не хочешь.
Надеюсь, разработчики Хабра так и сделают.

0

Посмотреть

How linear algebra is applied in machine learning

cointegrated 22 окт 2018 в 10:58

Если этот вопрос апнет куча народу, то можно)

0

Посмотреть

How linear algebra is applied in machine learning

cointegrated 22 окт 2018 в 08:38

На самом деле, целью текста было ответить на конкретный вопрос «what are typical applications of LA in ML» (возникший у не-русскоязычной аудитории). А потом я решил его расшарить публично, и посмотреть, что будет :)
Что аудитория не-русскоязычная — это, наверное, существенно. Всё-таки на постсоветском пространстве существует культ математики, согласно которому математика крайне важна, если не доказано обратное. А вопрошали меня иностранные разработчики, которые про машинку знают больше на уровне from xgboost import * или красивых картинок, а теорию никогда особо и не изучали. И если многие наши студенты привычны к формулкам и побаиваются кода, то где-нибудь в Штатах или в Израиле чаще наоборот.

+1

Посмотреть

3