Как стать автором
Обновить

Долой рандом, или ищем лучшие настройки для аугментации текстов

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.4K
Всего голосов 4: ↑4 и ↓0+6
Комментарии3

Комментарии 3

Спасибо за интересную статью! Я заметила, что выбранные аугментации в основном оперируют токенами. А не было ли мысли рассмотреть аугментации на уровне символов? Например, удаление пробела (как будто человек говорит очень быстро), или замена буквы похожей по звучанию?

Привет)
На уровне символов не рассматривали, но есть идеи замены слов на рифмующиеся. Удаление пробела, к сожалению, не поможет, потому что если человек говорит быстро, то аср распознает как-то по-другому.

лет 10+ назад генерировал так синонимы доменов, через google translate)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий