Sivchenko_translate30 окт 2024 в 11:25Уделите внимание токенизаторам — и вот почемуВремя на прочтение12 минОхват и читатели4.7KМашинное обучение * Математика * Natural Language Processing * Python * ПереводВсего голосов 5: ↑5 и ↓0+6Добавить в закладки55Комментарии2
ENick31 окт 2024 в 06:42В разделе по векторизации логично упомянуть embeddings.С инвойсами игры с токенизацией дали эффект?
dilukhin3 ноя 2024 в 06:45Комментарий был измененТак и остался открытым вопрос: как этот концевой пробел повлиял на работу модели? Ведь если мы используем токенизатор, пробел не должен повлиять никак.
Уделите внимание токенизаторам — и вот почему