Как стать автором
Обновить

Комментарии 5

Понемногу интересуюсь data science, всегда было интересно увидеть рабочий процесс от постановки задачи до анализа результатов)

Предлагаю дополнить исследование решением данной задачи с поиощью bert-like моделей и LLM через prompt engineering и сравнить результаты в новой статье. Думаю, было бы интересно

На каком языке комментарии, можете пояснить? «Девк, кравченк, янд, бухановск, плат, амурха, косто, питан»?

Облако слов строилось после применения стемминга. Поэтому слова отображены в сокращении до своих грамматических основ.

yt-dlp качает все комментарии к видео с одной команды в формате JSON, со второй команды (и чьей-то матери для подбора правильного фильтра-команды) jq выдает только нужные элементы.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории