Comments 14
Это какая то лабораторная работа в ВУЗ? И я читаю отчёт по ней?
В названии статьи - нашёл, в тексте - не нашёл никакой разницы...
Чтобы вычислить косинусное сходство между средними векторами обеих поэм, нужно снизить размерность данных. Снижение размерности это упрощение набора данных за счет устранения избыточных или ненужных функций
Те. какие-то числа уменьшить в размере и потом сказать, что всё вроде похоже - по мне не совсем доказательство.
Симонов наследует лермонтовскую традицию патриотической лирики 19 века, но трансформирует её под нужды советской мифопоэтики.
Это тоже модель предсказала, или для красного словца...
Лермонтов и 19 век.. Чудны дела твои, Г-дь..
Лермонтов и 19 век.. Чудны дела твои, Г-дь..
Михаи́л Ю́рьевич Ле́рмонтов (3 [15] октября 1814, Москва — 15 [27] июля 1841, Пятигорск)
Что не так с Лермонтовым и 19-м веком? Или вы сторонник альтернативно одаренных, считающих что "19-ый" век это когда номер года начинается с "19"? Если так то надо сдерживать свои приступы снобизма.
PCA + t-SNE для визуализации это окей, но к косинусному сходству средних векторов это отношения не имеет. Снижение размерности тут нужно только для графика
Два похожих текста на одном языке, старенькая модель с размерностью всего 768, вместо каждого слова взята целиком строфа, вектора дополнили нулями, обрезали, усреднили, затем взяли средний вектор всех этих средних векторов и бац! оказывается текста имеют общее семантическое ядро на 96%. Про PCA и t-SNE комментаторы уже высказались
❝ Есть три разновидности лжи: ложь, гнусная ложь и статистика. ❞
И сотни других подобных цитат...
Сравнил тоже!
Подтвердил гипотезу, что русская патриотическая поэзия сохраняет устойчивое смысловое ядро, даже когда меняется стиль и идеология.
Для подтверждения гипотезы надо было еще "Словно..." проанализировать.
Мне кажется, что картинка будет примерно такой же, если вместо Бородино взять инструкцию к пылесосу.
Сравнил тоже! Нашел на Python разницу между «Бородино» и «Ледовым побоищем»