Pull to refresh

Comments 8

Цели применения такой техники исключительно математические, или речь об анализе данных (с выделением главных компонент или кластеров и т.п.)?
Мне не очень понятно, что такое исключительно математические цели. Рассказываю (и попутно сам разбираюсь) об одной любопытной технике анализа (представления?) данных. Мотивацией послужило отсутствие описания подобного инструмента в доступных мне источниках. Сравнение с методом главных компонент находится в состоянии «хорошо бы», но отсутствует в ближайших планах.
Понятно. Правильно ли я понимаю, что если к исходным данным добавить шум, то вместо нулей в спектре будут маленькие числа?
Да, влияние шума на характер спектра тоже интересная тема. Если кратко, то вы правы — случайный шум добавит спектру хвост. Причём он может состоять как из положительных, так и отрицательных чисел. Но шум может быть и не случайным. В этом случае вполне возможна ситуация, при которой шум (погрешность данных) есть, а хвоста нет.
Логично. Если источник шума — отклонение точек от (гипер)плоскости в которой они почти лежат, то «хвост» положительный, если же источник — погрешность в измерении расстояния, то могут появляться отрицательные числа. А если шум внутри плоскости, мы его и не обнаружим никак.
Формула (1.1) очень похожа на формулу дисперсии суммы двух зависимых случайных величин, это совпадение или физический смысл?
Здесь (1.1) — это просто общая (абстрактная) запись формы для выражения неких значений как разности квадратов других. Поскольку сама по себе разность квадратов встречается повсеместно, то и форма (1.1) может встречаться где угодно, в том числе и в выражении для дисперсии.
Наполненным конкретным содержанием является выражение (1.3').
Вот если бы Вы привели пример подобной (1.3') формулы из какой-либо области — было бы здорово.
Не разность квадратов, конечно, а квадрат разности.
Sign up to leave a comment.

Articles