Как стать автором
Обновить
91
0
Дмитрий Малюгин @dmagin

Исследователь

Отправить сообщение
Прикольно, что когда я ломал себе мозг подобными вопросами, то среди прочих рассматривал и примеры, которые вы здесь привели — кто такие «Водители», что такое «Транспорт». Ну плюсом также — что такое «Товар», кто такие «Контрагенты», что такое «Банки». И еще именно термином «роль» мучил себя и окружающих.

Для себя я нашел ответы, которые меня устроили. Но в целом согласен, что для практики в 90% ситуаций достаточно примитивных моделей.
Изложенное выше практически один в один совпадает с описанием «модели Торгерсона» (Дронов С.В. Учебное пособие «Многомерный статистический анализ», глава 14. Многомерное шкалирование).
Используя ΔE, мы можем построить функцию оценки качества расположения цветов на барабане как сумму квадратов разностей между соседними цветами на барабане.

На мой взгляд это вовсе не очевидное утверждение. Я так понимаю, что сумма квадратов разностей расстояний между соседями может быть минимальной, но при этом похожие цвета будут находиться в разных концах линейки.
И надо уточнить метрические свойства линейки. Являются ли начальная и конечная точки соседями?

Можно предложить альтернативные функции качества. Например, потребовать, чтобы линейные расстояния между цветами были максимально близки к их реальным (модельным, евклидовым). Тогда минимизировать надо сумму квадратов отклонения линейного расстояния от модельного. Такая сумма и будет функцией качества.
Не разность квадратов, конечно, а квадрат разности.
Здесь (1.1) — это просто общая (абстрактная) запись формы для выражения неких значений как разности квадратов других. Поскольку сама по себе разность квадратов встречается повсеместно, то и форма (1.1) может встречаться где угодно, в том числе и в выражении для дисперсии.
Наполненным конкретным содержанием является выражение (1.3').
Вот если бы Вы привели пример подобной (1.3') формулы из какой-либо области — было бы здорово.
Да, влияние шума на характер спектра тоже интересная тема. Если кратко, то вы правы — случайный шум добавит спектру хвост. Причём он может состоять как из положительных, так и отрицательных чисел. Но шум может быть и не случайным. В этом случае вполне возможна ситуация, при которой шум (погрешность данных) есть, а хвоста нет.
Мне не очень понятно, что такое исключительно математические цели. Рассказываю (и попутно сам разбираюсь) об одной любопытной технике анализа (представления?) данных. Мотивацией послужило отсутствие описания подобного инструмента в доступных мне источниках. Сравнение с методом главных компонент находится в состоянии «хорошо бы», но отсутствует в ближайших планах.
12 ...
13

Информация

В рейтинге
Не участвует
Откуда
Ижевск, Удмуртия, Россия
Зарегистрирован
Активность