Pull to refresh

Comments 8

Интересная метрика для кластерного анализа — коэффициент корреляции. А не пробовали программу для больших значений отрицательных коэффициентов? Или например иные коэффициенты кроме линейного?
p.s. для 65% я вижу взаимосвязь бревен и курицы (а не кукурузы). Интересно было бы узнать, откуда она.
Про кукурузу — опечатка. Исправил. Должна быть курица.
На счет связи — на птицефермах как правило на полах делают подстилку из стружек или опилок.
Возможно, причина в этом.
Вот граф для значений корреляции < -50%:



Как видно, узлы образуют либо парные связи, либо четырехугольники (минус на минус дает плюс).
Но какую-либо зависимость здесь отследить сложно.
На счет нелинейных коэффициентов — нужно подумать, как их здесь можно применить.
UPD:
1. На счет четырехугольника (серебро-курица-золото-табак).
Я бы объяснил это так: периодами люди больше потребляют (курица, табак), периодами — больше откладывают (серебро, золото).
Растет спрос, соответственно и цена.
2. (хлопок-железо-говядина-медь).
Железо и медь — промышленный товар.
Хлопок и говядина — потребительский.
Видимо существуют какие-то колебания баланса между промышленным и потребительским сектором.
у автора бревно коррелирует с курицей по той же причине что коррелирует количество пожаров в стране с продажами мороженого. просто поев мороженого всегда хочется зажечь.если серьёзно то такая странная корреляция говорит о том что есть 3 й неучтенный фактор(в моём примере-среднемесячная температура), поэтому ценность такого анализа «в лоб» стремится к нулю.
Это может означать и простое совпадение. Я потому и спросил, что хотел узнать у автора какой-нибудь практический результат. На мой взгляд вообще неверно рассматривать данные по ценам аж за 30 лет как случайную величину, а не случайный процесс.
В исследовании используются не «сырые» цены за 30 лет, а относительные — цены, деленные на среднее геометрическое.
Поэтому, думаю, можно рассматривать их как случайные величины.
Данные за 30 лет рассматривать можно, но только без отрыва от релевантных факторов, иначе получится как в данной статье «ветер дует потому что деревья качаются». Но мне очень понравилась у автора визуализация, это действительно хороший инструмент для кластерного анализа, вот только корреляцией как метрикой в кластерном анализе никто не пользуется, там другие механизмы.
Sign up to leave a comment.

Articles