Комментарии 8
Интересная метрика для кластерного анализа — коэффициент корреляции. А не пробовали программу для больших значений отрицательных коэффициентов? Или например иные коэффициенты кроме линейного?
p.s. для 65% я вижу взаимосвязь бревен и курицы (а не кукурузы). Интересно было бы узнать, откуда она.
p.s. для 65% я вижу взаимосвязь бревен и курицы (а не кукурузы). Интересно было бы узнать, откуда она.
Про кукурузу — опечатка. Исправил. Должна быть курица.
На счет связи — на птицефермах как правило на полах делают подстилку из стружек или опилок.
Возможно, причина в этом.
На счет связи — на птицефермах как правило на полах делают подстилку из стружек или опилок.
Возможно, причина в этом.
Вот граф для значений корреляции < -50%:

Как видно, узлы образуют либо парные связи, либо четырехугольники (минус на минус дает плюс).
Но какую-либо зависимость здесь отследить сложно.
На счет нелинейных коэффициентов — нужно подумать, как их здесь можно применить.

Как видно, узлы образуют либо парные связи, либо четырехугольники (минус на минус дает плюс).
Но какую-либо зависимость здесь отследить сложно.
На счет нелинейных коэффициентов — нужно подумать, как их здесь можно применить.
UPD:
1. На счет четырехугольника (серебро-курица-золото-табак).
Я бы объяснил это так: периодами люди больше потребляют (курица, табак), периодами — больше откладывают (серебро, золото).
Растет спрос, соответственно и цена.
2. (хлопок-железо-говядина-медь).
Железо и медь — промышленный товар.
Хлопок и говядина — потребительский.
Видимо существуют какие-то колебания баланса между промышленным и потребительским сектором.
1. На счет четырехугольника (серебро-курица-золото-табак).
Я бы объяснил это так: периодами люди больше потребляют (курица, табак), периодами — больше откладывают (серебро, золото).
Растет спрос, соответственно и цена.
2. (хлопок-железо-говядина-медь).
Железо и медь — промышленный товар.
Хлопок и говядина — потребительский.
Видимо существуют какие-то колебания баланса между промышленным и потребительским сектором.
у автора бревно коррелирует с курицей по той же причине что коррелирует количество пожаров в стране с продажами мороженого. просто поев мороженого всегда хочется зажечь.если серьёзно то такая странная корреляция говорит о том что есть 3 й неучтенный фактор(в моём примере-среднемесячная температура), поэтому ценность такого анализа «в лоб» стремится к нулю.
Это может означать и простое совпадение. Я потому и спросил, что хотел узнать у автора какой-нибудь практический результат. На мой взгляд вообще неверно рассматривать данные по ценам аж за 30 лет как случайную величину, а не случайный процесс.
В исследовании используются не «сырые» цены за 30 лет, а относительные — цены, деленные на среднее геометрическое.
Поэтому, думаю, можно рассматривать их как случайные величины.
Поэтому, думаю, можно рассматривать их как случайные величины.
Данные за 30 лет рассматривать можно, но только без отрыва от релевантных факторов, иначе получится как в данной статье «ветер дует потому что деревья качаются». Но мне очень понравилась у автора визуализация, это действительно хороший инструмент для кластерного анализа, вот только корреляцией как метрикой в кластерном анализе никто не пользуется, там другие механизмы.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Деньги, товар и немного статистики. Часть вторая