Pull to refresh
17
0
Олег @OlegUV

Аналитик

Send message
С такими данными, когда большинство полей в виде хешей не-пойми-чего — это какая-то угадайка, игра типа «Код Да Винчи» в самом плохом смысле.
Хеши нельзя читать нормальными данными.
Нет данных — нет модели.
Нет модели — нет ничего, копать бессмысленно.
я тоже так думаю, но ребята делают интересную штуку — взгляд с другой точки зрения, не важно какой, важно, что другой и имеющей право быть, а это всегда и полезно и интересно
Вы пропустили стадию составления модели (включая её валидацию), вернее проскочили её так быстро, что даже не понадобилась нормальная нотация. А модель — это минимум 90% (!) всего анализа, остальное — чистая рутина.
Возможно, это будет актуально и в хабе Data Mining.
Механизм формирования цен на золото — не рыночный, поэтому про него речи нет.

Иными словами, реальная доля экспорта нефти в районе 40%, (да хоть все 80), каким образом корелляция на уровне 97% а не 60-70%?


Я доверяю данным, которые вижу лично сам. Кто cказал, что доля экспорта нефти только 40%?
Почему вы, не имея возможности проверить эти данные им доверяете, а тем, которые полностью открыты — не доверяете?

И даже если доля экспорта действительно 40%, какая часть выручки идёт на продажу?
Если продаётся только нефтяная выручка, а остальная остаётся на счетах в долларах, то и влиять будет только нефтяная выручка.

Вот так и получается, что у нас есть то, что мы видим (sad but true).
Вот, уже понятнее! Но всё равно, вопросов масса, просто идём по тексту дальше, и по ходу:

> Здесь для всех, кроме «домика», количество мутаций было 100 в среднем на каждую особь, особей в популяции было 100, при размножении популяция увеличивалась в 4 раза.

Как особи размножаются?
У одной пары родителей одна дочерняя особь или может быть несколько?
Один родитель участвует в нескольких парах или нескольких?
При каких условиях особь выпадает из процессе, т.е. умирает?

и т.д.
В тексте полно мест, вызывающих массу вопросов у людей не знакомых с генетическими алгоритмами…

Обязательно продолжайте писать про генетику — это очень интересно.
Хотелось бы больше деталей, а то получается «Берём песок, старый аккумулятор и немного цветмета — и вот у нас готова хрустальная люстра». Что есть особь, как она записывается на бумаге символами, какой вообще аппарат аналитических выкладок, как происходит мутация — запись формулами и т.д. Всего этого не хватает, а почитал бы с большим удовольствием.
Я бы с удовольствием посмотрел на ваш вариант определения взаимосвязи или доказательства отсутствия связи.
UPD. Динамика рядов по времени важна в том смысле, что y=y(x,t), то есть модель может ломаться, и на само деле ломается. Но с этим ничего не поделать…
Это как раз совершенно не важно, ведь я не смотрю y(t) и x(t), а смотрю y(x).
Спасибо, интересно! На мой взгляд, график малоинформативный, то есть говорит о том, что копать надо подробнее, и не верить тем кто говорит, что «нефть стабильно сколько-то за бочку в рублях».
Хорошее замечание, спасибо!
Но хотелось бы больше конструктива.
Тест Рамсея, насколько мне известно, говорит не о том, что есть пропущенные переменные, а о том, что «что-то в модели не так», то ли переменных не хватает, то ли уравнение неправильно построено, то ли ещё что-то.

Я бы с удовольствием прочитал ваш пост на тему тестирования регрессий.

Кстати, ошибки в регрессии выглядят прилично, а может даже и Нормально, так что найти регрессию лучше будет вряд ли просто.

image
Мотивы примерно такие же, по которым люди переходят с VBA для Excel на С++/Java/Perl/Python
В своё время я отказался от statistica, так же как и от spss.
Нормировать на индекс доллара — интересная идея. Правда, это лежит за сферой моих интересов, на большом периоде, лет за 7-10, нефть и рубль собираюсь посмотреть, а бОльшая экономика — уже вряд ли…
Нефть Brent, в тексте написано.
Корреляции сортов нефти не смотрел, хотя вообще это интересная тема, одно время они были жёстко связаны, потом разошлись, причём очень сильно, и потом опять сошлись, какие факторы влияли — лично я не знаю.
Выше уже отвечал, сам хочу такое посмотреть, даже ради любопытства, но время нужно.
Думал об этом, но это не быстро, может отдельный пост сделаю.
наверно… учту на будущее, сейчас писал как сам привык раскладывать по шагам

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity