Астрология и Data mining


Как и многие люди технического склада ума, я с крайним недоверием отношусь к астрологии, гороскопам и прочим псевдонаукам. Моё мировозрение пошатнулось когда я от скуки решил изучить влияение времени года в которое рождается человек, на его психические особенности. Оценка психических особенностей производилась по результатам соционического теста из приложения VK, которое насчитывает более 500000 пользователей. Надёжность и валидность теста небольшая, да и вся соционическая модель имеет ряд проблем. Но нам важно другое: понять есть ли хоть какие-то отличия между людьми родившимися в разное время. Объём выборки в полмиллиона человек позволяет надеяться на положительный результат. В ходе исследования ожидалось получить линейную зависимость между продолжительностью светлого времени суток в день рождения человека и его психотипом, но получилось нечто совсем иное.

Вкратце о тесте: есть такая штука базис Юнга, он представляет собой 4 бинарных признака, все возможные комбинации которых образуют 16 психотипов личности. Рассмотрим численность одного из типов в разрезе даты рождения и сразу наложим периоды знаков зодиака.



Для сравнения общее распределение по всем типам для обоих полов.


Похоже, что спады и всплески рождаемости не случайны. Быть может авторы приложения сфальсифицировали результаты тестов? Это было бы самым простым объяснением, не смотря на то, что я плохо представляю как это технически возможно и для чего нужно.

Так выглядит распределение рождаемости для всех типов:


Интересно, что спады и всплески, как правило, наблюдаются одновременно у знаков из одной стихии.
Несколько интересных графиков наложил на зодиакальный круг:

ENTP ISFJ INFP ISTJ ESTJ
Справа от диаграмм показан баланс стихий для каждого психотипа в разбивке на оба пола.

Знатоки астрологии и соционики могут оценить на сколько возможная корреляция вписывается в теорию, посмотрев на баланс стихий в базисе Юнга и на таблицу отклонений от нормальных значений:


Под нормальным значением понимается наиболее статистически вероятное количество людей, которое должно было родиться под каждым знаком в случае отсутствия любых корреляций.
Коэффициенты рассчитаны по формуле:


где,
count — количество людей с заданным типом, полом и знаком;
counttotal — общее количество людей в выборке;
count(zodiac) — общее количество людей с заданным знаком;
count(sex,type) — общее количество людей с заданным типом и полом.

Например, женщины козероги типа ISTJ встречаются в 1.5 чаще, чем если бы тип и знак были не связаны друг с другом. Близнецы с типом ISTJ встречаются на 29% реже.

Из-за ненадёжности источника данных всё вышеизложенное не претендует на то, чтобы называться серьёзным научным исследованием, поэтому не буду углубляться в детали статистической обработки данных. Любой желающий может её повторить используя приложенные файлы или повторить парсинг из первоисточника.
socio_dump.zip
socio.xlsx
corr_map.xlsx

Для сбора, обработки и визуализации информации использовались Ruby, Oracle XE, Tableau Desktop, Excel и Paint.NET.

Итог


Википедия гласит:
С точки зрения современной науки астрология является типичным лженаучным учениеми разновидностью гадательной магии.
Ни один эксперимент, имеющий целью проверить истинность утверждений астрологии, не увенчался успехом. Все усилия, направленные на то, чтобы установить достоверные статистические корреляции между расположением небесных светил в момент рождения человека и какими-либо особенностями его личности или событиями в жизни, пока не дали положительного результата.

Разумеется, Википедия для меня более авторитетна, чем приложение из контакта. Однако, с точки зрения биологии и антропологии я не вижу причин почему фенотип человека не может зависеть от времени года его рождения, как у некоторых животных. Если допустить, что корреляция действительно существует, то видится следующее её объяснение: некоторые особенности психотипа человека формируются в процессе внутриутробного развития под действием годичных гормональных циклов в организме матери и являются результатом адаптации к разным типам сезонной активности людей в древности. Детям, рождавшимся, в разных условиях было необходимо быть готовыми к этим условиям заранее. В этом случае логично предположить, что характер годичной динамики рождаемости будет зависеть от этнического состава популяции, в которой проходит исследование, т.к. разные народности, вероятно, жили по своему календарю. На сколько я знаю, в России никогда не проводились подобные исследования с таким объёмом выборки. Возможно, американские социологи и сторонники типологии MBTI не смогли найти закономерности как раз из-за смешанного состава их аудитории.

PS Не хочу никого ни в чём убедить, и прошу прощения если задел чьи-то атеистические чувства:)

UPD
Официальный комментарий владельца приложения Соционика:
Данные не подтасованы. Это результаты реальных прохождений тестов. Но результаты тестирования обычно имеют нулевую достоверность, т.к. люди зачастую отвечают не как есть, а как хотелось бы что бы было. Поэтому большинство получаются Гекслями. Приложение больше носит развлекательный характер, конечно посерьезнее, но все равно что то типа гороскопа. Пользователи приложения в основном женщины, они любят всякие гороскопы. Возможно стереотипы навязанные гороскопом отразились на результаты прохождения теста… Кстати у мужчин зависимость между знаком задиака и ТИМом чуть слабее. Может потому что мужчины меньше верят гороскопам)
arigotoma

Similar posts

AdBlock has stolen the banner, but banners are not teeth — they will be back

More
Ads

Comments 137

    –1
    > В этом случае логично предположить, что характер годичной динамики рождаемости будет зависеть от этнического состава популяции, в которой проходит исследование, т.к. разные народности, вероятно, жили по своему календарю. Ой и не говорите, и продолжительность дня у них разная была…
    P.S. Спасибо за статью. Здравая мысль в привязки гормонального фона и времени года есть определенно. Туда еще можно привязать времена равноденствий и солнцестояний как отправные точки для биологических циклов. Ну а дальше — нужно исследование по тем, кто родился раньше срока (что на самом деле играет роль — рождение, зачатие или время проведенное в пузе). Но ВК этим едвали поделится.
      +5
      Годичная динамика рождаемости — интересная штука. Вот, например, для США с 1973 по 1999 годы. Хорошо видно всплеск на 14 февраля, на 9 месяцев после рождественских каникул, зато провал на 4 июля и перед 25 декабря. Так что тут действительно есть зависимость от очень многих факторов. А вот как это к психотипу привязать — самому очень интересно.
        +3
        Строили бы уже таблицу, пересчитанную по датам зачатия, удобнее было бы.
          0
          По ссылке.
            +1
            Как-то так
            image
              +1
              Весна, чего уж тут.
                +1
                Число за 29 февраля больше чисел за 28 февраля и 1 марта? Да ну?
                • UFO just landed and posted this here
                    0
                    Я скорее поверю что взяли все дни рождения и вычли алгоритмом девять месяцев. А массив дней года содержал 29 февраля как обычный день.
                    • UFO just landed and posted this here
                0
                А помните к чему привел крупнейший американский блэкаут? :)
              0
              А я-то думал, почему 14-го февраля Валентина празднуют. :D
                +3
                Скорее рожают потому что празднуют :)
                0
                А по тринадцатым числам суеверные американки не рожают? Или всё-таки рожают, но в документах пишут другую дату?
                  +1
                  Или ускоряют роды, что проще, или задерживают именно из-за суеверий. В других странах с другими «несчастливыми числами» и праздниками ситуация будет другой, но статистику я не искал.
                    0
                    Но тринадцатые числа ещё не сильно выделяются — посмотрите на 4–5 июля. Рожать некогда — надо Independence Day отмечать.
            +4
            So awesome, я уже лет десять задаюсь вопросом, почему никто не подбил такую простую статистику. Спасибо большое за статью.
              +10
              Цифры интересные, но отличия все-таки слишком маленькие (по сравнению с астрологическими). Например, посмотрим на знак Козерога и на типы ESTJ/ISTJ (наверное, их можно вместе назвать STJ). Наблюдаемая корреляция (+50% от «нормального» числа людей) довольно заметна. Но что говорят астрологи?

              А астрологи на основе подобных данных делают вывод, что любой Козерог может быть исключительно STJ типа!

              Так что ничего страшного не произошло, астрология так и осталась лженаукой, а соционика — наукой обычной. Хотя цифры все-таки удивительные.
                +7
                > соционика — наукой обычной

                Да с каких это пор соционика стала «наукой обычной»? Где повторямость, проверяемость, предсказательная сила? Давйте тогда еще и психоанализ какой-нибудь Фрейдистский или Юнгианский в науку запишем!
                en.wikipedia.org/wiki/Socionics#Weaknesses_and_criticism_of_socionics

                Кстати, направление которое так называется и имеет отношение к науке действительно есть, только вот к тому что называется соционикой у нас оно не имеет отношения:
                jasss.soc.surrey.ac.uk/1/3/5.html
                  0
                  > Кстати, направление которое так называется и имеет отношение к науке действительно есть, только вот к тому что называется соционикой у нас оно не имеет отношения

                  Я это направление и имел в виду.
                  Несмотря на то, что тысячи бухгалтеров называют системный блок процессором, значение слова «процессор» все-таки не меняется. И с соционикой так же.
                    0
                    В контексте этой статьи под соционикой понимается как-раз псевдонауная ересь а о том, что я написал, подозреваю здесь мало кто знает.
                      0
                      Ну, не такая уж она и псевдонаучная, просто масштабы совершенно не те. Впрочем, про масштабы я уже писал.
                        0
                        Да ладно не такая уж:

                        Its (socionics) hypotheses have emerged from subjective observation, analysis, and interpretation of human behavior, and through comparisons between socionics and other fields or philosophies. While numerous studies have been performed by socionists, they have not empirically tested the basic hypotheses of socionics theory.
                +22
                Не стоит забывать и об обратном воздействии. То есть, о влиянии астрологических стереотипов на поведение человека.
                Если человек знает, что от него ожидают определённого поведения, он, скорей всего, будет вести себя соответственно. Учтём, что в астрологию верит весьма немало людей — и это в немалой степени объяснит подобную периодичность. Прибавим к этому упомянутую вами возможную зависимость фенотипа от времени рождения — и, скорей всего, объясним все отклонения полностью, без притягивания лишних сущностей в виде Марса в Стрельце.
                  +3
                  > Если человек знает, что от него ожидают определённого поведения, он, скорей всего, будет вести себя соответственно.

                  Согласен.
                  Я вот начитался в юношестве, что из себя такой «колеблющиеся Весы». И хоть в астрологию не верю, но в тяжелых ситуациях с принятием решения, иногда всплывает мысль: «Но, я же Весы, и этим все сказано».
                    +5
                    Мне в этом плане повезло — я до сих пор не знаю, Овен я или Рыба :)
                      0
                      Как же так?
                        +1
                        Родился на границе между ними.
                          0
                          А если еще вспомнить, что на небе то есть тринадцатое, не учтенное в гороскопе созвездие, то и вовсе все границы поползут. Шутка.
                          • UFO just landed and posted this here
                              0
                              На самом деле для асрологии глубоко пофиг что там за созвездия, какие им в данный момент определила границы международная астрофизическая комиссия, и сколько их там всего.
                              Названия астрологических знаков, соответствующие неким созвездиям это не более чем дань традиции.
                              +1
                              нас двое
                          +2
                          Даже ваш них как бы намекает. :-D
                        +9
                        В дополнение можно отметить, что само участие в подобных тестах указывает на некоторую степень доверия астрологическим стереотипам.
                          +3
                          Не видел теста, на результатах которого основывается исследование в статье, но подозреваю, что он не имел отношения к астрологии. Просто результаты теста были сопоставлены с датами рождения участников.
                            +2
                            Печальное в том, что некоторые из этих тестов учитывают знак задиака, как один из факторов. Именно это и могло повлиять на распределение.
                              0
                              В вопросах соционических тестов нет ни прямой ни косвенной связи с датой рождения респондента. Вопросов вида: «что вам больше нравится лыжи или велосипед?» тоже нет.
                                +1
                                Ну не знаю. Может это мне так повезло, но почти все тесты (все 3 :) ), что я встречал, состояли из таких вопросов практически полностью.
                                0
                                Ну, если это тесты «узнай, насколько ты соответствуешь своему знаку зодиака», то я умываю руки.
                          +2
                          Сразу по началу стать впал в ступор, абсолютно все приложения врут, позволяют ответить человеку каким он хочет быть, а не какой он на самом деле. Да и соционика/интуиция определяется по внешнему виду и моторике и это просто невозможно сделать программно в настоящее время. Так что все соционическое тестирование можно сразу выбросить. Я и некоторые друзья тестировались используя около 5 тестов в соц. сетях и др. и ни разу не получили реальные результат.
                            0
                            Ой, опечатка, сенсорика/интуиция.
                            +1
                            А какой примерно масштаб у графиков? В среднем, так понимаю где-то 80 человек в день (м+ж) на каждом из 16?
                            Т.е. такие резкие скачки как на ESTJ (в начале) или другие весьма странно выглядят. Может какие-то проблемы с честностью людей? Есть ли проверка в этих соционических тестах того, на сколько честно отвечают пользователи? И откуда берется дата? (участники сами указывают или с анкеты в контакте?)
                              +2
                              Хотя, тут даже честность не совсем корректное слово. Мне кажется, что люди (даже ярые противники астрологии) знают общие стереотипы о знаках зодиака и непроизвольно начинают приписывать что-то в себе, присущее этим знакам. Ну и в контексте этого начинают проходить подобные тесты. Ученые получают вот такие графики, удивляются, публикуют. Профит.
                                0
                                Ну и дни рождения тоже указывают кто как — вон там на первом апреля какой пичище.
                              +14
                              Ох уж этот эффект лестницы. Хотел сказать, что те выступы на графиках показывают не то, что астрология — наука, а то, что эти аномальные отклонения от матожидания есть ни что иное как люди, которые слепо веруют в астрологию. Ну а значит качества «свойственные» своим знакам зодиака преувеличивают, а не свойственные преуменьшают. Это и объясняет резкие всплески на границах.
                              Поэтому вы можете подсчитать число таких людей, из тех, которые прошли соционические тесты. Ну а так как соционика очень увлекательна для астрологиофилов, то неудивительно, что этих людей достаточно много, чтобы увидеть их на графиках.
                                +2
                                Ну это только положение Солнца в знаках. В астрологии, для каждого человека высчитывается натальная карта — положение всех небесных тел в момент рождения. Солнце в Козероге, Луна в Овне, Сатурн в Скорпионе и т.д.
                                Очень много факторов.
                                Короче, сводить всё к знаку, в котором Солнце — не правильно. :)
                                  +1
                                  «Знак, в котором Солнце» — это как тот элемент корреляции с реальным миром (сезон рождения: климат, погода, освещенность, питание, культурные особенности, например праздники), за который цепляется вся описанная вами лженаучная структура с ее натальными картами, лунами в скорпионах и т. п. х. И плюс обратная связь: верящие в астрологию имеют привычку под нее подстраиваться.

                                  Если подобные исследования оформить по науке, то получится «астрологиоведение» по аналогии с «религиоведением», но сама астрология от этого ни на пиксель к науке не приблизится.
                                  +20
                                  Бред какой. Такие резкие границы именно по секторам зодиака (аж день-в-день!) говорят как раз именно о том, что есть обратная связь. Всё верно выше сказали — почти наверняка это от этого, что каждый знак преувеличивает в ответах этих тестов навязанные этому знаку стереотипные черты.

                                  Допустим, я «дева», мне любыми гороскопами приписывается «педантичность». В вопросах тестов, которые эту педантичность как-либо затрагивают есть тенденция выбирать с учётом этого допущения, тем более, если я сомневаюсь в ответах. Не у всех и не обязательно, конечно, но тенденция обязана быть, очевидно. Так и складывается такой вот чёткий всплеск.

                                  В любом случае, любые статистические исследования бессмысленные на настолько неравномерных/неслучайных исходных данных. И крайне нерепрезентативных (ибо как выше сказали связь между любителями соционики и гороскопов явно есть). Ещё можно было бы с натяжкой верить исходным данным, полученным в результате работы профессиональных психологов с людьми, но никак не в результате самостоятельных ответов на вопросы этого вашего приложения.
                                    +2
                                    Взять бы и выкинуть из выборки всех, кто в астролохию и соционику верит и посмотреть на результаты…
                                      +5
                                      Такие в сомнительных тестах не участвуют
                                        +1
                                        Думаю, что подсознательно это навязано обществом и въедается в головы.
                                          –1
                                          >астролохию и соционику
                                          Это никак не связаные вещи.
                                          Соционика всё таки претендует на научность, хотя конечно ей ещё развиваться и развиваться…
                                            +2
                                            Вера в одну хрень может говорить о том, что человек более склонен верить в любую хрень. Так что насчет отсутствия связи можно спорить.

                                            Наука подразумевает эксперимент, количественные оценки и т.д. Вы слышали про соционические эксперименты? Про гипотезы внутри соционики?
                                              –2
                                              Христиане верят в Бога, а ученые — в темную материю.
                                                +1
                                                Расскажите об отсутствии разницы между теорией, предположением и верой. А я послушаю.
                                          +2
                                          Подозрительные переходы на большинстве графиков — это у Козерога и Тельца, другие переходы плавные, хотя разница и значительна.

                                          Получается интересная вторичная статистика: корреляция между знаком Зодиака и верой а астрологию…
                                          +1
                                          > астрология

                                          До чего докатились… Может, еще и френологию вспомним?
                                          Нет, давайте лучше философский камень синтезировать…
                                            +3
                                            Необходимо учитывать, что на сегодняшний день соционические тесты имеют большую погрешность. Поэтому помимо ТИМа, часто учитывается его т.н. выраженность. Несколько лет назад с другом собрали примерно 2 тысячи анкет, где участники указывали дату и время рождения, а также походили два теста Кирси и Гуленко.

                                            После многочисленных анализов было определено, что многие вопросы тестов составлены некорректно. Например вопрос на экстраверсию/интроверсию «Новые и нестандартные отношения с людьми: а) стимулируют, придают Вам энергии; б) утомляют Вас», все выбрали первый вариант, причем даже якровыраженные интроверты (их «правильный» выбор — второй). «Перекос» по этому вопросу примерно 80% в сторону экстраверсии.

                                            С Гуленко похожая история. Наример пара: «Трачу энергию не задумываясь — Легко экономлю энергию» с почти все выбирают первый вариант с 80% «перекосом». А вот пара Завязываю контакты легче, чем расстаюсь — Ожидаю контакты от других людей» довольно точно определяет вертность с точностью 75%.
                                              0
                                              Ещё со старших классов школы, когда над школьниками проводились различные психологические тестирования, в каждом из тесте замечал таким образом поставленные вопросы, что ответы противоречили друг другу. Пример из пальца: в вопросе №26 «Любите ли Вы ходить на вечеринки» присутствуют ответы «очень», «если пригласят», «да, но только в компании друзей», «нет». А в вопросе №74 «Что Вы делаете в первую очередь, когда приходите на вечеринку?» нет вариантов ответа «я не хожу на вечеринки». И таких фактических ошибок, логических несоответствий в тестах, которые я видел, набиралось так много, что моё отношение к психологии не позволяет её помещать в структуру научных знаний.
                                                +2
                                                Вообще-то это классический способ проверки валидности ответов, на основани которых устанавливаются весовые коэффициенты для ответов (понижаются для противоречивых ответов на синонимичные вопросы в разных местах теста).
                                                  +1
                                                  Увы, я не в состоянии понять, почему неподчинение элементарным логическим законам должно служить маркером для верификации отвечающего. Логика либо есть, либо её нет.

                                                  Если встречаю противоречивые комбинации вопросов и ответов в тестировании, у меня, как проходящего тест, возникает огромное желание этот тест выбросить и пожалеть о потраченном на тест времени.
                                                    0
                                                    Если отвечающий дал разные ответы на один и тот же (переформулированный) вопрос разных местах теста, это значит, что отвечающий:
                                                    1. Не понял один из вопросов (или оба)
                                                    2. Солгал в одном из случаев
                                                    3. Ошибся, выбирая ответ

                                                    Во всех трех случаях проще отбросить такой ответ (ответы).
                                                      +1
                                                      Я говорил не про «синонимичные вопросы», а про то, что ответ в одном из вопросов делает некорректным другой вопрос! Такое — сплошь и рядом. В том числе и в тестах, составленных профессиональными психологами (ежели относить к таковым преподавателей с психологического факультета МГУ).
                                                    0
                                                    В Компьютерре №737 был опубликовано письмо математика, академика РАН Виктора Васильева по поводу некорректности многих вопросов, правда в IQ-тестах. Советую ознакомиться.
                                                      0
                                                      Я эту тему знаю не по статьям в Компьютерре, если вы это мне пишете.
                                                      0
                                                      Тут речь не о валидности. Я никогда не ходил на вечеринки и потому не могу честно ответить на вопрос «что вы делаете на вечеринках?» если нет варианта ответа «я не хожу на вечеринки». Любой мой ответ будет неверным, а значит вносить искажение в результат.
                                                      0
                                                      Ну психологи разные тесты используют. Часто встречается т.н. шкала лжи. Если испытуемый слишком часто выбирает «правильный» ответ, то весь тест считается невалидным. Например «Я всегда внимательно слушаю собеседника, кто бы он ни был».
                                                        0
                                                        А если действительно внимательно слушаю (ну или мне так кажется), раз уж начал беседу? А если кто-то говорит мне что-то несмотря на то, что я его не слушаю (и не делаю вид, что слушаю), то это кто угодно, но не собеседник.
                                                          0
                                                          Это будет означать, что вы не пройдете шкалу лжи: хотите показаться лучше, сознательно выбирая «правильные» ответы. Следовательно и на остальные вопросы теста скорее всего будут даны «правильные» ответы, не имеющие отношение к реальности. Весь тест будет признан невалидным.

                                                          Кстати, соционические вопросы, как правило, составляются так, что исключают «правильность/неправильность». В этом плане пройти социотест проще и после обработки можно получить количественное выражение «яркости» ТИМа и каждого его признака.
                                                            0
                                                            Если я действительно веду беседу, то слушаю собеседника, а если кто-то рядом «щебечет», а я, скажем, хабр читаю, то я беседу не веду и собеседника у меня нет. Если кто-то в это время считает меня собеседником, то зря.
                                                    0
                                                    Берем одну псевдонаучную и неверную теорию, накладываем на нее вторую такую и получаем… третью!

                                                    Давайте уберем лишние сущности. Можно посмотреть распределение по месяцам без привязки к знаку зодиака? А по времени года?
                                                      0
                                                      А, нашел.
                                                      0
                                                      А давайте еще биоритмы наложим!
                                                        +2
                                                        Я вижу ошибку в вашей формуле.

                                                        Правильная такая:

                                                        12*count/count(sex,type)

                                                        Дело в том, что есть определённые месяцы в которые по разным причинам люди мало зачинают детей.
                                                        Судя из вашей таблицы это с ноября по январь. Из-за этого вы увидели положительную корреляцию для Козерога, Тельца и Девы (стихия Земля). Это произошло из-за того, что в числителе у вас было countzodiac

                                                        Невооружённым взглядом видно, что для Земли у вас столбцы больше зелёные, для Воздуха (зачатие февраль-апрель) больше красные (что говорит о весеннем всплеске зачатий, характерном для всего животного мира).

                                                        Короче говоря, исправьте формулу и, я думаю, останутся менее значительные корреляции, которые я с удовольствием обсужу.
                                                          +1
                                                          countzodiac был не в числителе, а в знаменателе, так что все правильно.

                                                          Как раз таки ваша формула является сильно зависимой от рождаемости, поскольку при всплеске рождаемости у count тоже будет всплеск, а countsex,type будет неизменным.

                                                          Могу привести вывод его формулы:
                                                          k = count / countest, где count — реальная численность людей с заданными полом, типом и знаком, а countest — ожидаемая

                                                          countest = p * counttotal, где counttotal — общая численность опрошенных, а p — вероятность того, что очередной человек имеет заданный пол, тип и знак

                                                          p = pzodiak * psex,type
                                                          pzodiak = countzodiak / counttotal
                                                          psex,type = countsex,type / counttotal

                                                          После всех подстановок и упрощений получается ровным счетом формула автора
                                                          k = (count * counttotal) / (countzodiak * countsex,type)
                                                            0
                                                            я хотел сказать знаменатель в своём комменте. это описка.

                                                            Я нашёл ошибки в моей формуле, но всё-равно формула автора не верна. А теперь подробнее.

                                                            Первая ошибка в моей формуле есть в коэффициенте. Нужно использовать 16 (число психотипов), а не 12 (число знаков). Вторая в знаменателе нужно использовать countsex, zodiac вместо countsex,type

                                                            Правильная формула: 16*count/countsex, zodiac
                                                              0
                                                              Теперь ваша формула стала устойчивой к скачкам рождаемостей, но перестала быть устойчивой к неравномерному распределению людей по типам.

                                                              Пусть, например, люди с типом XYZT не любят участвовать в опросах и проходить тесты, и потому все значения для людей с этим типом ниже в два раза.

                                                              Тогда формула автора скорректирует эту неоднородность, а ваша покажет заниженную в два раза оценку.
                                                                0
                                                                такое ощущение, что общий вывод нашего спора таков, что на самом деле правильная формула будет намного-намного сложнее, чем моя или автора.
                                                              0
                                                              смотрю внимательно вывод — ошибок нет. но и во второй моей формуле — на мой взгляд тоже. буду благодарен, если найдёте ошибку во второй моей формуле
                                                                +1
                                                                Представим себе, что есть существенное число родителей, которые зачинают мальчиков преимущественно в одни месяцы, а девочек в другие (этого можно достичь с помощью абортов, например).

                                                                В этом случае p != pzodiak * Psex, type, так эти величины становятся зависимыми друг от друга. И тогда формула автора ошибочна.

                                                                Если предположить, что мамаши с логическими психотипами зачинают в оптимальное время года, чтобы обеспечить плод максимумом витаминов, а эмоциональные от балды, то опять таки величины pzodiak и Psex, type становятся зависимыми, так как эмоциональность, как и логичность передаётся по наследству. И опять формула автора ошибочна.
                                                                  0
                                                                  Вы забываете, что задача формулы как раз и состоит во вскрытии силы подобных зависимостей.

                                                                  Вернемся к k = count / countest. Здесь сравниваются реальное количество людей и количество людей, полученное из предположения о независимости вероятностей.

                                                                  Да, вероятности зависимы, но это не делает формулу неверной, поскольку задача формулы как раз и заключается в измерении зависимости.
                                                                    +1
                                                                    Автор хотел понять какая взаимосвязь есть между знаком зодиака и психотипом. И он её увидел. Но причины этой взаимосвязи совсем не в том, что эта взаимосвязь есть.

                                                                    Для измерения же истинной взаимосвязи между знаком зодиака и психотипом его формула не подходит, как и моя.
                                                                      0
                                                                      Что вы называете истинной взаимосвязью? Корреляцию или причинно-следственную связь?
                                                                        –1
                                                                        Под истинной взаимосвязью я понимаю максимально точно посчитанную корреляцию между знаком зодиака, психотипом и полом.

                                                                        Она должна учитывать помехи в расчётах, которые вытекают из сознательных и бессознательных поступков людей, связанных с выбором даты зачатия/рождения (знака зодиака), выбором пола ребёнка (аборты, остановку рождения детей после появления мальчика и т.п.) и даже выбором психотипа. На выбор психотипа ребёнка оказывается влияние в момент выбора жены/мужа/любовницы.
                                                                          +1
                                                                          Вы вообще знаете, что такое «корреляция»?
                                                                          Корреляция — это интегральный показатель, который измеряет сознательные и бессознательные поступки людей, связанные с выбором даты зачатия/рождения (знака зодиака), выбором пола ребёнка (аборты, остановку рождения детей после появления мальчика и т.п.) и даже выбором психотипа, а также все те факторы, которые вы еще не придумали.

                                                                          Понимаете? Вы еще только-только придумываете все эти факторы, а я уже знаю их сумму.
                                                                            0
                                                                            Только это сумма сама по себе мало о чём не говорит.
                                                                            А точнее говорит примерно о том, что если вы женитесь, то будете жить дольше)))

                                                                            Для исследователя сумма не так уж важна. Важно то, почему она такая.
                                                                            Важно не сколько, а почему.

                                                                            Да, всё-таки для меня важнее взаимосвязь и не только причинно-следственная, чем математическое понятие корреляция.
                                                                              0
                                                                              Как я понял, предлагается делать поправку на все эти факторы:) Я бы мог учесть что по выходным рождаемость на пару сотых процента меньше, а по вторникам на пару сотых процента больше, но это ровным счётом ни на что не повлияло бы.
                                                                                –1
                                                                                А как вы объясните преимущественно зелёный цвет первой стихии, красный второй, и примерную нейтральность третьей и четвёртой?
                                                                              0
                                                                              Я почему-то уверен, что помехи возникающие при тестировании в разы больше, чем влияние тех факторов, о которых вы говорите. Они возможно и существуют, но учесть их пока невозможно. И на первый взгляд не нужно.
                                                                            0
                                                                            > Но причины этой взаимосвязи совсем не в том, что эта взаимосвязь есть.
                                                                            А кто-то утверждает обратное? :D

                                                                            > Для измерения же истинной взаимосвязи между знаком зодиака и психотипом его формула не подходит, как и моя.
                                                                            Ну что вам в ней еще не нравится?
                                                                      –2
                                                                      Я думаю вы поняли общую мораль моих рассуждений:
                                                                      Люди — это не шары из теории вероятностей, а объекты принимающие самостоятельные решения.

                                                                      Женатые живут дольше неженатых не потому, что они женаты, как говорит статистика.
                                                                      А потому, что женщины реже выходят замуж за больных, слабоумных и задохликов.
                                                                        +1
                                                                        > Люди — это не шары из теории вероятностей, а объекты принимающие самостоятельные решения.
                                                                        Разумеется. Но задача исследователя — измерить, насколько эти решения самостоятельны.

                                                                        > Женатые живут дольше неженатых не потому, что они женаты, как говорит статистика.
                                                                        Статистика никогда не говорит о причинно-следственных связях.
                                                                          +1
                                                                          В данном посте у исследователя не было задачи проверять степень самостоятельности решений.
                                                                          И, да — статистика не говорит, и математика не говорит. Говорят люди. Хватит придираться к словам!
                                                                            +1
                                                                            Женатые живут дольше неженатых не потому, что они женаты, как говорит статистика.
                                                                            А потому, что женщины реже выходят замуж за больных, слабоумных и задохликов.


                                                                            Статистика говорит, что женатые живут дольше. Всё, больше она ничего не говорит. Почему они живут дольше она не говорит. Вы делаете предположение, что потому что женщины выходят замуж за тех, кто потенциально проживёт больше, а я делаю предположение, что потому что семейная жизнь способствует продлению жизни (скажем, нормальное, а не «холостяцкое», питание явно должно способствовать продлению жизни, или банально больше вероятность, что в случае сердечного приступа или серьезной травмы есть кому оказать первую помощь и вызвать скорую), а ещё кто-то делает предположение, что потому что так боги поощрят брак. Дальше мы можем искать доказательства своим предположениям, подключая логику, статистику, экспертные заключения и т. п. Может верно моё предположение, может ваше, может оба они имеют место быть, но имеют разный вес, а может одинаковый, а третий продолжает утверждать, что всё это проявление воли богов.
                                                                    0
                                                                    Точно не помню где я об этом читал, но в одном сервисе для знакомств пересчитали все счастливые пары, которые были образованы, и их «совместимость» знаков. В итоге получились почти идеальные средние значения, то есть все подходят ко всем :)

                                                                    Раньше тоже было интересно, опросил ну человек может 15) на эту тему — почти все, кто считает что знаки зодиака «работают» и все такое, в детстве имели родителей, у которых было много литературы (включая всякие гороскопы и газеты) на эту тему. Получились установки в детстве на будущее, вот и все.
                                                                      0
                                                                      Настоящая астрология куда сложнее того, «на какую дату попадает день рождения».
                                                                        0
                                                                        Ладно ещё на какую дату, но какой месяц…
                                                                      +2
                                                                      A попробуйте еще наложить данные на 12-летние циклы (китайские), так чтобы отслеживать данные для комбинации год+зодиак. Было бы очень интересно.
                                                                        0
                                                                        Было бы очень интересно провести подобное исследование в самом Китае. Аудиторию там можно поднять в разы больше.
                                                                          0
                                                                          Будет неинтересно.
                                                                          12-летние циклы не являются биологическими, и корреляции не будет.
                                                                            +3
                                                                            Спорное утверждение, есть солнечный цикл Шваба, который колеблется от 10 до 12 лет ru.wikipedia.org/wiki/%D0%A1%D0%BE%D0%BB%D0%BD%D0%B5%D1%87%D0%BD%D1%8B%D0%B9_%D1%86%D0%B8%D0%BA%D0%BB
                                                                              +2
                                                                              Вот именно, он колеблется, и совершенно не равен китайскому.
                                                                              Если искать корреляции, то надо сразу считать корреляцию с интенсивностью магнитных бурь, например, или с любым другим следствием неравномерного солнечного цикла, а от номера года толку не будет.
                                                                          0
                                                                          Есть своеобразный «раздел» популярной астрологии — так называемая «медицинская астрология».
                                                                          Там где львам приписывают наиболее частые болезни сердца, девам — болезни лёгких и т.д.

                                                                          Вот заdatamine-ить бы электронные медицинские карты на предмет соответствия знака зодиака и наиболее часто посещаемых врачей-специалистов… :)
                                                                            +1
                                                                            Давно мечтаю дорваться до подобной базы. Только с её помощью можно решать более полезные задачи. Например, подбор схемы лечения на основе статистики других пациентов с похожими симптомами и результатами анализов.
                                                                            +2
                                                                            Все стали обсуждать, чем могут быть объяснены, обнаруженные корреляции. Проблема же в том, что никаких корреляций обнаружено не было.

                                                                            Вот, например, «женщины козероги типа ISTJ встречаются в 1.5 чаще, чем если бы тип и знак были не связаны друг с другом»

                                                                            А как вы думаете, в случайной таблице 12x16x2, какова была бы вероятность встретить коэффициент 1.5?
                                                                              0
                                                                              А это в зависимости от размера выборки уже… Очевидно, что распределение ожидается нормальное. Так что на очень большой выборке (случайной как говорите!) вероятность встретить коэфф. 1.5 (особенно несколько) небольшой. А о причинах таких всплесков уже речь отдельная, выше уж сказал :)
                                                                                0
                                                                                Извиняюсь, равномерное распределение, конечно же, а не нормальное.
                                                                                  +1
                                                                                  Небольшой это не ответ. Если статья претендует на то, чтобы привнести «научность» в предмет, то следует эту вероятность посчитать.

                                                                                  Анализ данных основывается не на на том, что людям кажется, что что-то мало вероятно, а что-то вполне вероятно, а на конкретных вычислениях.

                                                                                  Вот скажем, 155 решек и 121 орел в 276 бросках это похоже на честную монету или нет? Можно, конечно, устроить дискуссию на эту тему, но лучше посчитать.
                                                                                    0
                                                                                    Вот скажем, 155 решек и 121 орел в 276 бросках это похоже на честную монету или нет?
                                                                                    Вполне похоже. Особенно в реальной жизни, а не в математике. А если монета кривая, то может и больше быть перевес. О том и речь. Так-то, в условиях отдельно взятого опыта вероятность выпадения 155 решек и 121 орла в 276 бросках равна вероятности выпадения 276 решек в 276 бросках. Не понимаю что это доказывает :) Вероятность посчитать в данном случае элементарно ведь. Но вероятность отклонения типа от мат ожидания и вероятность того, что коээфициент будет 1.5 мало связаны, не?
                                                                                  0
                                                                                  Параметры распределения:
                                                                                  Среднее значение = 1,00
                                                                                  Среднеквадратичное отклонение = 0,11

                                                                                  Вероятность того, что заданное число больше 1,5 = 0,00
                                                                                  Вероятность того, что одно из чисел больше 1,5 =… тоже 0,00!



                                                                                  Так что 1,5 — это все равно аномальное значение. Вот 1,3 — уже аномальным не является.

                                                                                  PS распределение я взял нормальное. Конечно, распределение Стьюдента было бы точнее, но на такой выборке разница минимальна.
                                                                                    +1
                                                                                    Да, для одного числа правильно. Там примерно 5 сигма, то есть 0.023%. Правда, не очень понятно, как вы считали вероятность того, что хотя бы одно такое число не встретиться. Вероятность того, что одно число не выйдет за 5 сигма (1 — 0.023%) = 0.99977. Вероятность того, что n чисел не выйдут 0.99977 ^ n, у нас таблица с 12x16x2 = 384 ячейками. 0.99977 ^ 384 = 0.915. Соответственно, искомая нами вероятность 8.5%. Что обычно аномальным не считается.
                                                                                      0
                                                                                      Впрочем, хочу заметить, что я предлагаю проверить гипотезу независимости социотипа от знака зодиака, а не отклонение от нормальности коэффициентов таблицы.
                                                                                        +1
                                                                                        Нет, тут я, конечно, ступил, там гораздо меньше, чем 0.023%. Впрочем, возражение против проверки нормальности коэффициентов остается в силе.

                                                                                        Главное же, что я хотел сказать это то, что автор должен был привести результаты вычислений, а не ограничиться картинками, которые ничего не доказывают.
                                                                                          0
                                                                                          Результаты вычислений тоже ничего не доказывают в силу сомнительности источника. :)
                                                                                          0
                                                                                          Вы девятками ошиблись.

                                                                                          5 сигм — это 0,9999997
                                                                                      +2
                                                                                      Насчёт резких переходов между знаками на графике, если это правда, я склонен предполагать, что имеет место влияние личных астрологических убеждений на поведение человека. А по поводу зависимости особенностей личности от времени года рождения — для себя объяснял это тем, что начальные этапы развития ребёнка проходят в разных условиях. Грубо говоря, то в какое время года он делает первые шаги на улице — зимой или летом, насколько сильно ребёнок при этом замотан в тёплые вещи и может смотреть по сторонам, насколько комфортно себя ощущает, насколько много вокруг него других детей, всё это может (теоретически) по-разному сказываться на формировании личности.
                                                                                        0
                                                                                        Я тоже не верю в астрологию и всю эту лабуду, но общие психологические черты у людей родившиеся в близкие периоды года (знаки зодиака) не заметить просто невозможно. Да, есть люди не вписывающиеся в систему, но тех кто вписывается, гораздо больше. И дело тут конечно не в планетах и созвездиях.
                                                                                          +1
                                                                                          По-видимому, сказывается недостаток или переизбыток тех или иных веществ в период развития плода, возникающий в связи с особенностями питания в разное время года.
                                                                                            0
                                                                                            И что, недостаток или переизбыток тех или иных веществ в одно время года одинаков у жителей Южной Америки или Австралии и Канады или России? Кроме России нигде не был, но что-то дико сомневаюсь, что такое возможно.
                                                                                              0
                                                                                              Ну, ежели он одинаков у жителей противоположных полушарий, значит, на самом деле никаких совпадений нет. И все надуманно.
                                                                                          0
                                                                                          Прочитал с интересом, положил себе в копилку. Было уже ранее подобное исследование: sss.socioland.ru/forum/viewtopic.php?t=1886
                                                                                          У вас выборке в полмиллиона человек присваивали тип полмиллиона человек. Кроме того, вы сами говорите, что каждый из них определяет с крайне низкой точностью.
                                                                                          Вот когда один человек оценивает разных людей — и этот оценивающий считает себя экспертом в определении типа — тогда и можно было бы говорить, что есть какая-то закономерность.
                                                                                          Но… Как оказалось, и в этом случае тоже нет никакой закономерности, никакой корреляции.
                                                                                            +2
                                                                                            1. Астрология — лженаунка
                                                                                            2. Теория Юнга — всего лишь теория

                                                                                            Итого. Топикстарте наложил одноу каку на другую, нашел корреляции и радуется

                                                                                            В следущий раз предлагаю на график рождаемости наложить расписание электричек. Я просто уверено, что тоже найдутся корреляции.
                                                                                              +1
                                                                                              Конечно, потому что вдруг окажется, что расписание электричек тоже зависит от планетарных циклов, так же как их нарушение. Это было бы интересное исследование, особенно интересно — зависимость нарушения расписания в зависимости от положения Меркурия, его директность или ретроградность, ну и его аспектов к другим планетам! ))))))
                                                                                              +5
                                                                                              Наблюдаю в комментах традицию научной дискуссии.

                                                                                              1. Если результат эксперимента подтвердает любимую теорию комментатора: «Ну конечно, это же очевидно, как может быть иначе, только идиот может оспаривать.»

                                                                                              2. Если результат эксперимента опровергает: «Автор — идиот, результаты подтасованные, и вообще у него пулеметы не той системы».

                                                                                              Как это все знакомо :)
                                                                                                0
                                                                                                Астрология — фигня на постном масле.
                                                                                                Чистый развод.
                                                                                                И всякие Нострадамусы вместе с ними.
                                                                                                  0
                                                                                                  Если эксперименты (репрезентативные выборки) подтверждают «законы» астрологии, то, как минимум, это не фигня. Может прямой причинно-следственной связи между «Венера в Тельце» и характером человека и нет, но это не значит, что астрологию нельзя использовать как практический инструмент. Какая разница есть бог или нет, если вера помогает людям лучше жить.
                                                                                                    0
                                                                                                    Зависимость характера от знака зодиака — это очевидная вещь, никак не связанная с положением неких планет.
                                                                                                    Гороскоп на завтрашний день — вообще бред.
                                                                                                    «Может быть то, а может быть сё»
                                                                                                    А может быть и не может мочь…
                                                                                                      0
                                                                                                      Почему это она очевидная? Для меня совсем нет.
                                                                                                  +3
                                                                                                  Лет десять назад в рамках проекта IQrate я проводил точно таки исследования. Психотип определялся по тесту Кейрси. Это наиболее адекватный тест, он дает 4 фактора и, соответственно, 16 типов. Для зодиакальных типов были составлены их описания в соответствующих факторах. Рассчитанная вероятность случайного совпадения (хотя бы 3 факторов из 4) составляла около 23%. По результатам тестирования около 80 тысяч человек, а это статистически огромная выборка, совпадение составило те же 23%. Более того совпадение было еще и в двух знаках после запятой. Правда при тестировании люди не знали, что будет сравнение с их гороскопом, а значит и влияние их «предустановки» было минимально. В случае, приведенном у автора поста, скорее всего сыграла «наводка» от знания «правильного ответа» и веры людей в гороскопическую ересь. Но в этом случае результат может быть интересен как оценка влияния предустановки.
                                                                                                    0
                                                                                                    В данном исследовании люди тоже не знали, что результаты будут сопоставляться с их гороскопом. В процессе тестирования не было вообще никаких упоминаний астрологии. Чисто субъективно мне кажется, что «наводка» маловероятна, также некоторым комментаторам тоже чисто субъективно кажется, что она имеет место быть. Обе точки зрения для меня пока не имеют убедительных обоснований.
                                                                                                    +2
                                                                                                    Очень «размытые» данные взяты за основу. Дело в том, что не только Солнце влияет на темперамент. Есть еще 7 планет, которые формируют картину характера человека. Причем к примеру Луна считается вторым по силе после Солнца, иногда возможны случаи когда положение Луны в гороскопе может сильнее влиять на характер, чем Солнце. Еще зависит от того в каких знаках расположены другие планеты. А еще зависит в какой знак попадает Асцендент! (Асцендент — это точка восхода солнца для определенной местности ). А асцендент зависит от местности и времени рождения. А еще зависит какие планеты попали в первый дом! А еще есть — стелиум. Это когда 3 и более планет в одном знаке, тогда Солнце нервно курит в сторонке в влиянии на характер против этих 3 и более планет в др знаке :). А еще есть понятие как синтетический знак, это знак который формируется по стихиям и типу знаков зодиака (кардинальный, фиксированный, мутабельный).
                                                                                                    В общем… Слишком мало исходных данных.
                                                                                                    Из всех этих графиков можно сделать вывод, что веселее зачинать детей летом, а осенью это не так популярно. )))
                                                                                                      0
                                                                                                      Выборка очень слаба. Особенно если учесть, что в соционике до сих пор нет теста, дающего более-менее достоверные результаты. Попытки привязать соционику к астрологии и прочей эзотерике не увенчались успехом.

                                                                                                      Кстати, вроде как генетическую природу психотипов уже доказали на примере однояйцевых близнецов — они всегда имели один психотип. Филатова со своим сыном впоследствии пытались определить группы генов, исследуя зависимость психотипов детей от психотипов родителей. Но, как всегда, проблема стояла за достаточно большим объемом достоверной выборки.
                                                                                                        0
                                                                                                        поискал «значимость» на странице — не нашёл. значит статзначимость не обсуждалась.

                                                                                                        стоит ли читать остальное? :)
                                                                                                          0
                                                                                                          всё-таки стоило включить в анализ зависимость от праздников и каникул

                                                                                                          Only users with full accounts can post comments. Log in, please.