Pull to refresh

Comments 110

Шкала времени в unix timestamp вместо yyyy-mm-dd — это что-то новое )
Ещё скажите, что дни недели в виде [0-6] вам не нравятся! :)
Не всех языках программирования wday 0 это Monday, кстати.
В С, Perl 0 — это Sunday, например.
Это еще зависит от локализации, в России первым понедельник, в США воскресенье
Это понятно. Непонятно, зачем тащить такое обозначение в визуализации, которые, вроде как, призваны упростить понимание происходящего.

Удобно 1 = monday, 0 и 7 = sunday. И нашим, и вашим, так сказать.

В некоторых языках нулевого дня вообще нет
Зато есть нечто похожее :)
А есть серьезно — в данном случае сыр-бор скорее не из-за «нулевого дня», а из за «номера первого элемента массива».

Вообще конечно выглядит как подтверждение гипотезы, что корпорации мстят Столлману за свободный софт.

С моей точки зрения это выглядит, как попытка высосать из пальца аргументы, подтверждающие гипотезу.

Ну то есть, в наш репозиторий коммиты в будние дни поступают значительно чаще, чем в выходные (порой в выходные коммитов нет вовсе), значит, по логике автора, разработку курирует какая-то корпорация. Ах, если бы это было так, увы, проект чистой воды хобби и никакой компании он не сдался.
На выходных совсем нет времени заниматься хобби, может вечером в воскресенье могу посидеть чего-нибудь поправить, да даже вечером в будни особо не посидишь
UFO just landed and posted this here

Там многие пояснения к графиу с очень натянутой совой подходят к тому что на нем изображено. Например расхождение в 1.5 раза коммитов в выходные слабо подходит под "в выходные ничего не коммитят, в отличие от сторонников"

UFO just landed and posted this here
Видно, что репозиторий сторонников гораздо активнее. Коммитов в репозиторий противников за последнее время практически не было. Репозиторий сторонников продолжает обновляться.

Странно, у вас хватило сил собрать статистику по звездам и коммитам, но почему-то не хватило прочитать первую строчку README к репозиторию противников, которая еще и выделена жирным к тому же:


As of April 1, 2021 00:00 UTC we are no longer accepting signatures.

Я сейчас не обсуждаю, кто прав и кто виноват в истории со Столлманом. Я лишь говорю, что в погоне за "правильными" выводами, вы сравнили яблоки с апельсинами и не заметили этого как минимум в одном месте. Можно ли доверять остальным выводам в вашей статье, или они так же притянуты за уши — вопрос.

На графике видно, что к этому моменту они уже выглядели как "плато". То есть где тут больше хорошей мины при плохой игре, а где "мы всё доказали" — ещё надо выяснять. Учитывая, что процедура отзыва подписи передумавшими сгонять RMS(а равно и правок фактических ошибок в "приложении") там тоже принципиально(от слова "нет и всё тут") отсутствует — скорее первое.

Да, к 1 апреля они уже очевидно проигрывали по коммитам. Но автор пишет в своем выводе (который я и процитировал) не об этом. Он пишет "коммитов в репозиторий противников за последнее время практически не было". А откуда им взяться, если они уже месяц не принимают подписи? И график у него не до 1 апреля, когда сравнивать было еще корректно. Это же явная манипуляция статистикой. Не очень хорошо такое допускать, особенно после раздела "Замечание о научной честности".

А откуда им взяться, если они уже месяц не принимают подписи

Меня тоже занимает этот вопрос. Ведь они там очевидно есть?
к 1 апреля они уже очевидно проигрывали по коммитам

в смысле «проигрывали»? где-то шла речь о голосовании? к 1 апреля закончили принимать подписи, потому что стало понятно, что протест выразило уже достаточное количество людей, и в дальнейшем сборе подписей нет необходимости.
это не соревнование, кто перетянет канат — это заявление, озвучивание позиции.
но защитники Столлмана, так и не поняв смысла открытого письма, всё ещё собирают подписи, как будто это что-то меняет.
UFO just landed and posted this here
Апелляция к личности, так-то, не очень красивый прием в дискуссии
UFO just landed and posted this here
UFO just landed and posted this here

Когда оппоненты только и делают, что на личности переходят — что еще остается.

Не быть такими, как они, как мне кажется? Тем самым наглядно демонстрируя, кто именно из двух спорящих здесь — д'Артаньян?

UFO just landed and posted this here
UFO just landed and posted this here
Апелляция к личности, так-то, не очень красивый прием в дискуссии

по моему опыту, это стандартное поведение таких «защитных» кампаний: в ответ на любое мнение, хоть сколь-нибудь отличающееся от хвалебных речей, сразу перевести на личность, закидать дизлайками, переврать аргументы и отзеркалить, как бы абсурдно это зеркалирование не звучало.
вот, к примеру, Аморалист пишет, что я пришла сюда
рассказывать про то, какие сторонники Столлмана дураки

и приводит в доказательство мой комментарий о том, что:
Столлман — весьма яркий пример белого цисгендерного мужчины, считающего, что всё обо всём знает и может всё за всех решать.

где здесь хоть намёк на то, что его сторонники — дураки?!
я написала, что он «пример белого цисгендерного мужчины», коим он действительно является. также я указала на то, что он «считает, что всё обо всём знает и может всё за всех решать», что обусловлено его высказываниями о третьих лицах, его советами и наставлениями, которые он даёт людям, которых он не знает и которые не просили от него этих советов. но всё это — лишь констатация фактов. и ни слова о дураках.
и что я имею в ответ на простое выражение своей позиции? кучу негатива в мой адрес, хабро-карму в глубоком минусе, из-за чего я не могу нормально выражать своё мнение (например, голосовать) — и отсутствие даже намёка на адекватную дискуссию. так скажите мне, зачем мне приходить на хабр в принципе, кроме вопроса, действительно возмутившего меня до глубины души?!
UFO just landed and posted this here
У письма столько смыслов, сколько людей его прочитало. Мнение автора письма тут не играет особой роли. Письмо живет в публичном пространстве независимо от автора. Слово — не воробей (с). Поэтому, если много людей поняло письмо иначе, чем Вы — это проблема письма, что оно так неоднозначно написано.

Как удобно, сначала критики хотели показать каких их много и какие они важные.
Потом обделались и теперь как ни в чём не бывало оправдываются, типа "ну и что это не голосование".

сначала критики хотели показать каких их много и какие они важные.

а такие сведения откуда? или это, как водится, личные домыслы?
Это следует из факта сбора подписей. Критики могли говорить, что стремились к иному, но их действия демонстрируют именно попытку спроецировать социальный вес и важность. Смысл публичных действий, опять же, определяется не тем, к чему стремился субъект, а то, как они повлияли на окружающих и как окружающие оценили этот смысл.
Всякие диктаторы тоже стремились к хорошему всегда, к высоким целям…
то есть, всё-таки про
сначала критики хотели показать каких их много и какие они важные.

это личный домысел, так как
Смысл публичных действий… определяется тем,… как они повлияли на окружающих и как окружающие оценили этот смысл.

здесь я согласна, что цель открытого письма в том, чтобы озвучить окружающим свою позицию, и для этого, безусловно, необходимо набрать некоторое достаточное количество подписей. но вот это вот ребяческое «посмотрите как нас много и какие мы важные» в данном случае не имеет никакого смысла, потому что те, кто высказали заявление, высказанное в открытом письме, и все, кто с ними согласны, будут действовать в соответствии со своим заявлением вне зависимости от какого-либо мнимого голосования.

а вот поведение защитников Столлмана как раз очень напоминает «посмотрите как нас много и какие мы важные»: очевидно, они до сих пор не могут остановиться в сборе подписей, видимо, потому что всё ещё не уверены в достаточности своей важности. при этом они, видимо, не понимают, что сколько бы подписей они не набрали, это никак не повлияет на позицию оппоненток. эта позиция может измениться только в случае реального изменения поведения Столлмана.

кроме того, хочу сообщить, что вы (те, кто так ожесточённо дизлайкали мои комментарии) наконец добились своего: моя хабро-карма снизилась до такой степени, что я не могу писать комментарии чаще одного раза в день. я не считаю такое положение дел нормальной дискуссией, так что прекращаю её. я не буду теперь беспокоить ваше уютное хабро-болото своим неудобным, раздражающим вас мнением. как, наверное, вам теперь будет удобно: одни только восторженные крики — и никто этому не противоречит, никто не высказывает аргументы против. правда, непонятно, как вы теперь сможете определить истину, которая, как известно, рождается в споре, но, видимо, вам однобокое мнение интереснее. томитесь безмятежно в собственном соку.
Призывы к увольнению людей за высказывание их мнения — корректного или не очень — тоже не являются частью нормальной дискуссии в обществе.
Как известно наши недостатки это продолжения наших достоинств. В данном случае демократия пытается продолжить себя в тоталитаризм, в охоту на ведьм.
это личный домысел

А что по-вашему не личный домысел? То что Вы тут пишите — это личный домысел или нет? Если нет, то что это?


чтобы озвучить окружающим свою позицию,… необходимо набрать некоторое достаточное количество подписей.

А для того что бы продемонстрировать, что эта позиция — всего лишь позиция некой своеобразной группы людей, не отражающей ничего кроме их очень нетипичного восприятия мира — нужно набрать больше подписей за более короткий срок. А то так можно подписи и под назначением Васи королем Нибиру собрать.


поведение защитников Столлмана

Направлено на демонстрацию того, что более спокойное восприятие Столлмана является намного более типичным, чем та агрессивная позиция, которая была озвучена в письме противников. И что позицию противников не обязательно воспринимать слишком серьезно, потому что она мало о чём говорит, кроме как о том, что на Земле живет очень много людей и любая точка зрения может набрать 1000 голосов, даже про Нибиру.


я не могу писать комментарии чаще одного раза в день

общество оценило ваши посты как флейм и разжигание пустословия, видимо.


уютное хабро-болото

Ну если у нас болото, то как Вы называете свое сообщество, которое, видимо, меньше и более огражденное и отстранённое от остального мира?


своим неудобным, раздражающим вас мнением

Скорее слабо артикулированным, необоснованным, претенциозным, надменным и самовлюбленным. Неудобного и раздражающего в нём ничего нет.


одни только восторженные крики — и никто этому не противоречит

Вы, видимо тут недавно. На хабре как раз считается хорошим тоном аргументированный диспут, коих тут валом. А вот субъективные необоснованные агрессивные хамские выпады редко встречают всеобщее одобрение.


никто не высказывает аргументы против

Так и Вы их не высказываете. Потому Вам и слили карму — Вы не привносите новых необычных аргументов в спор, а только лишь пытаетесь уколоть оппонентов.

На хабре как раз считается хорошим тоном аргументированный диспут, коих тут валом. А вот субъективные необоснованные агрессивные хамские выпады редко встречают всеобщее одобрение.

Давайте проверим эту гипотезу на примере прямо этой самой ветки комментариев.


Сначала следует "субъективный необоснованный агрессивный хамский выпад" с рейтингом -19:


защитники Столлмана, так и не поняв смысла открытого письма, всё ещё собирают подписи, как будто это что-то меняет

А дальше начинается "аргументированный диспут, коих тут валом" с рейтингом +7:


оскорбленная за других феменистка, которая на хабре появилась ради рассказов про цисгендерных угнетателей, вздумавших пасть раскрыть, и сюда придёт рассказывать про то, какие сторонники Столлмана дураки

Ну и в обратную сторону. Попробуем угадать рейтинг комментария со следующими фразами:


шестипроцентных клоунов… когда их закидали ссаными тряпками… обиженные снежинки

Да, совершенно верно, ни одной необоснованной субьективной оценки, +17.


Получается что да, на хабре все работает ровно так, как вы и написали.

Давайте проверим эту гипотезу на примере прямо этой самой ветки комментариев.

Ваш комментарий как раз иллюстрирует мой тезис :). А так, конечно, всякое бывает.

и более огражденное

В твиторо-буках оно явно более шумное. Правда, путают "шум" с "важностью" и "правильностью", но в этом ничего нового нет.

Да, хабра-болото в который раз доказало, что является именно болотом и ничем иным. Цивилизованные люди, как правило, такие посты (и дискуссии к ним) не читают, либо не комментируют, и потом каждый, кого мнение не совпадает с мнением толпы, выглядит, как один в поле воин.

Но всё равно, хотелось бы написать вам, @cappa, именно публичные слова поддержки. Нас не так мало, как может показаться.

UFO just landed and posted this here
UFO just landed and posted this here

Я имел ввиду, что, если автор не заметил даже той очевидной проблемы со статистикой, на которую я указал выше, можно ли надеяться, что все остальное в его логике рассуждений верно. Претензия же была не к коду, а к непонимаю предметной области.


Но вообще да, было бы интересно перезапустить все рассчеты, взяв только промежуток до 1 апреля, и посмотреть, устоят ли остальные выводы.

UFO just landed and posted this here

Зачем? Да хотя бы ради той самой научной честности, которая декларируется в начале статьи. Хотите занимать стороны и подгонять решение под ответ — я не против, но не пишите о научности тогда.

Учитывая, что сбор подписей "за" начался позже, резать по одной дате тоже неправильно.
Можно попробовать подобрать масштаб и сдвиг такие, что кривые максимально точно совпадут.

Кстати не факт, что всё началось с корпораций. Вполне может оказаться, что вся активность началсь всё с тех же шестипроцентных клоунов, которые примерно тогда же попытались организовать рейдерский захват GNU, состряпав сайтик со своими хотелками (выдаваемыми, ни много, ни мало, за социальный контракт всего GNU проекта!) и объявив, в лучших традициях майданов, что мы тут власть… а когда их закидали ссаными тряпками, то объявили, что всех остальных они просто забанят.

Офигительно: когда 6% участников проекта решают за всех — это, нонче, «демократия». Самый лучший способ добиться толерантности…

P.S. Понятно, что SJW упустить такой сладкий шанс «свалить» человека, который реально чего-то сделал и чего-то стоит упустить не могли и дальше уже раскрутка шла, как описано в статье — через корпорации и настоятельные «пожелания менеджмента» вписаться за «благое дело». Но вполне возможно, что изнчально это не — «месть корпораций», а вот эти вот самые «обиженные снежинки»…

Кста ещё сторонникам RMS рассылали письма типа "если не отзовёшь подпись, мы напишем твоему работодателю"

UFO just landed and posted this here
UFO just landed and posted this here

А есть форк, который делает обратное?)

UFO just landed and posted this here

А ещё из распределения по дням недели видно, что все противники проголосовали в первые в 4 дня с 24 по 27 марта по убывающей. Поэтому в субботу больше голосовавших, чем в понедельник.
Так что выводы автора, очевидно, неправильные.
Аналитика не такая простая штука, как может показаться на первый взгляд, слишком много нужно учитывать.

weekday = datetime.datetime.strptime(line.strip(), '%Y-%m-%dT%H:%M:%SZ').weekday()

Можно легко переделать, чтобы 1 — был понедельник, а 7 — воскресение:
weekday = datetime.datetime.strptime(line.strip(), '%Y-%m-%dT%H:%M:%SZ').isoweekday()
Как мне кажется, так будет более понятней для русскоязычной аудитории.
Ну и секунды с начала эпохи тоже не очень понятны :)

UFO just landed and posted this here

Её вам с большим удовольствием раскроют эксперты с opennet. Никто ещё не усомнился в их непредвзятости
/sarcasm

Ооооо. Комментарии на opennet это отдельная история, есть фотография где мужик в Бангладеше нырял в канализацию чтобы ее почистить, собственно после прочтения комментариев у меня было подобное чувство что я в этой коричневой жиже, таких срачей нет даже в политических темах.

Формальная сторона начала всей этой бучи как-бы заключается в том, что кто-то из близких знакомых Столлмана побывал на научной конференции, проводившейся на острове Эпштейна. На этом острове много кто был, например иконы IT индустрии, но уже с vip-обслуживанием.
Полицейский, который проводил в дальнейшем расследование, что там было, собрал кучу информации и… догадался сбежать в Россию.Сейчас он у нас. Он — политически активный, у него есть канал на youtube — John Mark Dougan, регуляно делает трансляции и его можно пораспрашивать. Он немного за время пребывания в России успокоился и сейчас лицо не так сильно дергается. Рассказывать о таких вещах как компромат на принца Эндрю он очевидно не будет, ну а об мелкой сошке таких ограничений нет.
Рассказывать о таких вещах как компромат на принца Эндрю он очевидно не будет, ну а об мелкой сошке таких ограничений нет.

Если бы ещё было о чём рассказывать в этом случае, потому что ничего и не произошло: "Benford says he watched Guiffre approach Minsky and watched him turn her down, and that Minsky talked about it to him afterward and that Guiffre did not approach Benford after seeing them speak about her." и "Minsky's widow, Gloria Rudisch, says that he could not have had sex with any of the women at Epstein's residences, as they were always together during all of the visits to Epstein's residences".


И нет, даже это не "формальная сторона", потому что Столлман тогда усомнился в верности применения термина "насилие" в обвинении.

Там же вроде история в том, что формально по законам в штатах(возможно не во всех) секс с несовершеннолетним считается изнасилованием, а Столлман лишь задавался вопросом корректно ли называть секс с 17-летней по обоюдному согласию «изнасилованием». Причем он даже не оправдывал сам факт секса, а рассуждал лишь о терминологии.

Отъезд Дугана никак не связан с этим расследованием.

И если уж собирать до кучи, то vip-доставки на остров Эпштейна удостаивались лишь самые избранные (на картинке выдержки из записной книжки Эпштейна, где он вел учет этих самых-самых).

image
Отъезд Дугана никак не связан с этим расследованием.

Но это согласно вики… Там есть своя «правильность изложения».
А вот статья в The Sun — www.thesun.co.uk/news/9978352/mi6-fears-russia-link-prince-andrew-jeffrey-epstein-abuse
Статью же в Times прочитать сложно — они просят деньги и подписку.
www.thetimes.co.uk/article/87876edc-dc88-11e9-9cfd-b79996a387b0

Порадовало верное правописание про Столлмана, а то многие профаны все еще используют аббревиатуру среднего квадратичного значения при упоминании Столлмана, не осозновая "фонетизм".

правописание
осозновая

Ну как так-то? :)

Прошу, автор, разбросайте по тексту побольше упоминаний Столлмана, особенно в начале аналитической части. Слишком долго пытался понять, против чего именно названные "противники" и за что именно "сторонники", пока не долистал до середины статьи.

У исследования должна быть цель. Какая цель этого исследования? Вы сравниваете цифры. Для чего? Вы хотите создать социальный портрет человека поддерживающего С. и портрет человека желающего его отставки? Совершенно неважно как мы охарактеризуем тех и этих. Потому что это то, что называется подгонка под ответ. Вы в данных ищете подтверждение своих суждений. Пытаетесь придумать такое объяснение данным, чтобы оно смотрелось по возможности «интересно». В любом случае тут присутствует т.н confirmation bias. Всё «исследование», по факту, родилось из наличия данных. Это заведомо ложный путь.

Исследование должно рождаться из вопроса. И можно было бы аргументировать, мол, вот мой вопрос: «Чем обьясняются разные значения показателей тех и этих?» Но тогда нет исследования. Потому что исследование, это постановка и проверка гипотез. Гипотезы тут может и присутствуют, но нет их проверки. А для проверки гипотезы, что люди с такими характеристиками профиля гитхаба, например, «работают над open source за зарплату», пришлось бы взять независимую выборку и проверить ее. Скажем, проведя анонимный опрос. Но тут этого не происходит. Значит гипотезы остаются гипотезами. Так вот, открою секрет, чтобы выдвигать гипотезы вообще не нужны никакие данные.

Короче, для псевдо-журнализма пойдет, а вот на научный метод не тянет даже близко.
Всё «исследование», по факту, родилось из наличия данных. Это заведомо ложный путь.
Странно. А когда ровно таким же путём делаются выводы про покупателей пончиков или там мерседесов, на основании логов с веб-сайтов — это считается нормальным подходом.

Вы в данных ищете подтверждение своих суждений.
Ну так поищите и вы.

Короче, для псевдо-журнализма пойдет, а вот на научный метод не тянет даже близко.
В таком случае вся история — у вас получается не наукой. Потому как там, обычно, не получается «провести анонимный опрос». Приходится работать с теми данными, что есть.

Короче, для псевдо-журнализма пойдет, а вот на научный метод не тянет даже близко.
Я бы сказал, что для тех затрат, которые ушли на это исследование — результат максимально близок к научному.

Да, устроить опрос было бы точнее — но это, увы, уже совсем другие деньги.



это считается нормальным подходом
К сожалению. А потом мы читаем, что в научном мире кризис репликации. 40% экспериментов по экономике не поддаются воспроизведению.
Такими статьями мы только понижаем планку и подаем плохой пример.

Ну так поищите и вы.
Не имею такой склонности. Предпочитаю смотреть на чистые данные, без интерпретации.

В таком случае вся история — у вас получается не наукой
Да, историкам, как правило затруднительно провести классический эксперимент. Но и они пользуются математической статистикой, множеством методологических наработок из других наук, и их гипотезы на что-то опираются. Они строят гипотезу, например, что какое-то племя имело определенный обычай, а потом ищут факты эту гипотезу подтверждающие или опровергающие. Это отдаленно напоминает работу сыщика, который ищет улики, опрашивает очевидцев, роется в архивах, а потом соединяет все в единую картину. И точно так же они могут попасться на крючок когнитивному искажению и начать подгонять находки под гипотезу. Но хороший историк так делать не станет.

для тех затрат… результат максимально близок к научному.
Да, устроить опрос было бы точнее — но это, увы, уже совсем другие деньги.

Возьмем чисто вымышленный пример, для того чтобы определить наличие антител в крови, нужно пробу обработать агентом и гонять на центрифуге, потом плазму обработать еще чем-то и посмотреть на реакцию.
Теперь предположим, кто-то заявляет, что приблизительно он может определить наличие антител, капнув крови в водку с лимонным соком.

И получается, есть научный метод выявления. и есть метод который иногда, по совершенно от наличия антител независящим причинам, может дать тот же результат что и лабораторный. И вот удивительно в шести случаях из десяти результат совпадает с лабораторным, т.е. максимально близок к научному. Максимальнее уж и некуда, коли других кандидатов нет. Да еще и дешево.
Жаль вот только, корреляция не подразумевает причинно-следственной связи.
по сути, у вас претензия только в том, что не сформулирована гипотеза исследования.
Потому что построение выводов на основе обработки некоторого массива некоторых данных — это вполне себе нормальный научный подход, к которому кризис воспроизводимости не имеет никакого отношения.
Гипотез сформулированно несколько. Нет цели исследования и нет проверки гипотезы.
Это ведет к построению причинно следственной связи где ее может не быть.
Группе людей бездоказательно, приписывают свойства которых они могут не иметь.
Например, то что люди которые, меньше работают над проектом на выходных — корпоративные работники. Это одна из возможных гипотез которые можно построить на основе полученой статистики. Но эта гипотеза никак не проверяется. Поэтому остается гипотезой.
А проверить это можно, сделав контрольную группу про которую мы достоверно знаем что она имеет интересующее нас свойство. И сравнив нашу выборку с контрольной группой статистическим тестом на совпадение, чтобы убедиться, что оно не случайно.

К сожалению сам повод слишком политизированный, хотя он меня в данном моменте вообще не волнует, поэтому вектор критики воспринимается искаженно. Я забыл учесть это. А он чисто направлен на подход к анализу, и никак не на тему исследования.
авторы же принимают пулл-реквесты, можно намекнуть им на новый путь развития исследования.

Тут проблема начинается с того, что в обществе нет однозначной оценки культуры отмены, а сам этот термин обычно несет негативную коннотацию. И чтобы хоть как-то избавиться от политизированности подобных исследований, предстоит для начала изучить их этичность в принципе, но это уже больше вопрос для социологии.

можно представить на суд общественности просто графики, без каких-либо интерпретаций.
Естественно, исследователь занимает ту или иную позицию, в любом случае. Но если исследователь не предоставил тот или иной график, то можно предложить ему добавить его в исследование, либо посчитать самому.
Тут было бы полезно, чтобы были представлены данные (сырые или обработанный датасет), по которым строились все эти графики.
Надо ловить момент, пока искусственный интеллект не занял какую-нибудь политическую позицию.

Конкретно в этом случае предоставляется не голый дата-сет, и предвзятые суждения содержатся даже в заголовке. Так что согласен, что можно собрать просто голый дата-сет и пусть кто хочет, его оценивает, но вот началось все совсем с другого, к этому и вопросы.


Если исследователь занимает ту или иную позицию, то тогда и стоит выносить в цели исследования доказательство или опровержение этой позиции. Это то, что называется честностью.

Гипотезу же можно разными способами сформулировать. Например, написать вполне нейтрально «Мы хотим проверить, является ли развернутая кампания результатом действий корпораций или нет».
А потом во всем тексте отчаянно топить за ту или иную сторону конфликта.
Поэтому, ИМХО, наличие или отсутствие гипотезы может выдать злобного исследователя с головой, а может и не выдать.

У меня не возникло бы никаких вопросов к честности исследователя, если бы автор вынес такую гипотезу в цели своего исследования. Вопросы бы уже могли появляться только к аргументации, но в этом и суть научной дискуссии или поиска консенсуса.

построение выводов гипотез на основе обработки некоторого массива некоторых данных — это вполне себе нормальный научный подход
— так правильно.
Что бы построить выводы, нужно ещё раз независимо собрать данные. Публикация гипотез, сформированных на основе данных — тоже нормально, чаще всего так и делают. Тем не менее, если ставки высоки, то нужно собирать данные, которые не использовались для формирования гипотезы, хоть это и дороже. Так работает процедура проверки лекарств, к примеру.
можно днем деньги, вечером стулья, но можно и наоборот.
Иначе, в данном случае, никаких выводов нельзя будет сделать до массового допроса проголосовавших, с применением терморектального криптоанализатора.
Странно. А когда ровно таким же путём делаются выводы про покупателей пончиков или там мерседесов, на основании логов с веб-сайтов — это считается нормальным подходом.

Что-то вспомнилось время, когда довелось работать с подобными данными, и то как быстро я разубедился в своей способности их правильно интерпретировать. Очень быстро стала очевидна необходимость A/B-тестирования, которое тоже зачастую дает неожиданные результаты, совершенно неподдающиеся интерпретации. То есть обычно это тестирование воспринимается как инструмент поиска корреляций, но не более того. Так что мне не очень понятно о каких конкретно выводах в вашем случае идет речь. Выводы о том, что пользователи предпочитают кликать на иконки, на которых изображены кричащие персонажи? Но говорят ли такие выводы что-либо про самих пользователей?

Я бы Интернет вообще не анализировал.

Особенно сайты из США.

А для проверки гипотезы, что люди с такими характеристиками профиля гитхаба, например, «работают над open source за зарплату», пришлось бы взять независимую выборку и проверить ее.

Вы про дата майнинг никогда-никогда не слыхали?

Тут вопрос тонкости терминов. Нужно разделять формирование гипотезы и её проверку. Для проверки гипотезы нужно использовать данные, которые не были задействованы для её формулировки.

Я в курсе, как следует проверять статистические гипотезы. Я вообще-то придрался к этому: "Всё «исследование», по факту, родилось из наличия данных. Это заведомо ложный путь."


Потому, что это-то как раз и есть нормальный и естественный путь, которым идёт фундаментальная наука. Она начинается всегда с "коллекционирования марок", т.е. сбора данных, а потом исходя из этих данных уже пытаются что-то понять. Кто-то обнаруживает какой-то новый способ собирать и обрабатывать данные — из этого появляется какое-то новое направление в науке, временами, весьма перспективное. Скажем, лет двадцать назад научились дёшево прочитывать последовательности ДНК, РНК и белков, и стал накапливаться массив данных, вместе с его ростом постепенно изобретаются или становятся доступными (статистически значимыми) всё новые способы анализа этих данных. В итоге на наших глазах происходит просто взрывное развитие биоинформатики и практически революция в биологии. В ИТ ближе всего к этому дата майнинг, где вы сначала накапливаете кучу данных и придумываете, какие бы выводы можно было сделать из всего этого, вертите их как в голову придёт, в надежде, что что-то оформится.


Это только прикладная наука исходит из задач.

но пост не совсем про формирование гипотез, а про их проверку как раз.
Дни коммитов, могут вообще ни о чём не говорить. Например, человек коммитит после рабочего дня, а выходные полностью посвящает семье, активному отдыху и т.д.

В единичном случае да, но на большой выборке уже нет. Выходные полностью посвящают семье в том или ином количестве люди по обе стороны баррикад.

В единичном случае да, но на большой выборке уже нет.

При условии, что в выборке нет перекосов, а это требует отдельной проверки. К примеру, я бы мог предположить, что активные обитатели какого-нибудь лора более склонны красноглазить по выходным, нежели среднестатистический айтишник — и они же более склонны поддерживать Столлмана.
Противники X не коммитят код по выходным (работают только в рабочее время, не энтузиасты)
Это тяжело или невозможно проверить даже в России с 11 часовых зон. Во всём мире только хуже.

http://www.consultant.ru/document/cons_doc_LAW_114656/b2707989c276b5a188e63bc41e7bcbcc18723de8

В репозитории в поддержку есть и мой коммит.
По моему локальному времени — почти в полночь. Из дома заполнялось (но я и работаю из дома).
Вот только для США это будет вполне себе рабочее время.
При этом поле Location у меня заполнено в профиле с достаточной для определения таймзоны точностью. В исследование похоже поле Location никак не учитывалось хотя могло позволить чуть более корректно проверить гипотезу про подпись в рабочее время. А почему не учитывалось?

А почему не учитывалось?
Потому что учесть всего нельзя. Но если вы считаете, что можете, таким образом точнее определить кто, чего, когда и как — то скрипты в статье имеются, можете их поправить.

И либо выслать авторам, либо даже написать свою статью.
UFO just landed and posted this here
В графике раздела «Активность в репозиториях сторонников и противников Столлмана» оба графика резко вырастают за одну неделю (у противников вообще за три-четыре дня, если интервал между метками на графике — неделя). Потом оба графика более-менее выходят на плато. Т.е., о распределении коммитов по дням недели вы судите по одной единственной неделе, т.к., ее вклад наибольший.
А в этом случае на распределение может повлиять все, что угодно. Начиная от того, что «в корпорациях среда — день митингов» и до того, что до сторонников Столлмана шумиха докатилась ближе к выходным.
Вот черт, я что-то не подумал что кто-то еще и звезды смотрит. Я голос в поддержку то закоммитил, а звезду репе не поставил — пойду поставлю.

Фатальный недостаток исследования — считать, что все пользуются гитхабом как основным сервисом хранения кода. Это не так для разработчиков и гнома, и кедов. И у тех, и у других есть зеркала на гитхабе, но профили могут быть не связаны.

Кстати, вполне логично полагать, что сторонники Столлмана прислушиваются к его мнению и предпочитают не пользоваться гитхабом.
в таком случае если учесть перевес голосов «за», то у противников все вообще печально получается

Ещё одна гипотеза, которую было бы любопытно проверить — распределение "за" и "против" по "географии". Тут не слишком просто подступиться, т.к. github AFAIK не публикует логов по ip. Но можно для начала проверить утверждение "у противников/сторонников заполнен location".


Вполне может оказаться что location "противников" тяготеет к самой демократической стране мира. Ввиду нюансов тамошних трудовых отношений.

>>(1) Противники Столлмана кажутся более социально активными.
>>(2) Возможно сторонники Столлмана реже участвуют в социальной активности (ведут блог, твиттер, страничку в социальных сетях.

Тут есть две сложносьт.
Не «социально активными», а именно «ведут блог, твиттер, т.п.», и
(а) заполненное поле твитырь не означает, что там есть активность. У скольких людей есть тот же фб-акк, а по факту там нет
(б) Все эти сети были изначально созданы «нердами-интровертами для нердов-интровертов», которым вот эта вся «социальная движуха» тяжела, а вот в онлайне — самое оно. Принимая во внимание, что ЦА Столман-голосования как раз среди подобной публики, этот срез данных я быклпнул дальше.
Противники Столлмана чаще имеют заполненные профили социальных сетей
Противники Столлмана активнее на гитхабе

То есть среди противников меньше анонимусов и больше доля активных писателей open source, среди сторонников, соответственно, наоборот — и несмотря на то что "это не голосование" количественное "преимущество" сторонников (и их участие в OS) начинает играть существенно меньшую роль.

При том, что из профилей соцсетей рассматривался только твиттер? Ну такое.

UFO just landed and posted this here

Анадысь в «мыобречены» материли вероятность отключения айтишников от гитхаба.


Он стал таким себе линкедином в отрасли, причем действующим и важным. На него завязывается заявление самого себя, социальная/рабочая активность (внутри компаний больше гитлаб, но не суть), и если они тебя отрубают от сервиса, то сразу исчезает большой пласт возможностей и самопрезентации.


Насколько высока вероятность того, что подписантов за Столлмена занесут в отдельный список «подозрительных», и при случае кикнут нах без детальных объяснений? Это же микрософт, а они обязаны (их социумом) «бдить и не допущать» всякого, кого даже не признали виновным, а всего лишь объявили причастным ко всяким непотребствам, реальным или придуманным, уж неважно.

Не, ну можно, конечно, тихонечко отсидеться в уголочке. Только когда придут за тобой, а рано или поздно это вполне может случиться, за тебя заступаться будет уже некому.

Меня разрывают мысли и эмоции. Грустно, что до сих пор не понимаю этот мир. Или не могу принять. Вижу его злым и несправедливым. Но всё же осмелюсь вставить своё imho: я за таких людей, как Никола Тесла. И против таких как Эдисон. Мне больно от осознания капитализма. Всеми руками за Столлмана. Но «Твоё 'я' не имеет значения» ©Тайлер Дёрден
Мы бессильны. Если капиталистам что-то нужно — они берут что им нужно.
Простите за эмоции.
А почему Rust объединен с JS? Кроме ассоциации с Mozilla я ни какой связи представить не могу.
Sign up to leave a comment.

Articles