Отличная статья, крайне интересно было прочесть. Поначалу, когда увидел тезис об использовании линейной модели для выбора предикторов, думал придется поспорить, но потом, вопрос был раскрыт очень качественно.
Про vif как показатель мультиколлинеарности, а так же lasso/en в этом контексте было бы тоже интересно посмотреть, впрочем статья и так огромная.
Минусую потому, что моя позиция заключается в следующем:
1. Насилие, в принципе, должно применяться государством только в ответ на совершенное насилие или для предотвращения прямого насилия.
2. Никакого призыва к прямому насилию в словах Носика не было потому, что:
— Адресат Владимир Владимирович к моменту написания этих слов уже совершал те самые «негативные действия» (хуячил по Сирии ковровыми), и это никак не смущало человеколюбия столь возмущенных словами Носика граждан, что намекает на некоторую двуличность оных.
— Адресат Владимир Владимирович, при всех моих глубоких сомнениях в его интеллектуальных способностях, вряд ли поддается такому топорному влиянию господина Носика, и не думаю, что бомбардировки Сирии были после данного поста ужесточены.
— С физическим уничтожением национально-территориальной группы «сирийцы» блестяще справляется их собственное государство, адресат Владимир Владимирович, а так же страны запада, но судимы будет, конечно же, не они, а некий Антон Носик, за призывы к насилию.
В общем, никакой дополнительной опасности несчастным сирийцам пост Носика не несет. Он, этот пост, по сути, является выражением личной неприязни к территориально-административной группе «сирийцы», а наказывать за это — цензура, свинство и двуличие людей с внезапно проснувшейся любовью к человечеству.
Я не даю оценки собственно посту Носика — на мой вкус этот текст фашистск и аморален абсолютно — но это совершенно не повод этот пост цензурировать, ибо вопросы морали не должны интересовать нормальное государство, например.
Все говорят о высоких ценах, защитах от копирования и прочих сложностях, так, как будто это оправдывает нарушение закона.
Дело даже не столько в нарушении закона, сколько в нарушении контракта, по которому приобретается книга.
А вообще, респект вам за борьбу с ветряными мельницами в форме людей, которые считают, что им все вокруг должны.
Спасибо.
Возможно я ошибаюсь, но кондор не позволяет объединять вычислительные мощности нескольких компьютеров. Другими словами, если в кластере два компьютера, то отправленная на кондор задача будет выполняться только на одном из них; то есть это скорее менеджер ресурсов, чем кластер в классическом смысле.
>есть сложности в использовании какой-либо сторонней программы (отличной от написанной и откопелированной вами) и программ требующих множества библиотек
У нас эти проблемы на практике решены наличием одной версии ОС на всех компьютерах кластера и распределенной файловой системы (Lustre).
В Штатах тоже дико дорого например (по крайней мере в тех местах, где хорошие универы — Бостон, Калифорния). Я жил и в Штатах и в Швеции, и в последней было ощутимо дешевле, подозреваю, что в Германии так же.
Я решил заняться наукой и поступил в аспирантуру очень поздно — в 28, и, тем не менее, добился определенных успехов (и нашел призвание на всю жизнь). Потерянные годы будут чувствоваться всегда, но это можно сгладить старанием и отношением к делу.
Так что, считаю, никогда не поздно.
Интересная статья.
Тоже используем Lustre и Red Hat в качестве ОС. Но у нас много серверов по 50 ядер + 500 гб оперативки, и нагрузка распределяется с помощью Condor.
У вас у сервера 400 ядер, или несколько серверов? И как распределяются ресурсы между разными задачами?
Ну если человеку скажут что имея тот или иной маркер она имеет риск развития рака груди 60% например, то это еще не диагноз, а просто предупреждение. И, кроме того, научный факт, который очень желательно знать заранее.
Ну, качество чипов illumina подтверждается их популярностью в научном сообществе.
Генетические маркеры, на которых строится анализ 23andme, найдены в процессе научных исследований, прошедших процесс рецензирования и публикации. Сами же 23andme не делают ничего нового, собственно, а просто совмещают открытые данные с открытыми же технологиями. Все это, на мой взгляд, достаточное основания доверять их анализам (с оглядкой на то, что генетические маркеры это только часть проблемы).
Спасибо. Я тоже примерно прикидывал с учетом Бонефрони, потому и спрашивал. Тут меня удивило то, что биологи обычно требуют предоставить им как можно больше данных и очень не любят когда эти данные всячески фильтруют. Поэтому часто они просят максимально «натянуть» порог.
А вот как это происходит, и что является первопричиной, я не знаю. Знаю только, что это неочевидно не только сходу, но и многим людям, много лет профессионально занимающимся метилированием ДНК (пришлось пообщаться с людьми по этому поводу). Поэтому не могу точно сказать какие исследования сейчас на эту тему ведутся — местные эпигенетики не в курсе.
Я знаю что такое pvalue, но мне все-таки непонятно как я смогу например в статье обосновать выбор порога. Да, 0.05 — все привыкли, а 1e-16 выглядит немного непривычно. Почему не 1e-10 или -5? А кроме того, множественное тестирование в данном случае не принимается в расчет?
Не всегда — зависит от специализации. В некоторых областях, например в биоинформатике, аспирантура лучше воспринимается работадателями чем соответствующий опыт работы (видимо потому, что университетские проекты как правило сложнее «промышленных»)
Про vif как показатель мультиколлинеарности, а так же lasso/en в этом контексте было бы тоже интересно посмотреть, впрочем статья и так огромная.
Спасибо.
Вот тут и ошибка в логике.
1. Насилие, в принципе, должно применяться государством только в ответ на совершенное насилие или для предотвращения прямого насилия.
2. Никакого призыва к прямому насилию в словах Носика не было потому, что:
— Адресат Владимир Владимирович к моменту написания этих слов уже совершал те самые «негативные действия» (хуячил по Сирии ковровыми), и это никак не смущало человеколюбия столь возмущенных словами Носика граждан, что намекает на некоторую двуличность оных.
— Адресат Владимир Владимирович, при всех моих глубоких сомнениях в его интеллектуальных способностях, вряд ли поддается такому топорному влиянию господина Носика, и не думаю, что бомбардировки Сирии были после данного поста ужесточены.
— С физическим уничтожением национально-территориальной группы «сирийцы» блестяще справляется их собственное государство, адресат Владимир Владимирович, а так же страны запада, но судимы будет, конечно же, не они, а некий Антон Носик, за призывы к насилию.
В общем, никакой дополнительной опасности несчастным сирийцам пост Носика не несет. Он, этот пост, по сути, является выражением личной неприязни к территориально-административной группе «сирийцы», а наказывать за это — цензура, свинство и двуличие людей с внезапно проснувшейся любовью к человечеству.
Я не даю оценки собственно посту Носика — на мой вкус этот текст фашистск и аморален абсолютно — но это совершенно не повод этот пост цензурировать, ибо вопросы морали не должны интересовать нормальное государство, например.
Дело даже не столько в нарушении закона, сколько в нарушении контракта, по которому приобретается книга.
А вообще, респект вам за борьбу с ветряными мельницами в форме людей, которые считают, что им все вокруг должны.
Возможно я ошибаюсь, но кондор не позволяет объединять вычислительные мощности нескольких компьютеров. Другими словами, если в кластере два компьютера, то отправленная на кондор задача будет выполняться только на одном из них; то есть это скорее менеджер ресурсов, чем кластер в классическом смысле.
>есть сложности в использовании какой-либо сторонней программы (отличной от написанной и откопелированной вами) и программ требующих множества библиотек
У нас эти проблемы на практике решены наличием одной версии ОС на всех компьютерах кластера и распределенной файловой системы (Lustre).
Так что, считаю, никогда не поздно.
Тоже используем Lustre и Red Hat в качестве ОС. Но у нас много серверов по 50 ядер + 500 гб оперативки, и нагрузка распределяется с помощью Condor.
У вас у сервера 400 ядер, или несколько серверов? И как распределяются ресурсы между разными задачами?
Ну, качество чипов illumina подтверждается их популярностью в научном сообществе.
Генетические маркеры, на которых строится анализ 23andme, найдены в процессе научных исследований, прошедших процесс рецензирования и публикации. Сами же 23andme не делают ничего нового, собственно, а просто совмещают открытые данные с открытыми же технологиями. Все это, на мой взгляд, достаточное основания доверять их анализам (с оглядкой на то, что генетические маркеры это только часть проблемы).
А вот как это происходит, и что является первопричиной, я не знаю. Знаю только, что это неочевидно не только сходу, но и многим людям, много лет профессионально занимающимся метилированием ДНК (пришлось пообщаться с людьми по этому поводу). Поэтому не могу точно сказать какие исследования сейчас на эту тему ведутся — местные эпигенетики не в курсе.