All streams
Search
Write a publication
Pull to refresh
103
0
Алексей @adeshere

Чукча не читатель! И не писатель. Чукча СЧИтатель

Send message

если под флешкой вы понимаете действительно usb flash, то это точно плохая идея.

Простите, пожалуйста, мой жаргон. Мы - прикладники, и в моем окружении внутренний SSD часто называют "флэшкой", когда это не приводит к путанице. Разумеется, речь о внутреннем SSD - с моими объемами и потоками данных про внешний USB-накопитель я никогда даже не думал.

А за советы спасибо!

ну и о чём тогда говорить? мелкие ssd тормозные по определению.

За десять лет все могло поменяться. В то время это был ходовой размер (поэтому я понадеялся, что хорошо отлаженный в производстве).

ерунда, всё можно. особенно при линейной записи. и/или на dc накопителях.

Возможно, пришло время еще раз попробовать. Мне даже денег не особо жалко, как впрочем и

сами данные

я же предполагаю такую флэшку использовать фактически как TMP-каталог: провел несколько циклов обработки - записал результаты

в постоянную базу на HDD

Исторически так сложилось, что у меня все крутится в собственной СУБД временных рядов с немного нестандартной архитектурой. Там есть "постоянная база", где лежат "первичные" и "чистые" данные (и то, и другое - это святое!), и есть "рабочее пространство" (РП), в котором и идут почти все расчеты (и где я издеваюсь над своими рядами самыми извращенными способами). Только в отличие от "нормальных" программ, у меня это РП организовано не в ОП, а в виде системы файлов на диске. В DOS это было вынужденно, т.к. мое РП в ОП

ну никак не влезало

Да и сейчас не влезает - память растет, но и частоты регистраторов тоже...

Плюс мне этих РП обычно нужно сразу несколько штук с возможностью быстрого переключения между ними. А еще надо, чтобы эти РП гарантированно сохранялись от сеанса к сеансу, так как цикл обработки в каждом РП часто бывает длительным (недели), с учетом разных отвлечений и перерывов. Ну и как бонус - РП на диске не портится при всяческих развлечениях типа отключения света или краха системы ;-)

Одно время были мысли архитектуру стандартизировать, когда ОП дешеветь начала. Только смысла, как оказалось, немного: при моих сценариях обработки лишняя ОП автоматически используется для кэширования дисков. Так что возможный выигрыш от переноски РП в ОП (я его проверял, создавая виртуальный диск в ОП, и работая на нем), имхо риски не перевешивает.

Пугает, что если у меня и второй SSD-шник тем же способом вылетит, то это будет уже уже 200% -ное попадание (2 из 2). Страшновато так разочароваться на старости лет... ;-)

но делать по явно не лучшему представителю вывод о ненадёжности и низкой производительности ssd не стоит.

Ну вообще-то я не обобщал до такой степени ;-) Я хотел сказать, что сценарии использования бывают разные... может кому-то мой опыт будет полезен. Когда у меня тот SSD помер буквально в младенчестве,

я пытался причины копать в инете

И про опасность 100%-го заполнения активно перезаписываемого диска мне именно тогда рассказали. Что это ускоряет деградацию не на проценты, а в разы. Я тогда подумал: если правда так, то чего ж проще, добавьте на SSD 10% "скрытой" от юзера емкости, и будет вам рекордная надежность за +5% к цене... Или производителю совесть не позволяет от юзера эти 10% скрывать? ;-)

Может, сейчас это все не актуально уже? Было бы интересно узнать, что об этом "инсайдеры технологии" думают.

Знаю, что прослыву ретроградом... но мой личный опыт пока однозначно за HDD. Я работаю с временными рядами. У меня каждый ряд хранится на диске в виде бинарника, обычный размер - от сотен МБ до нескольких ГБ. Типичная процедура обработки в скользящем окне - это последовательное чтение нескольких файлов данных одновременно, довольно быстрые вычисления над текущим окном, и запись результатов в еще несколько новых файлов таких же размеров.

Так вот. Лет десять назад мой сын, хорошо прокачавшийся в рекламных статьях о преимуществах SSD, возмутился моим ретроградством (я всегда работал на HDD) и подарил мне неплохой по тем временам SSD, чтобы расчеты "не тормозили". После чего оказалось, что:

1) по скорости этот SSD

почти не выигрывает у HDD

Напомню, мой сценарий - это последовательное чтение+запись очень больших файлов; рандомный доступ не нужен. По идее, HDD оптимизированы именно под него. Возможно, в моем случае скорость потоков данных ограничивалась не HDD, а шиной? Но если так, то замена HDD на SSD и не должна была кардинально ничего поменять?

А во-вторых, у меня же еще и вычисления иногда идут... и они тоже требуют времени. По крайней мере в некоторых сценариях, судя по загрузке процессора, узкое место было на нем.

2) А вот по надежности разница оказалась довольно существенной. Уже через пару недель работы в таком режиме (справедливости ради,

почти круглосуточной)

добавлю еще, что в те времена большие SSD-шки стоили дорого, поэтому я "протестировал" флэшку на 256ГБ. А ряды по несколько ГБ у меня уже были в массовом количестве, причем их надо было обрабатывать пакетами по десятку штук сразу. Поэтому в течение этих двух недель мой SSD регулярно заполнялся на 90% и более. Я же привык к HDD, и не знал, что так делать нельзя...

новенький SSD начал подглючивать, а вскоре

умер совсем

Если интересны подробности, то лет пять назад я тут в комментах про них подробно рассказывал. Тоже под какой-то статьей про SSD. Но - старость не радость - дату того обсуждения я позабыл, а поиску по Хабру так и не научился. Например, если забить в строке поиска "adeshere SSD", и нажать на поиск в комментариях, то ничего не находится. И по-другому не ищется. Короче, буду очень благодарен, если кто-то вразумит: как найти свой коммент 10-летней давности по паре ключевых слов? А то не первый раз уже нужно...

При том, что я уже 20 лет работаю в таком режиме на трех HDD. Из них пока умер только один, буквально на днях. Еще два HDD были куплены лет пять назад в другой комп, и тоже пока

работают и не жалуются...

Правда, все мои HDD - это не топовые модели типа "последний писк моды", а нечто странное из среднего ценового диапазона, причем я ориентировался прежде всего на надежность. Ну и на производителей с именами...

Добавлю, что я ни разу не ретроград-догматик, и в качестве загрузочных дисков у меня на компах давным-давно стоят SSD-шки (и прекрасно справляются!). Но вот для работы с данными конкретно в моем сценарии использования я пока предпочту HDD.

То есть вы посылали статьи и рецензии в журнал под псевдонимом Adeshere, да?

Нет, т.к. мне это тупо невыгодно. Отчеты, знаете ли, гранты, наукометрия.. Но до последнего времени никаких формальных препятствий к этому не было. Посылай хоть под псевдонимом - многие журналы статью все равно рассмотрели бы, если она толковая. И не важно, что автор никому не известен, и что место работы не указано (например, безработный). Лишь бы содержание адекватное было.

Только сравнительно недавно в российских журналах стали требовать экспертное заключение с места работы об отсутствии в статье ДСП-информации. А в большинстве иностранных - и сейчас не требуют.

Обычно указано всё: и научное звание, и военное звание, и аффилиация, и должность, и награды.

Да, основные сведения об авторе обычно есть. Автору тупо невыгодно их скрывать - от этого (числа и качества публикаций) у нас зарплата зависит. Но хорошую статью журнал напечатает, даже если автор никому не известен. Ну и добавлю еще, что информацию про про военное звание и награды я пока ни разу нигде не встречал. Правда, у меня тематика довольно мирная.. Как, впрочем, и у 99% научных журналов, включенных, например, вот в эту наукометрическую систему... Про остальные доли процента, извините,

просто не в курсе...

Всего в elibrary индексируется более 150 тыс. журналов. В том числе чуть менее 200 штук в разделе "Военное дело"...

1. Как автор и рецензент изрядного числа научных публикаций, хочу Вас разочаровать: ни в одном журнале меня не просили зарегистрироваться ни по паспорту, ни через Госуслуги. Ни

принимая статью на рассмотрение, ни, тем более, запрашивая рецензию на чью-то работу

Да, потом, когда статья принята, обычно надо заполнить что-то вроде авторского договора. Но это скорее требование издательства, а не журнала

Скажу Вам больше: в научном журнале при рассмотрении статьи гораздо важнее - ЧТО там написано, а вовсе не КЕМ это написано. Именно поэтому рецензентам

не сообщают никакие данные авторов

хотя по косвенным признакам рецензент иногда может догадаться - кто автор, но точной уверенности у него все равно не будет

И это принципиально важно для качества публикаций. Оценивать надо материал, а вовсе не его автора.

Да, существующая система научных публикаций очень небезупречна. Но если вместо этого идти "от авторитета", результаты будут катастрофически хуже. Вы просто не знаете, какой бред иногда пишут и присылают в научные журналы очень авторитетные люди, пытающиеся заглянуть в смежную область без достаточных в ней компетенций. И удачи Вам настроить формальные метрики так, чтобы определить: это все еще "родная" область авторитета, или же он уже безвозвратно вышел за ее рамки...

Короче говоря: я не вижу принципиальной разницы между степенью анонимности в двух этих случаях.

И отсюда встречный вопрос: Почему Вы надеетесь, что регистрация по паспорту/госуслугам вдруг повысит уровень обсуждения научных тем в интернетах? Вы правда при поиске формулы Кардано в первую очередь будете смотреть на то, подтверждены ли ФИО авторов текста на госуслугах? Или все-таки будете ориентироваться на тематику сайта, и предпочтете математический форум форуму плоскоземельщиков (в котором случайно эта формула промелькнет)?

2-4. На эти вопросы я уже в основном ответил здесь и немного здесь (про то, где что публикуется). Если вкратце - уровень компетенции экспертов подтверждается в первую очередь не Госуслугами, а их местом в экспертном сообществе. И если:
1) уровень сообщества в целом достаточно высокий, и
2) данный эксперт заслуженно имеет там высокую репутацию -
то по профильным темам я гораздо охотнее поверю такому эксперту (пускай даже формально и анонимному), чем дяде Васе с подтвержденными данными в паспорте...

Так может проверять не личность, а материал?

Именно. О чем я и пишу постоянно. Другой вопрос - как и, главное, кто это может проверить?

Демократия и открытое сообщество - это прекрасно. Но вопрос о том, плоская Земля или нет, все-таки должен решаться не голосованием, а специалистами.

В вики все равноправны (точнее, есть плюшки за стаж и за вклад, но не за уровень экспертизы в конкретной теме). И это, наверно, правильно. Но такая система

не предусматривает наличие экспертов в конкретных вопросах
Спрятал картинку за двумя спойлерами, так как получилось немного двусмысленно. Большая просьба смотреть только на левую сторону ;-)
Слева - эксперт... Справа - даже не знаю кто. Большая просьба не путать его с не-экспертами из викисообщества!!!
Слева - эксперт... Справа - даже не знаю кто. Большая просьба не путать его с не-экспертами из викисообщества!!!

Мне кажется, что в этом месте нужно что-то чуть-чуть подкрутить. Если эксперты не ломятся в викисообщество, то может быть стоит подумать об использовании тех материалов, которые они готовят (и рецензируют) на открытых площадках?

Только что ответил в соседнем комменте:

1) Авторы хороших материалов на интернет-площадках, как правило, не анонимны. По пятибалльной шкале - 4 из 5 (в научных журналах 5/5).

2) Рецензенты в научных журналах фактически анонимны. Перед внешним миром за все отвечает главред. Который - всегда человек (=подвержен ошибкам), и не всегда - эксперт в каком-то узком вопросе.

3. Мир тесен. Профессионалов-экспертов мало. Поэтому на узкопрофильных тематических площадках анонимность (если чел не шифруется специально) - обычно кажущаяся. Да, перед внешним миром "за базар" там отвечает не конкретный главред, а сообщество. Но кто Вам сказал, что экспертиза сообщества - это плохо? История знает тьму обратных примеров (сообщество vs закрытая туса как бы экспертов) по всему миру. Собственно, та же вики как раз и показывает, что открытое сообщество иногда может сделать гораздо больше и лучше, чем официальная забюрокраченная контора.

4. Ну и самое главное. Проверять и верифицировать все-таки надо не личность автора, а написанный им материал. Если король голый, то важен сам этот факт, а не мальчик, который обратил на это внимание. И вот именно с этим открытые узкопрофильные площадки часто справляются не хуже официальных структур.

Другой вопрос - а как отличить те случаи, когда они не справляются? Я не знаю. Но все же надеюсь, что решение можно найти.

Для таких проблем есть страница обсуждения.

Знаю

Но, увы, я пока еще не на пенсии. Поэтому в интернетах хожу только на Хабр. У меня часто бывают паузы по паре минут в процессе расчетов - серьезным ничем не займешься, а потусить в приятной компании можно ;-)

А если начистоту, то и желания особого нет активно возвращаться в викисообщество. После того, как проведенные там годы жизни (сарказм) оказались потраченными абсолютно впустую ;-)

Но душа за википроект немного болит :-(((

рецензенты в научных журналах точно так же анонимны.

Это неправда. Редактор журнала всегда знает имена рецензентов.

Извините. Я думал, из контекста понятно, что рецензенты анонимны для викиредакторов. Даже специально написал, что:

За качество публикаций журнал отвечает не списком их ФИО, а прежде всего своей репутацией. 

Другими словами, ответственность за качество материала де-факто несет "профессиональное сообщество", выпускающее журнал. В чем Вы тут видите принципиальную разницу с сообществом экспертов на специализированной интернет-площадке?

Скажу даже больше. В отличие от анонимного рецензента в журнале

который де-факто вообще ни перед кем не отвечает за качество своей экспертизы

в самом худшем случае, его просто не позовут рецензировать следующую статью. Плюс слегка подмоченная репутация в глазах главреда и одного(!) члена редколлегии, ответственного за эту статью. Для всех остальных (в т.ч. редколлегии) рецензент реально анонимен.

"рецензент" на интернет-форуме отвечает своей репутацией. И это существенно, так как в узкопрофессиональных сообществах многие их участники де-факто вовсе не анонимны, а хорошо известны в своем узком кругу. Ну или легко вычисляемы. Например, мои настоящие ФИО здесь нигде не присутствуют, но любой желающий их найдет за пару минут.

Короче говоря, вот мнение человека, многократно побывавшего в обеих ролях: при рецензировании научных статей я гораздо более анонимен, чем, к примеру, на Хабре. Так что Ваше первое возражение отклоняется.

Теперь про "...анонимные материалы, опубликованные неизвестными авторами безо всякого редакционного контроля".

Понимаете, анонимные они только для редакторов вики. В узком кругу экспертов по конкретным вопросам полной анонимности, как правило, нет. Если автор не шифруется специально, конечно. Я даже больше скажу: хорошие материалы (достойные упоминания в вики) чаще всего пишутся как-раз таки не-анонимно. На Хабре тому тьма примеров. (Про другие площадки не скажу, но по идее, хорошему специалисту, который гордится свей публикацией, скрываться особо незачем).

И отдельно добавлю про "редакционный контроль". Тут тоже все совсем не так однозначно, как на первый взгляд кажется, С одной стороны, в журнале есть главред, которому дорога а ) его репутация, и б) репутация журнала, конечно. А в самом экстренном случае ему просто (в) настучат по башке начальники и/или коллеги. Но, с другой стороны, статью в журнале обычно рецензируют полтора человека (считаем только шарящих в теме). А на том же Хабре читателей тысячи. И если в статье будет явная околесица, среди этих тысяч гарантированно найдутся, такие, кто а) может считаться экспертом в вопросе, и б) не поленится об этом в комментах сказать. По-моему, этот как раз и есть тот идеал "открытого рецензирования", к которому

должны стремиться научные журналы

На практике это может, например, выглядеть так, что журнал публикует статью и одновременно отклики рецензентов оппонентов. Сам такое лоббирую... но получается очень редко.

Так что второе возражение про "редакционный контроль" формально, может, и правильное, но, как говорил один небезызвестный товарищ, по существу - издевательство. Персональной ответственности и контроля - да, в интернетах обычно нету. Зато есть коллективный контроль экспертного сообщества. И он может быть гораздо более жестким.

В сухом остатке:

1) Проблема анонимности и ответственности существует, но разница между традиционными научными журналами и узкопрофессиональными интернет-площадками вовсе не так велика, как может показаться. Больше того, иногда эта разница - вовсе не в пользу традиционных журналов.

2) В отличие от журнала (для которого есть наукометрия и др.), уровень интернет-площадки оценить гораздо сложнее. Какие-то метрики есть, но системно проблема не решена. Вдобавок она усугубляется гигантским разрывом в качестве экспертизы на разных площадках.

3) Тем не менее, искать решение надо. Иначе актуальный материал от профессиональных экспертов так и будет присутствовать в вики лишь в гомеопатических дозах...

За вашу работу ничего не заплатят. Ваша репутация от этого не улучшится. Спасибо.

Думаю, многие согласились бы поучаствовать из чистого альтруизма. Останавливает другое - что твою правку

...может исправить любой другой человек, указавший ссылку на рецензированную статью. 

Именно так. В итоге время и силы, вложенные экспертом в эту правку, с вероятностью 90% пойдут в корзину. Ведь энтузиастов-альтруистов всегда много больше. Экспертные правки при этом не могут не потеряться - это просто статистика.

Ну и еще один момент: к сожалению, факт "рецензируемости" статьи сам по себе совершенно не гарантирует ее качество и, следовательно качество исправлений. Поэтому энтузиаст, даже действующий из лучших побуждений, но не являющийся экспертом, вполне может заменить хороший текст пустосмыслом. Думаю, это две главные причины того, что "эксперты" не слишком часто участвуют в редактировании вики. А вовсе не их ЧСВ, которое у реальных экспертов обычно вполне себе удовлетворено другими путями ;-)

Пример из личного опыта

Я однажды попытался выступить в качестве такого эксперта, так как в статье про корреляцию была упущена ключевая причина возникновения корреляций, которые кажутся высокозначимыми, не являясь таковыми на самом деле. На самом деле, ситуация там была проще некуда. Есть три очень простых обстоятельства:

1) огромное количество реальных людей работают с данными, которые по сути являются временными рядами, а не случайными величинами

2) Если мы имеем дело не не со случайными величинами, а со случайными процессами, то коэффициент корреляции Пирсона имеет совершенно другое теоретическое распределение

3) Если при оценке значимости корреляций между временными рядами мы будем использовать пороги значимости, построенные для случайных величин, то сплошь и рядом будем получать корреляцию, значимую на уровне целой кучи девяток. Что и приводит к абсолютно ложному выводу о взаимосвязи процессов.

Так вот, я на собственном опыте знаю, что такую ошибку совершает гигантское количество людей. Как рецензент многих научных статей, я вижу, что минимум в половине статей (написанных кандидатами и докторами наук с хорошей наукометрией), поступающих в наш (не самый плохой) журнал значимость коэффициента корреляции оценивается неправильно.

Мне надоело объяснять это в личной переписке каждому новому автору, и я написал свои "объяснения" на Хабр. Это избавило меня от повторяющегося общения с авторами - теперь я просто даю им ссылку на Хабростатью.

Но если уж такую ошибку делают умудренные сединами профессионалы, которые всю жизнь работают с данными, то что говорить о простых пользователях вики? В общем, я попытался присоединиться к викисообществу и добавить в соответствующую статью свои три копейки (там был подраздел про ложные корреляции, который я чуть подправил). Однако, все мои правки были отклонены, т.к. статья на Хабре - это не А.И. А проделать элементарные численные тесты (которые подтверждают все написанное гораздо убедительнее, чем моя анонимная личность) видимо, никто не решился. Да, собственно, это и не входит в задачу редакторов вики...

Потом была еще серия редактирований этой викистатьи (уже без меня)... в результате подраздел про ложные корреляции оттуда вовсе исчез. Хотя по моим представлениям, он был бы очень полезен едва ли не половине ее читателей. Во всяком случае, тем, кто на практике изучает взаимосвязи между реальными переменными (а не просто интересуется темой сугубо теоретически).

Чуть позже я опубликовал те же самые тезисы (о причинах ложных корреляций, кажущихся высокозначимыми), в трех нормальных научных журналах. Но все равно считаю, что в статье на Хабре причины появления таких корреляций раскрыты подробнее и полнее (я автор, имею право ;-). И что она была бы гораздо понятнее и полезнее для 3/4 читателей вики, чем те научные публикации. Тем не менее, если бы я даже попытался вновь восстановить подраздел про ложные корреляции этого типа в указанной викистатье, то дать ссылку на Хабр я все равно бы не смог - не А.И.

Впрочем, конкретно этот вопрос уже больше не актуален. Из новой редакции статьи про корреляции весь подраздел давно удален. Мое скоромное имхо состоит в том, что это была важная и многим нужная информация, но я не вижу смысла тратить время и силы, чтобы убедить викиредакторов ее туда возвратить.

Важнее другое. Читая вики, как пользователь, я все чаще ловлю себя на мысли, что и при редактировании других статей тоже происходит что-то подобное. Когда представленная информация абсолютно точна, но вот самое интересное (и остро необходимое на практике) осталось за кадром. Например, из статей про линейную и ортогональную регрессии куда-то исчезли стандартные отклонения для коэффициентов регрессии даже в простейшем (но и одном из самых частых) случае двух переменных. И так далее. Жаль, но на многих страницах вики ситуация имхо начинает все больше смещаться в сторону анекдота про математика (чуть более продвинутая версия тут), дающего совершенно точный, но почти бесполезный ответ.

Как вы видите процедуру? 

Я совершенно согласен, что квалификацию и личность анонимных экспертов, добровольно участвующих в интернет-обсуждении, проверить нельзя. Но и рецензенты в научных журналах точно так же анонимны. За качество публикаций журнал отвечает не списком их ФИО, а прежде всего своей репутацией. Которая, кстати, может меняться со временем. И в этом плане я не вижу принципиальной разницы между научным журналом и форумом, где собрались профессионалы в какой-то области.

Да, в интернетах можно найти прорву мусорных форумов, где уровень обсуждения вообще отрицательный. Но точно так же и среди печатных изданий есть множество мусорных. Причем даже среди тех, которые позиционируют себя, как научные. Проблема, в сущности, в обоих случаях одинаковая: как выделить среди всей информации ту, что заслуживает доверия.

Да, это очень непросто

Например, мы привыкли, что научная истина - это то, что признается всем ученым сообществом. Но... всего-то 50 лет назад в геофизике сложилась очень интересная ситуация. Самые высокорейтинговые журналы разделились на две полярные группы: одни поддерживали фиксистов, другие - мобилистов. Противостояние дошло до того, что если автор опубликовал даже самую невинную статью (вообще не имеющую отношения к спору) в журнале одной из противоборствующих сторон, то путь в журналы из другой группы ему был закрыт навсегда. Вам это ничего не напоминает в сегодняшней ситуации?

Так вот, никакие формальные метрики принципиально не могут разрешить такой спор. В науке он постепенно разрешился сам собой по мере появления новых данных, прежде всего ГНСС, но и не только. Но что в такой ситуации должны были бы сделать редакторы вики, если бы дело было в 1965 году? Поступить так, как их только что научили седые геологи в ВУЗ-е, и сохранить в википедии только одну точку зрения, выкинув явный бред? Или же предоставить одинаковые права стройной, проверенной временем научной концепции, и всякой хрени от мобилистов, которая очевидно противоречит любому здравому смыслу?

Не смотрите, что мой пример далекий по времени, просто он очень яркий

Если интересно, могу привести пару более свежих историй такого же плана, но это отвлекло бы от темы

А смысл его в том, что истина всегда относительна. Даже если тьма здравомыслящих людей совершенно уверена в обратном. Это вторая ключевая причина, по которой заслуживающие доверия интернет-ресурсы так трудно отделить от "всех остальных" (первая - в том, что судьи, т.е. викисообщество, не эксперты).

Но сложность проблемы (как отделить зерна от плевел) не означает, что ее не нужно решать. Применительно к научным изданиям жизнь уже давно вынудила искать какие-то варианты ответов. Кстати говоря, это не только наукометрия, но и экспертные оценки. Точно так же надо искать решение и для интернет-ресурсов. То есть, какую-то систему рейтингования тех площадок, где публикуются и обсуждаются какие-то узкопрофессиональные темы.

P.S. В науке какие-то прорывы очень часто возникают не тогда, когда найден ответ, а тогда, когда кто-то правильно (и вовремя) поставил вопрос. Так вот. У меня нет ответа: как именно надо рейтинговать узкопрофильные площадки, где специалисты в какой-то теме общаются между собой. Но как пользователь вики, я четко вижу, что отсутствие подобных источников (и исходящих оттуда материалов)

существенно снижает качество википедии

Пример из личного опыта. Раньше (довольно давно) при обсуждении разных околонаучных вопросов (матстатистика, обработка рядов и пр.) мне не надо было разжевывать всякие тривиальные формулы, факты и утверждения, которым меня научили еще в студенчестве. Я знал, что с вероятностью 99% за пару минуть найду все нужное в википедии и просто дам ссылку. Но в последние годы мне все чаще найти эту ссылку не удается. Приходится копать самые разные сайты, чтобы пояснить пустяковый вопрос, так как вики об этом скромно умалчивает. Или же на вопрос - почему 2+3=5 - предлагает начать с определения единицы по Бурбаки. Думаю, что одна из причин - это перекос в пользу фундаментальных А.И. в ущерб простым, но все же достаточно достоверным источникам. Условно говоря, из вики исчезает тот "промежуточный" уровень, который необходим 99% ее пользователей. Не скажу за всю вики, но по моей тематике тенденция точно есть.

В общем, мне очень хочется, чтобы присутствующие тут члены вики-сообщества обратили внимание на этот назревший (и перезревший) вопрос. Нужно искать работающую схему верификации и последующего использования в вики крайне полезных материалов с тех площадок, которые не входят на данный момент в список А.И., но по своему уровню вполне достойны доверия.

Никто не спорит, что проблема есть. Я только хочу избавить от возможных иллюзий, будто где-то она уже решена. Даже в УФН (а это лидер рейтинга в РФ и номер 30 в мире) я лично дважды натыкался на очень сомнительные статьи, хотя это не моя тематика, и я читаю его ОЧЕНЬ выборочно.

Поэтому я думаю, что та пропасть, которая сейчас имеется между А.И. и не-А.И., больше вредит, чем упорядочивает. Я понимаю, что эта граница - компромисс. Только вот его недостатки чересчур очевидны. Надо бы уходить от ЧБ мира к реальному, цветному. Но как?

Кстати, хороший пример ситуации, когда произвольно проведенная граница катастрофически исказила (а не высветила) истину - это та самая статья в УФН. В которой произвольно (из лучших побуждений!) заданный порог магнитуд привел к совершенно ошибочному выводу о влиянии ядерных испытаний на сейсмичность.

А теперь представим себе(сугубо гипотетически) что этот вывод, со ссылкой на процитированную статью, попал в Вики. А на другой стороне весов - сумбурный комментарий никому не известного анонима. Однако ошибка - именно в А.И.

Исправить такую ошибку никакими формальными методами в принципе невозможно. Только разбирать аргументы и контраргументы (а не личности авторов!) экспертным сообществом.

Итого, вновь приходим к выводу, что Э.С. должно быть вторым важнейшим инструментом при редактировании вики наряду с А.И.

В википедии нет инструмента, который позволяет отличить профессионального человека от обычного.

Разумеется. Тем более анонимного. Поэтому я и предлагаю оценивать

не автора,

Вы не проверите, какой бред иногда присылают в редакцию даже выдающиеся ученые на старости лет. А иногда и не на старости...

а написанный им материал. .

Профессиональный — это за деньги.

Вы не поверите - рецензентам в научных журналах тоже не платят. И членам редколлегии (которые этих рецензентов подбирают) обычно тоже. Главреды - да, есть небольшая надбавка, но это очень небольшой процент от зарплаты. Во всяком случае, в ведущих российских журналах по нашей тематике (одной из немногих, где российская наука сохраняет хороший уровень).

Но вот именно экспертам (=рецензентам) в науке обычно не платят.

Короче говоря: я правильно понял Ваш намек, что научные журналы из списка А.И. вычеркиваем?

;-)

Как определить, что этот анонимный хабраюзер — эсперт?

Как и везде - коллективной экспертизой профессионального сообщества. Причем оценивать надо не личность автора, а написанный им материал.

Понятно, что тема скользкая, что колхоз комменты - дело добровольное, и т.д. Но если Вы думаете, что в научных журналах все совсем по-другому... то это правда лишь отчасти. Рецензенты ведь тоже никому ничем не обязаны. Иногда (если в статье нет явного бреда, и она не конкурирует напрямую с парадигмами рецензента) проще заполнить за полчаса опросный лист и забы(и)ть. Итого статью перед публикацией более-менее внимательно прочитают полтора человека, ну и главред (который далеко не всегда глубокий спец в каждой узкой теме). Если выбирать между таким рецензированием и проверкой "экспертным сообществом" - выбор совсем не однозначен.

Другой вопрос - что даже на Хабре такую проверку сообществом реально проходит лишь малая часть публикаций... Поэтому и ресурс в целом /= А.И. Но отдельные статьи здесь точно не хуже журнальных. ИМХО.

Например, недавно в Википедию внесли (не я) правку со ссылкой на мою статью на Хабре. И, как бы мне ни хотелось, эта правка должна быть отменена. Потому что мой пост не является авторитетным источником.

Достойная позиция, но Вы твердо уверены, что это наилучший выход? Например, научные журналы вроде как считаются А.И. Так как там рецензирование, плюс редколлегия (которая как бы за базар отвечает), и т.д. Что, тем не менее, не мешает даже в хороших журналах печатать всякую ерунду (хотя и изрядно ее фильтрует, конечно). И наоборот, дельная хабростатья, написанная экспертом в своей области, и "отрецензированная" читателями, часто бывает и актуальнее, и информативнее любых других материалов по теме, включая признанные А.И.

Может, сам принцип, что энциклопедия пишется не-экспертами, компилирующими материал из А.И, вовсе не так идеален, как нам хотелось бы верить?

Я не к тому, что надо все выбросить и начать заново. Но мне показалось, что тема улучшения Вики Вам небезразлична

(я сам там только читатель)

и в последнее время все чаще ухожу со страниц вики с чувством разочарования от несбывшихся надежд

Поэтому и решил задать этот вопрос Вам. Может, критерии отбора А.И. можно как-то усовершенствовать? Чтобы мнение экспертов (которые разбираются в теме на порядок лучше, чем большинство редакторов и читателей Вики), все же получило шанс быть представленным в Вики (например, в виде приложений к основной статье) вне зависимости от того, удовлетворяет ли ресурс (где оно изложено) всем формальным критериям А.И.?

Чуть-чуть иронии.

Разовью тему

Я бы все же добавил к хорошо известному правилу:
...не откладывай на завтра то, что можно сделать послезавтра
...не откладывай на послезавтра то, что можно вообще не делать

одно уточнение:
..но не откладывай, то, что сделать придется

Основное преимущество здесь — производительность. А крайних случаях — огромный рост производительности.

Я, конечно, не настоящий программист (пишу на фортране). Но невольно возникает вопрос: а так ли уж часто сверхсложная логика и требование высокой производительности переплетены настолько, что их не разделишь? Лично я просто стараюсь

писать понятно

то есть читабельно человеком, и чтобы не ставить подножек оптимизатору

а дальше пусть голова болит у оптимизатора. То же перечисление - это же по сути массив, а массивы, по идее, любой компилятор должен распараллеливать на ура?

Как выше заметил redf1sh2, современные компиляторы умеют многое делать. Особенно если им не мешать. Может, у меня однобокий взгляд, но у нас в фортране простые for-циклы обычно пишутся в виде массивного оператора, например:

if (condition) A=1/B,

(тут A и B - массивы). Такой код оборачивать в функцию часто не нужно вообще. Соответственно, рекомендация автора статьи выполнена автоматически ;-). Но, вовсе не ради какой-то оптимизации, а просто мне так запись понятнее.

При этом, однако, никто не мешает вставить if внутрь цикла:

where (B > 1) A=1./B

Получается поэлементная операция (делим на себя те элементы массива, которые больше 1), которая столь же прекрасно распараллеливается. Было бы просто неуважением к компилятору подозревать его в неспособности справиться задачей такого рода. Поэтому и в этом случае я пишу так, как понятнее и удобнее человеку (читателю).

Я понимаю, что массивные операции есть не во всех языках, и что у компилятора могут возникнуть трудности, если, например, мы работаем не с нативным массивом, а с массивом структур, и там надо обработать какое-то поле. Но, если речь идет о второй древнейшой профессии втором древнейшем языке, то ведь обычно справляется же?! Значит, и в современных языках тоже должен справляться

ну или вот-вот научится

Конечно, из любых правил есть исключения. Но строить всю парадигму на базе тех нескольких процентов случаев, где
1) эффективность критична, но
2) компилятор не умеет превратить хорошо структурированный (=читаемый) код в быстродействующую программу -

это как то странно, не правда ли?

Поэтому я согласен с автором статьи в том, что логику обычно стоит поднять повыше (в разумных пределах, конечно). Но, глядя со своей колокольни, не очень согласен в том, что

во главе угла при этом должна стоять именно эффективность, а не читаемость кода

Может, конечно, это специфика моей предметной области - я обрабатываю научные временные ряды. Но вот в моем случае программы, написанные простым языком, почти всегда получаются достаточно эффективными, чтобы можно было не париться о каких-то особенных ухищрениях. Правда, ряды данных у нас не очень большие (обычно десятки-сотни миллионов значений, хотя изредка бывают и миллиарды). При этом каждая запись - это просто одно или несколько чисел. Без сложных текстовых полей и структур. Короче, далеко не "биг дата". Там мой "наивный подход" уже не факт, что прокатит.

> dedmagic1> От силы 1% кода, который пишется, требует оптимизации на уровне регистров и кеша процессора. При этом 100% кода читается и модифицируется (...).

Вот именно что ;-)

Спасибо за упоминание Вашей статьи (перевода):

"Смотрим на Chapel, D, Julia на задаче вычисления ядра матрицы"

Прочитал с интересом, хотя претензии к ее автору (не к переводчику, разумеется) очень похожие. Думаю, тем, кто сюда зашел, эта ссылка не помешает. Статье пять лет - не факт, что тут все ее видели.

Если успеете - пожалуйста, вставьте ссылку прямо в свой комментарий, хорошо? Тогда я свой удалю.

Согласно индексу TIOBE, Julia входит в топ-50 самых актуальных языков программирования в 2025 году и занимает в рейтинге 34-ю строчку

Тут на днях в соседней теме писали про неожиданный взлет Ады в том же TIOBE:

Взлёт Ada в TIOBE обусловлен тем, что Nvidia выпустила архитектуру Ada и её гуглят. Этому рейтингу глубоко пофиг, что он меряет. Если когда-то появится язык Girl, он навcегда займёт первую строчку в TIOBE даже если у него не будет работающего компилятора.

Я не намекаю, я спрашиваю: у языка со столь примечательным именем Julia не может быть чего-то подобного?

1
23 ...

Information

Rating
4,470-th
Location
Пущино, Москва и Московская обл., Россия
Registered
Activity