Pull to refresh
12
0
Калимулин Михаил Игоревич @exwill

Vision developer

Send message

Почему форумы продолжают жить

Reading time5 min
Views38K

Интернет — идеальная площадка для споров. Но есть большая разница, как спорить. Или это эмоциональная склока, где собеседники наскакивают друг на друга как петухи и стремятся побольнее клюнуть. Или размеренная дискуссия, которая продолжается неделями, где собеседники по большинству вопросов согласны друг с другом. Они спокойно и неторопливо доносят до собеседника информацию, которой у того не хватает.

Разгорячённые петухи и спокойные интеллектуалы — одни и те же люди, просто на разных сайтах. То есть сама платформа как бы вынуждает людей общаться тем или иным способом. В некоторых условиях неторопливое конструктивное общение практически невозможно, а в других — поощряется. Что это за условия?

Или спросим иначе: почему старые форумы продолжают существовать в 2023 году и там сохраняется своё коммьюнити (преимущественно, по специализированным темам)? Хотя, вы наверное уже догадались.
Читать дальше →
Total votes 113: ↑108 and ↓5+135
Comments414

Есть ли польза от решения алгоритмических задач на LeetCode?

Reading time8 min
Views86K

Пожалуй каждый программист, который сталкивался с вопросом: "А как устроиться на работу в FAANG?" - получал ответ, что ему нужно разобраться с алгоритмами, со структурами данных и прорешать порядка 300-400 задач на leetcode по алгоритмам.

Однако вслед за этим советом тут же появляются люди, которые говорят, что это никоим образом не делает тебя лучше, как программиста. Да и вообще - просто пустая трата времени.

Поэтому, в этой статье я постараюсь дать ответ, насколько это может быть полезным для работы и развития, и как может сказаться на карьере.

Читать далее
Total votes 51: ↑43 and ↓8+50
Comments182

История создания домашнего облака. Часть 2. Создание сервера — настройка LAMP в Debian

Reading time24 min
Views44K
На пути создания своего облачного сервиса пока мы только освоились в системе Debian. Теперь пришла пора для следующего шага — создание и настройка веб-сервера, на базе которого можно будет запустить Nextcloud.
Читать дальше →
Total votes 21: ↑20 and ↓1+19
Comments20

Как врач сделал себе ИИ помощника. Часть 1

Reading time3 min
Views13K

Всем привет, меня зовут Александр и я врач-гематолог. Для справки, это тот, кто занимается болезнями крови. Мой общий стаж перевалил за 16 лет, я кандидат медицинских наук и последние пару-тройку лет интересуюсь анализом данных, machine learning и ИИ в медицине. Под "интересуюсь" я подразумеваю исследования и публикации по этим темам, а также обучение и саморазвитие.

Так как я ни разу не программист, то мой пост будет не про это. Тем не менее последние пару лет моим рабочим инструментом является R. Это не тот язык программирования, на котором можно писать крутые сайты или приложения, но кое-что он все-таки умеет. R - больше про анализ данных, чем я и занимаюсь. Сегодня я хочу кратко рассказать и показать один из моих проектов на R, который решает вполне конкретную прикладную задачу - интерпретацию общего анализа крови.

Общий анализ крови (ОАК) – самый частый и один из самых сложных анализов человека для интерпретации, что обусловлено большим числом входящих в него параметров. Как правило, именно этот анализ является скрининговым тестом как для гематологов амбулаторного приема, так и для врачей общей практики и других специальностей. Объемы выполняемых анализов исчисляются сотнями тысяч. Моя идея не нова - машинная помощь в правильной и быстрой интерпретации общего анализа крови, которая будет содействовать развитию качественной, доступной и своевременной диагностики онкогематологических заболеваний. Зачастую врач первичного звена (терапевт) не может дифференцировать изменения в ОАК, что приводит либо к гиподиагностике, либо к повышенной настороженности и излишне частому направлению на консультацию к врачу-гематологу. Ситуацию усугубляют огромные объемы анализов, выполняемые в рамках профилактических и лечебно-диагностических процессов как в государственном, так и в частном секторе здравоохранения. Расшифровка анализов онлайн - один из востребованных запросов в Интернете. Меня часто просят об этом в социальных сетях.

Читать далее
Total votes 59: ↑55 and ↓4+70
Comments68

НУЦ сурка

Reading time6 min
Views22K

Как Минцифры «забыло», что уже создавало «национальный удостоверяющий центр», как фейковые сертификаты стали «государственными» и почему никто за это до сих пор не вылетел из мягкого кресла.

Последние месяцы регулярно получаю уведомления с Хабра, что мою майскую статью упомянули в публикации, посвященной очередному этапу обилечивания россиян «надежными» «суверенными сертификатами». Также регулярно комментирую эту тему для СМИ и почти всегда сталкиваюсь с выпадением собеседника в BSOD. Казалось бы, вот все факты, вот официальные документы и прочие «пруфы», но поверить в услышанное все равно невозможно: федеральный орган исполнительной власти не первый месяц открыто нарушает закон, раздает филькины грамоты для «защиты» важнейших сайтов и… ничего.

Давайте и вам расскажу эту историю: как Минцифры не имея на то полномочий «создало» т.н. «национальный удостоверяющий центр», да не один раз, как несуществующий УЦ выпускает «государственные» TLS-сертификаты, и как вся эта деятельность проходит по разделу перехода на отечественную криптографию, а не превышения должностных полномочий, а то и чего похуже.

Итак, на сайте Минцифры сообщается, что сертификаты выдает Национальный удостоверяющий центр. Сервис по выдаче сертификатов безопасности работает с марта 2022 года на портале Госуслуг. Однако «Портал государственных услуг Российской Федерации», утверждает, что российский сертификат безопасности для интернет-сайтов, заверенный «российским корневым сертификатом» предоставляется самим Минцифры. Да и сертификате указано, что его выпустило «The Ministry of Digital Development and Communications», а не какой-то «национальный удостоверяющий центр».

Читать далее
Total votes 96: ↑83 and ↓13+89
Comments56

Математика для Data Science и машинного обучения за 8 месяцев. Подробный план обучения

Level of difficultyEasy
Reading time7 min
Views85K

Беспилотные автомобили, продвинутые голосовые ассистенты, рекомендательные системы – это только малая часть тех классных продуктов, которые создаются с помощью инженеров по машинному обучению и, думаю, не для кого не секрет, что за кулисами сего чуда стоит математика. Именно она играет главную роль в понимании алгоритмов машинного и глубокого обучения.

Машинное обучение держится на трёх основных столпах:

Читать далее
Total votes 19: ↑18 and ↓1+22
Comments44

Как устроен внутри Github Copilot

Reading time12 min
Views10K

Github Copilot оказался для меня невероятно полезным. Часто он может волшебным образом читать мои мысли и давать полезные рекомендации. Больше всего меня удивила его способность верно «угадывать» функции/переменные по соседнему коду, в том числе и из других файлов. Это может происходить только в том случае, если расширение copilot отправляет ценную информацию из соседнего кода в модель Codex. Мне стало любопытно, как это работает, поэтому я решил изучить исходный код.

В этом посте я попытаюсь ответить на отдельные вопросы по внутренностям Copilot, а также опишу интересные наблюдения, сделанные мной в процессе исследования кода. В большинстве случаев я буду указывать ссылки на соответствующий код, чтобы заинтересовавшиеся читатели могли изучить его самостоятельно.
Читать дальше →
Total votes 26: ↑26 and ↓0+26
Comments2

Домашний веб-сервер для чайников

Reading time14 min
Views255K

Привет, Хабр! Относительно недавно после пары лет перерыва в айти, потраченных на изучение японского языка, мне пришлось срочно обновлять свои знания на работе. Ну знаете, искать возможности исполнить все хотелки начальника, как и положено эникею. Меня ждало много увлекательных открытий, но при этом, как водится, и немало боли и борьбы с непонятками. Docker, контейнеры, реверс DNS и реверс прокси, получение TLS сертификатов. В какой-то момент я наконец дошёл до удобного решения, которым я теперь хочу поделиться.

В своё время домашний сервер очень облегчил бы мне понимание Docker’а, да и удобство работы с ним неслабо бы повысил. Поэтому возникла идея написать эту статью, после прочтения которой любой человек даже с поверхностными знаниями в информационных технологиях сможет поставить себе постоянно доступный домашний сервер на базе Docker Swarm с удобной веб-мордой, простым получением TLS-сертификатов и Heroku-подобным функционалом (для чего будем использовать PaaS CapRover). 

Статья, в общем-то, рассчитана на новичков, обладающих какими-то техническими знаниями — школьников старших классов, студентов и просто любителей — а потому вряд ли будет интересна серьёзным профессионалам.

Читать далее
Total votes 24: ↑22 and ↓2+23
Comments29

SETI, жизнь на других планетах и всё остальное: наследие Фрэнка Дрейка

Reading time7 min
Views5K

Фрэнк Дрейк со своей знаменитой формулой

На протяжении всей истории человека люди, смотревшие в ночное небо, полное звёзд, планет и всего остального, не могли не думать о том, что же может существовать там, в космосе. Есть ли там такие же звёзды, как Солнце, такие же планеты, как Земля, какие-то ещё живые, разумные существа, осознающие сами себя, и как сильно они отличаются от нас с вами? За тысячелетия развития астрономии и десятки лет развития астрофизики наше понимание Вселенной невыразимо сильно возросло, однако любопытство по поводу возможности существования внеземной жизни не угасает.

В 1950 году прославленный физик Энрико Ферми задал свой знаменитый вопрос: «А где все?» Уже заканчивается 2022 год, а этот вопрос всё ещё звучит в наших умах, не находя определённого ответа. Однако менее чем через 10 лет после того, как его задал Ферми, другой учёный, Фрэнк Дрейк, преисполнился решимости превратить этот вопрос из философского в научный. Он стал первым человеком, затеявшим поиски сигналов технологически развитых цивилизаций, пионером соответствующего проекта Search for Extraterrestrial Intelligence (SETI), разработал первое сообщение, специально отправленное всем любопытствующим инопланетянам, способным его услышать, и вывел первую методику оценки количества существующих разумных инопланетных цивилизаций, с которыми мы могли бы теоретически наладить связь – уравнение Дрейка.
Читать дальше →
Total votes 18: ↑17 and ↓1+22
Comments78

Кому принадлежит время

Reading time13 min
Views11K
image

Знать время нужно всем. Точное время необходимо для криптографии, непрерывного производства, навигации на Земле и в космосе.

Интернет зависит от времени так, что малейшая ошибка ведет к масштабным проблемам: падению серверов, сбоям в DNS, зависанию приложений. Из-за проблем со временем системы зацикливаются и потребляют излишние ресурсы CPU.

Конечно, программисты знают, откуда берется время. UNIX-time, timestamp, datetime, tzdata, NTP и другие решения дают четкое ощущение контроля времени. Однако кому на самом деле время принадлежит, кто несет за него ответственность?

Это история о бесконечном поиске консенсуса, талантливых одиночках, работающих без зарплаты, крушении «Титаника», увлеченном слепом программисте и смелых решениях, ведущих к новым ошибкам. Это история про время.

Читать дальше →
Total votes 44: ↑42 and ↓2+50
Comments17

Доказуемая честность и PoL в казино (и не только)

Reading time3 min
Views5.9K

Не так давно я начал интересоваться работой гэмблинг рынка, а именно казино. У многих людей ошибочное мнение о работе онлайн-казино. Многие представляют себе казино как сервис, где людей нагло обманывают, все игры подкручивают и выиграть там нереально, но в этой статье я хочу рассказать подробнее о возможностях как обычный игрок может проверить свою ставку или средства на честность.

Читать далее
Total votes 7: ↑7 and ↓0+7
Comments9

КриптоПро в Linux контейнере для использования КЭП от ФНС

Reading time5 min
Views17K

С Нового Года в России от Индивидуальных Предпринимателей (ИП) и директоров Обществ с Ограниченной Ответственностью (ООО) требуют использовать Квалифицированную Электронную Подпись (КЭП) выданную Федеральной Налоговой Службой (ФНС).

В этой статье речь пойдёт о том, как работать с КЭП от ФНС под Linux без головной боли.

Читать далее
Total votes 31: ↑31 and ↓0+31
Comments78

Легализация совы

Reading time14 min
Views8.3K

15 декабря Верховный суд выпустил постановление Пленума «О некоторых вопросах судебной практики по уголовным делам о преступлениях в сфере компьютерной информации, а также иных преступлениях, совершенных с использованием электронных или информационно-телекоммуникационных сетей, включая сеть „Интернет“». (Пока оно не опубликовано, поэтому ссылка ведет на неофициальную публикацию). Такие постановления с обобщением судебной практики по самым разным вопросам выпускаются регулярно. Предназначены они для игнорирования нижестоящими судами.

Вернее, нет, не так. Игнорируются в таких документах, в основном, те положения, которые могут как-то облегчить ответственность или вообще исключить ее. Все то, что позволяет еще глубже запинать обвиняемого под тюремную шконку — используется охотно и с удовольствием, во славу знаменитого «обвинительного уклона».

Именно поэтому я думаю, что в среде наших правоохранителей этот документ, к сожалению, станет очень популярным. Поговорим о том, почему это произойдет…

Это будет очень, очень грустно...
Total votes 42: ↑41 and ↓1+50
Comments31

Об опасности заимствования западной методологии нормализации и ведения Справочника МТР по шаблонам свойств-значений

Reading time15 min
Views3.8K

 Об опасности заимствования западной методологии нормализации и ведения Справочника МТР по шаблонам свойств-значений

 

Досадную, непростительную ошибку мы совершили в далеком 2007 году: ФГУ «Федеральный центр каталогизации» Росстандарта (а мне довелось в те годы работать в этой организации) пригласил в Россию Южно-африканскую компанию “RAMIS”. Сначала – на Международную конференцию по каталогизации с целью информировать техсообщество о новом стандарте параметрического описания продукции ISO 22745, а затем – мы свели их с руководством одной из крупнейших отечественных металлургических компаний с целью «реализовать идеи на практике».

К тому времени на отечественном ИТ-рынке не только SAP/IBM/Oracle, но и ряд отечественных компаний стали активно продвигать практику нормализации и автосборки наименований закупаемой продукции по примитивным, односложным шаблонам свойств-значений. То, что с внедрением этой практики резко «просело» качество нормативно-справочной информации (НСИ) – это считалось временным явлением и объяснялось новизной методологии.

С другой стороны, традиционный подход, подразумевающий, что главное в описании продукции  – это формирование технически грамотного наименования (с разумной единообразностью внутри своей группы, конечно) – всячески очернялся как пережиток прошлого, как чрезмерно затратный, ибо требовал наличия грамотных технических специалистов.

Основная техническая часть этой статьи была написана еще весной 2022 года и имела целью исключительно узкопрофессиональную критику одной из привнесенных с Запада ИТ-методологий.  Сегодня же есть смысл взглянуть на проблему и с точки зрения «конспирологии»: а не случайны ли эти «закладки»? Не повторение ли это аферы с СОИ 80-х годов, приведшей к перегрузке нашей экономики непроизводительными затратами?

Читать далее
Total votes 13: ↑9 and ↓4+8
Comments31

2003–2023: Краткая история Big Data

Reading time17 min
Views16K
Когда, играя в ту или иную RPG, я оказываюсь в библиотеке, то обязательно перечитываю все книги на полках, чтобы лучше вникнуть во вселенную игры. Помнит кто-нибудь «Краткую историю империи» в Morrowind?

Большие данные (Big Data) и, в частности, экосистема Hadoop появились немногим более 15 лет назад и развились к сегодняшнему дню так, как мало кто мог тогда предположить.

Ещё только появившись, опенсорсный Hadoop сразу стал популярным инструментом для хранения и управления петабайтами данных. Вокруг него сформировалась обширная и яркая экосистема с сотнями проектов, и он до сих пор используется многими крупными компаниями, даже на фоне современных облачных платформ. В текущей статье я опишу все эти 15 лет1 эволюции экосистемы Hadoop, расскажу о её росте в течение последнего десятилетия, а также о последних шагах в развитии сферы больших данных за последние годы.

Так что пристегнитесь и настройтесь на путешествие во времени вглубь 20 последних лет, поскольку наша история начинается в 2003 году в маленьком городке к югу от Сан-Франциско…

Дисклеймер: изначально я планировал оформить статью логотипами упоминаемых в ней компаний и программ, но на TDS запрещено обширное использование логотипов, поэтому я решил украсить содержание случайными изображениями и справочной информацией. Весело вспоминать, где мы в те времена находились и чем занимались.

Читать дальше →
Total votes 44: ↑43 and ↓1+60
Comments9

Работа с поверхностными и глубокими копиями в Python

Reading time19 min
Views11K

В этой статье объясняется, как делать копии списков Python, массивов NumPy и датафреймов Pandas при помощи операций получения срезов, списочного индексирования (fancy indexing) и логического (boolean indexing). Эти операции очень часто используются при анализе данных и должны рассматриваться всерьёз, поскольку ошибочные предположения могут привести к падению быстродействия или неожиданным результатам.

Python кажется простым, но всякий раз, возвращаясь к его азам, ты находишь новые для освоения вещи. Здесь на ум приходит известное изречение Эйнштейна:

«Чем больше я узнаю, тем больше понимаю, как много я ещё не знаю».
Читать дальше →
Total votes 42: ↑42 and ↓0+42
Comments4

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity