Pull to refresh
4
0
Виталий Маслянинов@vitos73

CTO at Serpstat

Send message

тут или ишак или падишах к 2100му...

Похожая история случилась у меня. В эпоху расцвета локализации китайских/корейских мморпг была такая игра Shadowland Online. в рунете известная как ирод.ком, разработчики были китайцы, код - часть php (частично ими скомунизденый из ультимы), часть серверный флеш на adobe media server. В этом "флешовом" серверном коде была встроена аналогичная проверка на дату: после определенной даты сервер переставал работать и начинал писать странные ошибки. Тут появлялись китайский товарисчи, отвечающие за поддержку и все исправляли, ну и годовой контракт на поддержку продлевался конечно же, работает жеж!. А потом пришел HTML5, флешу стало плохеть, и китайские друзья тихо слились, просто перестали отвечать. Игра начала постепенно падать на всех сервисах. Упала и у нас. Что поделаешь, надо чинить. Я сначала проверил историю инцидентов, потом перевел время на сервере на неделю назад, и о чудо... Ну а дальше вспоминая детство ("надо много золота") нашел по сигнатурам, проверку на год, число и месяц тремя сравнениями, прям как тут в статье. Благо байт код флеша был не шифрованный, проверки на контрольную сумму не было, пропатчил на 2100 год и все заработало.

Линкедин борется не с рекрутерами, а с "продаванами", которые освоили Phantombuster и другие сервисы автоматизации и сначала собирают тематические профили, а потом пытаются продать всем свои услуги добавляясь.
В прошлом году поток таких добавлений зашкаливал. Сейчас начали банить с полной невозможностью разбана. И я считаю это правильным.
У LinkedIn есть платный функционал для рекрутеров, 3 бесплатых job post для совсем экономных. Хотите зарабатывать на информации, извольте заплатить!
У кого нет денег на проезд тот ходит пешком.

Ждем статью «Подключаем лампочку к батарейке самостоятельно»
Перед зеброй притормаживать надо если плохой обзор и есть вероятность мгновенной материализации пешехода, аналогично ровняясь с автобусом/троллейбусом на остановке.
Есть два человека которым я бы памятники при жизни поставил за ClickHouse: Алексею Миловидову, как автору и идейному двигателю, Денису Журавлёву (den_crane) — за поддержку и консультации в группе ClickHouse телеге.

Для больших объемов (не один сайт) есть настоящие краулеры:


  1. https://github.com/LAW-Unimi/BUbiNG/ — BUbiNG — разработка университета Милана, умеет сохранять в WARC формат (Java)
  2. https://github.com/DigitalPebble/storm-crawler — Strom Crawler — разработка DigitalPeble — хороший масштабируемый краулер — конструктор (Java)
  3. https://frontera.readthedocs.io/en/latest/topics/overview.html — Frontera — отличный масштабируемый фреймворк для построения краулеров (Python)
  4. http://nutch.apache.org/ — Nutch — один из долгожителей, основа CommonCrawl

На базе 2-го и 3-го сделано огромное количество коммерческих поделок, но в каждом из этих четырых есть масса интересных идей, которых я нигде не встречал. Например, в BUbiNG используется bloom фильтр для снижения нагрузки при обнаружении новых ссылок.

Ограничиваем количество сессия --> Ограничиваем количество сессий
Всегда смотрю Github перед собеседованием, 99% это обычно курсовые работы. Но бывают редкие исключения: случайно обнаружил, что кандидат выложил на Github реальные данные клиента с доступами в БД и админку проекта. Проверил: попал в живой интернет магазин. На работу его конечно не взял, попросил убрать из публичного доступа, но после этого случая Github изучаю детально.

Information

Rating
Does not participate
Location
Одесса, Одесская обл., Украина
Registered
Activity