Как стать автором
Обновить
4
0

Пользователь

Отправить сообщение

Полный список вопросов с собеседований по Python для дата-сайентистов и инженеров

Время на прочтение14 мин
Количество просмотров95K
Snake and flowers 2 by pikaole

Бывает, что компания ищет дата-сайентиста, а на самом деле ей нужен Python-разработчик. Поэтому при подготовке к собеседованию есть смысл освежить в памяти информацию по Python, а не только штудировать алгоритмы.

Команда Mail.ru Cloud Solutions перевела статью разработчика, который не раз попадал в такую ситуацию и на основе своего опыта составил список из 53 вопросов и ответов для подготовки к собеседованию. Большинство исследователей данных пишут много кода, поэтому такой список пригодится и дата-сайентистам, и инженерам. Он будет полезен и для соискателей, и для тех, кто проводит собеседования, и для тех, кто просто изучает Python.

Вопросы идут в случайном порядке. Поехали.
Читать дальше →
Всего голосов 21: ↑19 и ↓2+31
Комментарии24

Мониторинг качества воздуха c помощью данных TROPOMI в Google Earth Engine

Время на прочтение8 мин
Количество просмотров4.6K


Доступ к воздуху, безопасному для дыхания, очень важен для планеты и её жителей. Однако сейчас во многих частях света люди и хрупкие экосистемы страдают от воздействия загрязнённой атмосферы. В одних только США плохое качество воздуха ежегодно становится причиной около 60,000 случаев преждевременной смерти и обходится государству более чем в 150 млн. долларов, которые тратятся на лечение связанных с этим недугов.


Сейчас, в период социального дистанцирования и перекрытых границ, во многих регионах происходит снижение выбросов загрязняющих веществ. Фактически мы наблюдаем новое состояние качества воздуха, связанное с отсутствием характе́рных выбросов от транспорта и иных источников. Атмосфера очищается, и спутники NASA и ESA регистрируют снижение концентрации NO2 над многими городами и транспортными коридорами.

Читать дальше →
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Godot, 1000 мелочей

Время на прочтение12 мин
Количество просмотров48K
Недавно открыл для себя Godot engine, опенсурсный игровой движок. Делюсь некоторыми приёмами и заметками, в основном из области 3д, кода или общих моментов.

Всего голосов 8: ↑7 и ↓1+7
Комментарии24

IDA Pro: работа с библиотечным кодом (не WinAPI)

Время на прочтение7 мин
Количество просмотров7.6K

Всем привет,



При работе в IDA мне, да и, наверняка, вам тоже, часто приходится иметь дело с приложениями, которые имеют достаточно большой объём кода, не имеют символьной информации и, к тому же, содержат много библиотечного кода. Зачастую такой код нужно уметь отличать от написанного пользователем. И, если на вход библиотечного кода подаются только int, void * да const char *, можно отделаться одними лишь сигнатурами (созданные с помощью FLAIR-утилит sig-файлы). Но, если нужны структуры, аргументы, их количество, тут без дополнительной магии не обойдёшься… В качестве примера я буду работать с игрой для Sony Playstation 1, написанной с использованием PSYQ v4.7.

Читать дальше →
Всего голосов 16: ↑16 и ↓0+16
Комментарии12

Пара слов об именовании переменных и методов

Время на прочтение6 мин
Количество просмотров18K


Правильное именование переменных, функций, методов и классов — это один важнейших признаков элегантного и чистого кода. Кода, который чётко и ясно передает намерения программиста и не терпит допущений о том, что же имелось в виду.


В этой статье мы будем говорить о коде, являющемся полной противоположностью описанного выше — о коде, к написанию которого подходили второпях, безответственно и невдумчиво. Эта статья — небольшая исповедь, ведь и мне, как и любому другому программисту, так же доводилось писать подобный код. В этом нет ничего ужасного до тех пор, пока мы понимаем, что это плохо и над этим нужно работать.

Читать дальше →
Всего голосов 17: ↑13 и ↓4+14
Комментарии18

Микросервисы: шаг назад

Время на прочтение4 мин
Количество просмотров17K
На дворе 2020 год, эпоха технологических стартапов и сурового энтерпрайза. На первый взгляд, ничего общего у них нет, кроме моды на построение IT систем в стиле микросервисов. Ранее для энтерпрайза считалось стандартом использовать монолитные системы. Теперь в листингах вакансий крупных компаний чаще указывают обязанности типа «распилить на микросервисы».

Появляется ощущение, что микросервисы часто позиционируются как «серебряная пуля» на замену монолиту. Но не всем нравится подобный подход. По факту используется он иногда некорректно или нецелесообразно. Ниже собраны примеры проблем, с которыми мне «повезло» столкнуться при использовании микросервисов в разных компаниях и которые не хочется повторять в будущем.
Читать дальше →
Всего голосов 24: ↑19 и ↓5+21
Комментарии52

Изучаем VoIP-движок Mediastreamer2. Часть 13, заключительная

Время на прочтение13 мин
Количество просмотров1.1K

Материал статьи взят с моего дзен-канала.



Все статьи цикла


Статья 1
Статья 2
Статья 3
Статья 4
Статья 5
Статья 6
Статья 7
Статья 8
Статья 9
Статья 10
Статья 11
Статья 12
Статья 13


Книгу на основе статей можно свободно скачать по ссылке: pdf-файл.


В прошлой статье, мы рассмотрели вопросы отладки крафтовых фильтров, связанные с перемещением данных.


Эта статья будет заключительной в цикле и её мы посвятим, как неоднократно обещалось, вопросам оценки нагрузки на тикер и способы борьбы с чррезмерной вычислительной нагрузкой в медиастримере.

Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Самые простые конечные автоматы или стейт-машины в три шага

Время на прочтение4 мин
Количество просмотров16K

image Привет, Хабр!
Перейдем сразу к делу, но небольшая предыистория все таки нужна: полтора года назад возникла необходимость реализовать простую стейт — машину (конечный автомат), владея теорией с университета, я был уверен в тривиальности данной задачи (все мы оптимисты).

Время, проведенное с google, прошло без результатов, так как существующие решения не только имели фатальный недостаток, но и ряд других серьезных недочетов, таких как сложная структура и отсутствие документации.


Вскоре я наткнулся на эту статью, которая подтвердила отсутствие удобных решений.

Читать дальше →
Всего голосов 13: ↑9 и ↓4+13
Комментарии14

TOP'ай сюда

Время на прочтение5 мин
Количество просмотров178K
Обзор практически всех *top утилит под linux (atop, iotop, htop, foobartop и т.д.).

top

Все мы знаем top — самую простую и самую распространённую утилиту из этого списка. Показывает примерно то же, что утилита vmstat, плюс рейтинг процессов по потреблению памяти или процессора. Совсем ничего не знает про загрузку сети или дисков. Позволяет минимальный набор операций с процессом: renice, kill (в смысле отправки сигнала, убийство — частный случай). По имени top суффикс "-top" получили и все остальные подобные утилиты в этом обзоре.

atop


Atop имеет два режима работы — сбор статистики и наблюдение за системой в реальном времени. В режиме сбора статистики atop запускается как демон и раз в N времени (обычно 10 мин) скидывает состояние в двоичный журнал. Потом по этому журналу atop'ом же (ключ -r и имя лог-файла) можно бегать вперёд-назад кнопками T и t, наблюдая показания atop'а с усреднением за 10 минут в любой интересный момент времени.

В отличие от top отлично знает про существование блочных устройств и сетевых интерфейса, способен показывать их загрузку в процентах (на 10G, правда, процентов не получается, но хотя бы показывается количество мегабит).

Незаменимое средство для поиска источников лагов на сервере, так как сохраняет не только статистику загрузки системы, но и показатели каждого процесса — то есть «долистав» до нужного момента времени можно увидеть, кто этот счастливый момент с LA > 30 создал. И что именно было причиной — IO программ, своп (нехватка памяти), процесор или что-то ещё. Помимо большего количества информации ещё способен двумя цветами подсказывать, какие параметры выходят за разумные пределы.
Читать дальше →
Всего голосов 401: ↑389 и ↓12+377
Комментарии122

Геология XXI века как наука данных о Земле

Время на прочтение5 мин
Количество просмотров5.6K

Сразу оговорюсь, что деление на века немного условно. Например, спутниковая интерферометрия используется с конца 1980-х годов, при этом высококачественные данные стали общедоступными только в 2000-х годах. Трехмерные модели тоже отнюдь не новинка, и делали их ну очень давно — ведь и плоская Земля на трех китах вполне себе объемная модель. Так в чем же разница геологии века прежнего и настоящего?



Слева — фрагмент геологической карты США, справа — 3D геологическая модель с интерферограммой на поверхности рельефа по данным радарной спутниковой съемки (на шкале Density Gradient,% является характеристикой неоднородности геологической плотности, а Band Magnitude обозначает разность фаз отраженного сигнала радара для пары разновременных снимков)

Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии72

Самая сложная задача в Computer Vision

Время на прочтение13 мин
Количество просмотров68K
Среди всего многообразия задач Computer Vision есть одна, которая стоит особняком. К ней обычно стараются лишний раз не притрагиваться. И, если не дай бог работает, — не ворошить.
У неё нет общего решения. Практически для каждого применения существующие алгоритмы надо тюнинговать, переобучать, или судорожно копаться в куче матриц и дебрях логики.

Статья о том как делать трекинг. Где он используется, какие есть разновидности. Как сделать стабильное решение.
Всего голосов 127: ↑127 и ↓0+127
Комментарии42

Самые надежные HDD по версии Backblaze Q1 2020

Время на прочтение3 мин
Количество просмотров96K

Несмотря на все карантинные перипетии, дата-центры продолжают работать. Причем с большей нагрузкой, чем раньше, ведь объем интернет-трафика значительно вырос. Какие жесткие диски справятся с работой лучше всего, в очередной раз выяснила компания Backblaze. Известный облачный сервис хранения данных выпустил отчет о надежности HDD — за I квартал 2020 года.

Количество HDD у Backblaze постоянно увеличивается. На момент формирования отчета в распоряжении компании 132 339 дисков. Из них 2 380 — загрузочные, 129 959 — диски для хранения данных. В отчете отображается статистика по отказам дисков разных компаний и разной емкости.
Читать дальше →
Всего голосов 31: ↑30 и ↓1+39
Комментарии97

Долой циклы, или Неленивая композиция алгоритмов в C++

Время на прочтение9 мин
Количество просмотров18K
"Кто ни разу не ошибался в индексировании цикла, пусть первый бросит в деструкторе исключение."

— Древняя мудрость

Циклы ужасны. Циклы сложно читать — вместо того, чтобы сразу понять намерение автора, приходится сначала вникать в код, чтобы понять, что именно он делает. В цикле легко ошибиться с индексированием и переопределить индекс цикла во вложенном цикле. Циклы сложно поддерживать, исправлять в случае ошибок, сложно вносить текущие изменения, и т.д. и т.п.


В конце концов, это просто некрасиво.


Человечество издревле пытается упростить написание циклов. Вначале программисты подметили часто повторяющиеся циклы и выделили их в отдельные функции. Затем они придумали ленивые итераторы, а потом и диапазоны. И каждая из этих идей была прорывом. Но, несмотря на это, идеал до сих пор не достигнут, и люди продолжают искать способы улучшить свой код.


Данная работа ставит своей целью пролить свет на отнюдь не новую, но пока что не слишком распространённую идею, которая вполне способна произвести очередной прорыв в области написания программ на языке C++.


Так как же писать красивый, понятный, эффективный код, а также иметь возможность параллелить большие вычисления лёгким движением пальцев по клавиатуре?

Читать дальше →
Всего голосов 19: ↑18 и ↓1+22
Комментарии47

Отказываемся от платных RPA платформ и базируемся на OpenSource (OpenRPA)

Время на прочтение4 мин
Количество просмотров23K

Вводная


Ранее на Хабре очень подробно освещалась тема Автоматизации десктопных GUI приложений на Python. В то время меня очень сильно привлекла эта статья, потому что в ней раскрываются элементы, схожие с элементами создания роботов. А так как по роду своей профессиональной деятельности я занимаюсь роботизацией бизнес-процессов компании (RPA — область, в которой не было полнофункциональных OpenSource аналогов до недавнего времени), данная тема была очень актуальна для меня.

Читать дальше →
Всего голосов 9: ↑9 и ↓0+9
Комментарии23

Zephyr в embedded: опыт использования на STM32F7-Discovery

Время на прочтение6 мин
Количество просмотров18K
image

История о моем опыте использования операционной системы реального времени (ОСРВ) Zephyr для устройства на базе микроконтроллера STM32F7-Discovery.


В статье:


  • Что такое Zephyr и при чем тут Linux?
  • Запуск проекта на STM32. Интересные моменты по работе с драйверами.
  • Фишки этой ОС. Что понравилось, а что нет.
Читать дальше →
Всего голосов 15: ↑14 и ↓1+21
Комментарии43

Холодный, не ламповый обзор Audio-Technica AT-LPW40WN

Время на прочтение6 мин
Количество просмотров9K
Этот пост начнёт новый цикл, в котором будут обзоры электроники без субъективной оценки автора и громких заявлений производителей, мнения и выводы будут строиться исключительно на технических данных об устройствах и фактах об их функциональности и потребительских свойствах.



Во многих обзорах, затрагивающих виниловую тему, очень много эмоциональной составляющей, субъективизма и вкусовщины. Именно по этой причине я решил начать цикл с пилотного обзора винилового проигрывателя. Если удастся сделать такой обзор не предвзятым, полезным и при этом не слишком скучным, значит формат цикла имеет право на жизнь. Под катом сугубо технический обзор Audio-Technica AT-LPW40WN. «Холодным» и «не ламповым» он назван от того, что сознательно избавлен от «тёплого лампового» маркетинга.
Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии16

24 датасета для ритейла и ecommerce

Время на прочтение4 мин
Количество просмотров15K
image

Продуктовые датасеты


  • Fashion-MNIST: Идеально подходит для продуктовой категоризации. MNIST содержит почти 60 000 обучающих изображений и 10 000 тестовых изображений продуктов фэшн-индустрии в 10 классах.
  • Innerwear Data from Victoria’s Secret and Others: Данные с 600 000+ товаров нижнего белья, извлеченного из популярных торговых объектов. Включает в себя описание продукта, цену, категорию, рейтинг и многое другое.
  • Electronic Products and Pricing Data: Содержит список из более чем 7000 электронных продуктов.
  • Men’s Shoe Prices: Список содержащий 10 000 мужских ботинок и цен.
  • Women’s Shoe Prices: Список содержащий 10 000 женских туфель и цены.
  • eCommerce Item Data: Подходит для рекомендательных систем. Этот набор данных содержит артикулы и связанные с ними описания продуктов из каталога продукции бренда наружной одежды.
  • Fashion Products on Amazon.com: Это pre-crawled набор данных, созданный путем извлечения данных из Amazon. Он состоит примерно из 22 000 фэшн-товаров на Amazon.
  • E-commerce Tagging for Clothing: Содержит изображения с сайтов ecommerce с ограничивающими рамками, нарисованными вокруг рубашек, пиджаков, солнцезащитных очков и т. д. Он содержит 907 наименований, из которых 504 наименования были помечены вручную.

Читать дальше →
Всего голосов 7: ↑5 и ↓2+5
Комментарии0

109 бесплатных курсов по Data Science

Время на прочтение5 мин
Количество просмотров13K
image

Информационные технологии позволяют получить невероятно крутые образовательные ресурсы в один клик. Бесплатно.

Я сейчас решаю задачу, как из огромной массы жизненно важного контента выбрать тот, который стоит попробовать в первую очередь, как «разметить данные», чтобы нейросеточка у подрастающего поколения обучилась более эффективно. (ontol.org, «Выгорание», «Удаленка», телеграмм-канал).

Предлагаю вам подборку бесплатных онлайн-курсов по Data Science от лучших университетов в мире:

Читать дальше →
Всего голосов 12: ↑9 и ↓3+8
Комментарии0

Простое распознавание лица «на лету» в Django

Время на прочтение2 мин
Количество просмотров5.7K
Доброго дня!

Меня зовут Соболев Андрей и сегодня мы с вами создадим простую «плюшку» к Django, которая будет проверять, что на фотографии именно лицо человека (что бывает полезно в куче ситуаций).

Для этого нам понадобится OpenCV и 5 минут свободного времени. Поехали.
Читать дальше →
Всего голосов 5: ↑3 и ↓2+4
Комментарии7

Самые эффективные сервисы онлайн-уроков для учеников и преподавателей: пятерка лучших

Время на прочтение6 мин
Количество просмотров82K


Дистанционное обучение сейчас по всем нам понятным причинам становится все популярнее. И если многие читатели Хабра знают о разного рода курсах по цифровым специальностям — разработке ПО, дизайну, продакт-менеджменту и т.п., то вот с уроками для подрастающего поколения ситуация немного иная. Сервисов для онлайн-уроков много, но что выбрать?

В феврале я оценивал разные платформы, и сейчас решил рассказать о тех из них, что мне (да и не только мне, но и детям) понравились больше всего. В подборке — пять сервисов, если у вас есть, что добавить, то расскажите о них в комментариях, изучим.
Читать дальше →
Всего голосов 4: ↑3 и ↓1+7
Комментарии3

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность