Articles / Bookmarks / Profile of Doctor

Влад Ефименко @Doctor_IT

Главный редактор

Profile Publications 107Comments 234Bookmarks 597

gvrva Mar 21 2022 at 10:17

Как мы сделали фильтр «бабушкин ремонт»

10 min

24K

Циан corporate blogMachine learning*

Найти и выбрать квартиру в современном мире — что может быть проще? Берёшь смартфон, скачиваешь приложение и находишь подходящий вариант. Так же просто разместить объявление о продаже или аренде недвижимости. Пользователи смотрят десятки квартир в поисках подходящей — качество ремонта для них очень важно. Вот было бы классно, если бы существовал фильтр, который может правдиво оценить новизну ремонта и отсортировать…

Меня зовут Ирина Говорова, и сейчас я расскажу, как во время моей стажировки в Циан наша команда разработала фильтр «бабушкин ремонт», способный распознавать и классифицировать фотографии помещений.

+43

RUBDA May 25 2022 at 15:58

Что такое Brain2Logic: Data Science без кода для юниоров

11 min

2.9K

Ассоциация больших данных corporate blogBig Data*Machine learning*

Современное машинное обучение не только перенимает крутые математические методы, но и подстраивается под стремление человека автоматизировать управление процессами. Природа явления остаётся загадкой. То ли мы добиваемся лаконичности, то ли убиваемся собственной ленью — неважно, если результат оправдывает затраты.

Одним из таких результатов стала AutoML-платорма Brain2Logic стартапа Mavericka, которая недавно была пропилотирована в песочнице Ассоциации больших данных. Платформу помог протестировать Билайн, поставив задачу построить модели для рекомендаций фильмов. В этой статье представлен общий взгляд на современные AutoML-решения с акцентом на проект Brain2Logic (B2L).

Если вам интересно, что смогли придумать в Mavericka, посмотреть на тестирование и почитать наши рассуждения про AutoML — добро пожаловать под кат.

Doctor_IT Jul 19 2022 at 15:03

Модульные роботы: проекты, за которыми стоит следить

5 min

8.9K

Selectel corporate blogPopular scienceRobotics development*Robotics

Модульными называются роботы, структура которых может изменяться с помощью добавления узлов, самостоятельных по отдельности. Они могут быть полезны в разных областях — от разработки игр до медицины и космонавтики.

Под катом собрали перспективные проекты модульных роботов. Как они работают, каких бывают форм и какие у них проблемы в реализации — рассказываем в подборке.

Читать дальше →

+45

Doctor_IT Jul 13 2022 at 15:58

Объединяй коммутаторы и властвуй — сравниваем Stack и MLAG

6 min

26K

Selectel corporate blogNetwork technologies*Network hardwareIT Infrastructure*

Привет, Хабр! Недавно мы опубликовали статью про сетевое резервирование в дата-центрах Selectel. Увидели, что текст вам понравился и написали продолжение.

По мотивам выступления Кирилла Малеванова, технического директора Selectel,
рассказываем о технологиях физического резервирования коммутаторов. Что такое Stack и MLAG, как они помогают в L2-резервировании и какую технологию выбрать.

Читать дальше →

+35

Doctor_IT Jul 5 2022 at 15:33

Сетевое резервирование в дата-центрах: решаем задачку про двух велосипедистов

8 min

14K

Selectel corporate blogIT Infrastructure*Backup*Network hardwareNetwork technologies*

Среди клиентов Selectel — социальные сети, интернет-издания, системы электронных платежей и другие компании. Их сервисы нуждаются в бесперебойной работе, которая достигается резервированием всех систем дата-центра. За время существования компании мы накопили опыт резервирования, который позволяет давать гарантии клиентам, и сейчас хотим им поделиться.

На вебинаре Selectel Network Academy эксперты компании рассказали о практиках L2- и L3-резервирования в дата-центрах Selectel. Подробнее о них — под катом.

Читать дальше →

+46

eucariot Dec 22 2015 at 12:42

Сети для самых маленьких. Часть одиннадцатая. MPLS L3VPN

42 min

279K

Network technologies*System administration*

Tutorial

В прошлый раз мы не оставили камня на камне при разборе MPLS. И это, пожалуй, хорошо.

Но до сих пор только призрачно прорисовывается применение его в реальной жизни. И это плохо.

Этой статьёй начнём исправлять ситуацию. Вообще же читателя ждёт череда из трёх статей: L3VPN, L2VPN, Traffic Engineering, где мы постараемся в полной мере рассказать, для чего нужен MPLS на практике.

Итак, linkmeup — уже больше не аутсорсинг по поддержке хоть и крупной, но единственной компании, мы — провайдер. Можно даже сказать федеральный провайдер, потому что наша оптика ведёт во все концы страны. И наши многочисленные клиенты хотят уже не только высокоскоростной доступ в Интернет, они хотят VPN.
Сегодня разберёмся, что придётся сделать на нашей сети (на которой уже меж тем настроен MPLS), чтобы удовлетворить эти необузданные аппетиты.

SDSM11-L3VPN

Читать дальше →

+29

AllDmeat Jun 3 2022 at 12:04

Командное «ретро» в Майнкрафт: 10 из 10, не рекомендую

9 min

15K

Dodo Engineering corporate blogProject management*

История о том, как я, iOS-разработчик, решил провести рабочую встречу в игре, как готовился и что из этого получилось. В ней не будет заумных мыслей, полезной пользы и многозначительных выводов. Она лишь о том, что рутину можно сделать весёлой, что взрослые ведут себя как дети и что даже когда ты всё предусмотрел — ты не всё предусмотрел.

Рассказ в картинках

+40

pmaximchuk Jun 14 2022 at 11:11

Как мы впервые делали инженерный «хакатон» и что из этого вышло

6 min

4.4K

YADRO corporate blogHackathonCPUManufacture and development of electronics*FPGA*

Привет, Хабр! Не так давно, у себя в блоге мы анонсировали студенческий инженерный «хакатон» YADRO SoC Design Challenge по проектированию современных микропроцессоров на базе архитектуры RISC-V. Теперь будет логично поделиться подробным рассказом, как это было. Спойлер: первый блин не комом, а кое в чём мероприятие даже приятно удивило. Детали читайте под катом.

Приятного чтения!

+16

Doctor_IT Jun 8 2022 at 15:53

Тест на доверчивость: зачем мы отправляем фишинг-сообщения сотрудникам

8 min

10K

Selectel corporate blogIT-companiesInformation Security*System administration*Statistics in IT

Сотрудник компании, который не соблюдает или не знает правил информационной безопасности, — потенциальное слабое звено для злоумышленников. По данным «Ростелеком-Солар», 75% кибератак начинаются с фишинга.

Мы в Selectel нашли способ повышения грамотности сотрудников в сфере ИБ в виде боевых учений. Делимся профилактическими кейсами, где мстительный Георгий собирает данные о сотрудниках, притворяясь LAZZON, а финансовый директор рассылает письма с ложного домена.

Дисклеймер: используемые названия предприятий LAZZON и «Пенькофф» вымышлены, любые совпадения с реальными компаниями случайны.

Читать дальше →

+28

Doctor_IT May 30 2022 at 18:51

Anonymous покушаются на бургеры. DDoS-2022: ждать ли новые серии атак

7 min

5.4K

Selectel corporate blogHostingInformation Security*System administration*Statistics in IT

Со второй половины февраля 2022 года в рунете начались волнения. Причиной послужили серии кибератак, из-за которых пострадали государственные организации, банки, интернет-ресурсы СМИ, сервисы дистанционного образования и другие компании.

На Хабре и других порталах опубликованы десятки новостей о DDoS-атаках за февраль, март и апрель. Показатели DDoS-атак рекордные и заслуживают внимания.

В этой статье мы постарались прояснить ситуацию с помощью данных систем безопасности Selectel, провайдеров security-сервисов и СМИ. За цифрами приглашаем под кат.

Читать дальше →

+39

Cloud4Y May 18 2022 at 15:38

Реставрация 100-летнего фильма с помощью ИИ

5 min

23K

Cloud4Y corporate blogWorking with video*Artificial Intelligence

Translation

Генеральный директор проекта neuro.love Денис Ширяев поделился удачными практиками и алгоритмами для восстановления и улучшения качества старых фильмов. Для самостоятельных экспериментов требуются базовые знания Abode Premiere или After Effects, но результат того стоит. Подробности — под катом.

+24

habr_career Apr 29 2022 at 11:15

Где работать в ИТ в 2022: Selectel

20 min

22K

Хабр Карьера corporate blogPersonnel Management*IT career

Наша рубрика «Где работать в ИТ» — это интервью с интересными айти-компаниями, в которых они делятся подробностями о процессах своей работы. Представители индустрии отвечают на вопросы о найме, условиях, командах и технологиях.

В этом выпуске мы расскажем вам о компании Selectel — провайдере облачной инфраструктуры и услуг дата-центров.

+47

honyaki Apr 16 2021 at 16:46

Объясняем на пальцах принцип действия оптимизаторов для нейронных сетей: основные алгоритмы, и зачем они нужны

10 min

23K

Skillfactory corporate blogAlgorithms*Mathematics*Machine learning*Reading room

Translation

Оптимизаторы — важный компонент архитектуры нейронных сетей. Они играют важную роль в процессе тренировки нейронных сетей, помогая им делать всё более точные прогнозы. Специально к старту нового потока расширенного курса по машинному и глубокому обучению, делимся с вами простым описанием основных методик, используемых оптимизаторами градиентного спуска, такими как SGD, Momentum, RMSProp, Adam и др.

Darthman Jan 20 2015 at 23:28

Объемные планеты в 2D через шейдер

7 min

58K

Delphi*Game development*

А помните, как вы просили меня про шейдеры написать? Помните? Нет? А вот я помню и даже написал. Милости просим, поговорим о прекрасном.

Сегодня я поведу речь о том, как я делал объемные вращающиеся планеты для нашей игры blast-off. Тоесть они, конечно, совершенно плоские, всего пара треугольников, но выглядят как объемные.

Заинтересовало? Прошу под кат. Картинок прилично.

Читать дальше →

+73

Dmytro_Kikot Oct 14 2020 at 09:50

Скорость звука: каков ее предел?

10 min

24K

ua-hosting.company corporate blogChemistryPhysicsPopular science

Одна из основных задач какой-либо точной науки заключается в измерении и объяснении тех или иных процессов, а также их участников. За многие годы исследований, расчетов и споров научное сообщество пришло к пониманию того, что существуют определенные ограничения в некоторых явлениях. К примеру, скорость света в вакууме равна 299 792 458 м/с. Согласно специальной теории относительности, ничто не может двигаться быстрее. Другими словами, мы имеем верхний скоростной лимит для света. Однако такой лимит для скорости звука пока не был установлен. Ученые из Лондонского университета королевы Марии (Англия, Великобритания) провели расчеты, результатом которых стало открытие верхнего предела скорости звука. Что стало основой расчетов, каковы их результаты, и в каких областях можно применить новообретенные знания? Ответы на эти вопросы мы найдем в докладе ученых. Поехали.

Читать дальше →

+38

frobeniusfg Aug 13 2020 at 00:04

Основы линейной регрессии

13 min

182K

Mathematics*Machine learning*

Здравствуй, Хабр!

Цель этой статьи — рассказать о линейной регрессии, а именно собрать и показать формулировки и интерпретации задачи регрессии с точки зрения математического анализа, статистики, линейной алгебры и теории вероятностей. Хотя в учебниках эта тема изложена строго и исчерпывающе, ещё одна научно-популярная статья не помешает.

! Осторожно, трафик! В статье присутствует заметное число изображений для иллюстраций, часть в формате gif.

Читать дальше →

+18

levap Jan 30 2011 at 13:44

Основы фотографии: выдержка, диафрагма, ГРИП, светочувствительность

6 min

408K

Photographic equipment

Введение

Часто люди приобретают цифровые зеркальные камеры в погоне за качеством снимков, но при этом не имеют представления о технических моментах съемки. В основном это касается тех, кто до зеркалки держал в руках исключительно компактные фотоаппараты и пользовался автоматическими режимами (которые, к слову, весьма продвинутые в современных камерах).

В результате у кого-то возникает разочарование в камере и фотографии в целом, а другие проявляют терпение и пытаются освоить премудрости фотографии, чтобы раскрыть весь потенциал камеры с полноценным (или почти полноценным) сенсором.

Изначально я планировал написать одну статью, но по ходу дела понял, что объем получается слишком большой и решил разбить ее на несколько частей. В этой главе рассмотрю такие понятия как выдержка, диафрагма, ГРИП и светочувствительность, как эти параметры влияют на результат съемки. На очереди статья про типы и параметры объективов, работу со вспышками и советы по съемке в различных условиях.

Читать дальше →

+192

378

deNULL Nov 26 2021 at 17:49

Воссоздаем Minecraft-подобную генерацию мира на Python

11 min

27K

Game development*Algorithms*

Translation

Minecraft, самая продаваемая игра в мире, наиболее известная своими пикселизированными блоками и бесконечными мирами, содержит потрясающий процедурный генератор ландшафта — с пещерами, водоёмами, и даже различными биомами.

Процедурная генерация является важной частью компьютерной графики — она используется в основном в играх и в фильмах. Она помогает создавать случайные структуры, не вызывающие ощущения «машинного» стиля.

Также процедурная генерация играет важную роль в машинном обучении. Она позволяет генерировать такие данные, которые сложно собрать. Обучение моделей машинного обучения требует огромных датасетов, которые может быть затруднительно собирать и подготавливать. Генерацию данных процедурным образом можно легко адаптировать к требуемому типу данных.

В детстве мне нравилось играть в Minecraft, и мне всегда было интересно, как эта игра генерирует бесконечные миры. В данной я статье я попытаюсь воссоздать это на Python.

Прим. переводчика. Осторожно, в статье много иллюстраций (в том числе анимированных)

+57

skillfactory_school Jun 16 2020 at 19:36

Шпаргалка по сортировке для Data Science

11 min

24K

Skillfactory corporate blogBig Data*Algorithms*Programming*Studying in IT

Translation

Сортировка данных является основной задачей для ученых и инженеров по обработке данных. Пользователи Python могут выбирать наиболее удобную из ряда библиотек со встроенными, оптимизированными опциями сортировки. Некоторые даже работают параллельно с GPU. На удивление, некоторые методы сортировки не используют указанные типы алгоритмов, а другие работают совсем не так, как ожидалось.

Выбор библиотеки и типа алгоритма сортировки не всегда прост, а нововведения меняются в быстром темпе. На данный момент документация Pandas не соответствует коду (хотя лично мое PR-обновление сортировочных опций было самым последним).

В этой статье я разъясню вам, что к чему, дам пару советов, которые помогут с разобраться с методами, и поделюсь результатами теста скорости.

UPD 17 июля 2019: В результаты оценки теста скорости теперь входят реализации GPU PyTorch и TensorFlow. TensorFlow также включает в себя результаты CPU как при tensorflow==2.0.0-beta1, так и при tensorflow-gpu==2.0.0-beta1. Интересные наблюдения: графический процессор PyTorch буквально летает, а GPU TensorFlow оказался медленнее CPU TensorFlow.

Контекст

Базовых алгоритмов сортировки существует множество. Одни из них имеют высокую производительность и занимают меньше места, другие хорошо работают с большим числом данных. Для некоторых алгоритмов важно взаимное расположение элементов данных. На диаграмме в начале статьи можно увидеть ситуацию по времени и объему для самых распространенных алгоритмов.

Читать дальше →

Shmidtk Jul 7 2019 at 10:17

Сэмплирование и точность вычислений

6 min

16K

Data Mining*Mobile App Analytics*Product Management*

Ряд моих коллег сталкиваются с проблемой, что для расчета какой-то метрики, например, коэффициента конверсии, приходится кверить всю базу данных. Или нужно провести детальное исследование по каждому клиенту, где клиентов миллионы. Такого рода квери могут работать довольно долго, даже в специально сделанных для этого хранилищах. Не очень-то прикольно ждать по 5-15-40 минут, пока считается простая метрика, чтобы выяснить, что тебе нужно посчитать что-то другое или добавить что-то еще.

Одним из решений этой проблемы является сэмплирование: мы не пытаемся вычислить нашу метрику на всем массиве данных, а берем подмножество, которое репрезентативно представляет нам нужные метрики. Это сэмпл может быть в 1000 раз меньше нашего массива данных, но при этом достаточно хорошо показывать нужные нам цифры.

В этой статье я решил продемонстрировать, как размеры выборки сэмплирования влияют на ошибку конечной метрики.

Читать дальше →

+13

1 2 ...

20 21

23 24 25 26