Search
Write a publication
Pull to refresh
0
mind2cloud @bitcompilread⁠-⁠only

Data Scientist

Send message

Как работает Wi-fi. Часть 2. Физический уровень

Reading time12 min
Views59K
image

В предыдущей статье о Wi-Fi мы рассказывали об истории беспроводных сетей: первой беспроводной сети AlohaNet, коммерческой WaveLan и IEEE, который поспособствовал стандартизации беспроводных устройств. Вот, кстати, ссылочка на первую публикацию. В этой части цикла про Wi-Fi мы расскажем о сигнале, передающем информацию, а именно: как аналоговые электромагнитные волны передают цифровой сигнал, как модулируется сигнал и что такое мультиплексирование.
Читать дальше →

Мультиклассовая классификация текста. Дисбаланс тренировочных данных и их генерация. Особенности взвешивания TF-IDF

Reading time10 min
Views8.9K

В этой статье я хочу разобрать отдельный сегмент предобработки данных, а именно показать, насколько балансировка тренировочных данных может качественно повлиять на конечный результат, а также чуть глубже погрузиться в суть работы механизма взвешивания слов TF-IDF

Читать далее

Почему быстро стираются зубы и как вернуть всё в норму (это быстро и просто, но дорого)

Reading time10 min
Views22K
Каждый раз, когда вы скрипите зубами или едите что-то прочное или просто соприкасаете челюсти, зубы немного стираются. В ответ следующий слой укрепляется, и срок службы зуба при обычном геноме человека составляет около 50-70 лет, чего, по идее, должно было бы хватать каждому. Но вот к нам приходит пациент с такой картиной (слева исходное состояние, справа мы исправили):



Когда он к нам поступил, его зубы на обеих челюстях были укорочены практически наполовину, что привело к закономерным эстетическим и речевым проблемам, затруднённому жеванию. Пациент работает диктором (на самом деле нет, но очень похоже, детали изменены для сохранения анонимности), то есть под ударом непосредственно его профессиональные навыки.

Зубы стираются у всех людей — это нормальный процесс. Это называется функциональной (физиологической) стираемостью твёрдых тканей зуба. И организм в норме умеет её компенсировать — прилегающий к зоне повреждения дентин склеротизируется, становится более плотным и твёрдым, частично принимая на себя функции стёртой эмали. При физиологической стираемости потери равномерны и незначительны, происходят преимущественно на окклюзионных поверхностях коронок, поэтому зуб сохраняет свои функции и устойчивость к кариесу до глубокой старости. Конечно, при условии, что нет других заболеваний ротовой полости.

Давайте поговорим про то, что делать, если вы всё же скрипите зубами и доскрипели до истирания, например, тех же резцов или передних зубов — или если у вас есть похожие особенности тканей. К счастью, как вы можете понять из заголовка, решение очень простое, быстрое (два долгих приёма в идеале), почти безболезненное, но зато дорогое и требующее хай-тека.

Под катом много фотографий ротовой полости, некоторые всё равно могут показаться неприятными. Заходите, конечно.
Читать дальше →

Применение ML в мониторинге строительства многоквартирных домов

Reading time6 min
Views3.3K

Привет, Хабр! На связи — Григорий Грязнов, руководитель подразделения «Аналитические сервисы» Единой информационной системы жилищного строительства (ЕИСЖС) ДОМ.РФ

По горячим следам недавно запущенного пилота машинного обучения (ML) в ДОМ.РФ решил поделиться с вами этапами его разработки и внедрения. Цель проекта – научиться анализировать темпы строительства многоквартирных домов и выявлять вероятные срывы сроков ввода их в эксплуатацию. В статье я постараюсь описать технологии, процесс построения алгоритмов и автоматизации сформированного решения простым языком, чтобы человек без специальных навыков в ML смог во всем разобраться.

Читать далее

Стипендиат DAAD, или Как я перестал волноваться и полюбил немецкую бюрократию

Reading time16 min
Views21K

Мысль об учёбе за рубежом маячила на задворках разума уже давно, но на передний план она вылезла в начале 4 курса. Именно тогда я решил, что не хочу быть обычным программистом, а хочу быть владычицей морскою учёным в области машинного обучения. А бытует мнение, что учёным лучше быть на Западе. Также бытует мнение, что самый лёгкий способ попасть на Запад — получить там образование. Сложив два и два, я приступил к поиску англоязычной магистратуры.


В статье очень подробно опишу свой личный опыт, помня насколько подобные тексты (например, этот) были полезны мне самому.


TL;DR: имея красный диплом матмеха, получил полную стипендию на учёбу в немецкой магистратуре (на английском языке). Нервотрёпка, бюрократия, личностный рост, сладкий вкус победы.

Читать дальше →

Основные структуры данных. Матчасть. Азы

Reading time5 min
Views258K
Все чаще замечаю, что современным самоучкам очень не хватает матчасти. Все знают языки, но мало основы, такие как типы данных или алгоритмы. Немного про типы данных.

Еще в далеком 1976 швейцарский ученый Никлаус Вирт написал книгу Алгоритмы + структуры данных = программы.

40+ лет спустя это уравнение все еще верно. И если вы самоучка и надолго в программировании пробегитесь по статье, можно по диагонали. Можно код кофе.


Читать дальше →

Сказки от TENSORFLOW и LSTM

Reading time8 min
Views3.9K

Представляем разбор применения алгоритмов машинного обучения с использованием технологий LSTM для создания текстов.

В итоге должен получиться генератор более-менее осмысленного текста. Способы создания текстов на специальную, определенную пользователем, тему затронуты не будут – но в целом, текст будет создан в том стиле, в котором написана «обучающая выборка».

Кстати об обучающей выборке: в качестве оной будут использованы народные сказки братьев Гримм. Эти тексты будут обработаны, разбиты на биграммы уровня символов, из которых будет составлен словарь из уникальных биграмм.

Читать далее

Этапы погружения junior-разработчика

Reading time4 min
Views25K

Всем привет! Меня зовут Иван Сёмин, я руковожу несколькими командами разработки в компании Домклик. На данный момент в моём подчинении 28 человек, часть из которых приходила на junior-позицию. Хочу поделиться своим видением погружения новых сотрудников в процессы компании и коллектив, и рассказать о способах развития разработчиков до middle-уровня в крупных командах.

Читать далее

Скрипт сборщика цитат и распознания текста из видео на Python

Reading time6 min
Views18K
Пост о скрипте, который скачивает видео с youtube и распознает в нем текст. Начать решил сразу с практической реализации. «Vdudictionary» — Скрипт сборщика сборника цитат героев «Вдудь» на Python. Юрий Дудь и его проект «Вдудь» не нуждается в представлении. Самые горячие интервью, которые интересно смотреть. Юрий Александрович умеет сделать интересное шоу, независимо от того, знаете ли Вы героя конкретного выпуска, являетесь его фанатом или впервые слышите это имя.

Сколько у Вас см? Что Вы скажете Путину? Слушаете ли Вы OXY?


Эти и многие другие вопросы теперь ассоциируются с Дудем. Когда интервьюируемый произносит фразу преисполненную мудростью, заботливые монтажеры аккуратно выводят ее на экран наших с Вами мониторов, чтобы донести до нас всю суть. Моей целью было закристаллизовать эту мудрость поколений и создать словарь «Вдудексикон» или «Vdudictionary».

Естественно человеку, пусть и не обремененного специфическим IT бэкграудом, не надлежит руками собирать эти изречения. Для этого я набросал скрипт на python.


Читать дальше →

Работающие способы выехать за рубеж, или Спасение утопающих — дело рук самих утопающих

Reading time10 min
Views93K
Привет, хабровчане! Надеемся, в эти сложные времена вы стараетесь держаться, хотя это и непросто. Впрочем, рефлексировать можно бесконечно долго, толку от этого не будет, сейчас нужно действовать. Как именно — решать только вам самим. Мы лишь можем рассказать об одном из вариантов. А именно о релокации. В этом посте мы решили собрать вакансии из нашего бота в других странах, а также снабдить их информацией, как туда попасть. Подробную информацию по вакансиям (стек и требования) можно найти в самом боте Get Me It, для этого нужно пройти начальную анкету бота и выбрать Европу или СНГ.

Дисклеймер: Призываем всех читателей проявить понимание и воздержаться в комментариях от какой-либо оценки ситуации и околополитических высказываний. Даже если вы не собираетесь релоцироваться, не нашли в подборке вакансию по своему направлению — возможно, эта информация будет полезна кому-то другому, а он её не увидит, если пост скроет администрация из-за политических дискуссий. Заранее спасибо.


Гребите сильнее!

Как за 40 часов распознать всех поросят с помощью компьютерного зрения. Решение задачи на AgroCode Hack

Reading time4 min
Views3.7K

2021 год был очень насыщенный на хакатоны и ИТ-чемпионаты. Мы неоднократно писали о том,  что специализируемся на проектах по компьютерному зрению. В этом наша сила. На AgroCode Hack нам предстояло за 40 часов решить кейс с использованием компьютерного зрения и AI по сегментации и отслеживанию поросят. Рассказываем, как в очередной раз заняли призовое место на хакатоне и отследили всех хрюш. 

Читать далее

Сбор данных с обходом капчи посредством PYAUTOGUI, KERAS и TENSORFLOW

Reading time5 min
Views7.5K

Существует большое количество методов для автоматического сбора и обработки больших объемов данных из веб-ресурсов. Однако иногда недоступно извлечение данных с помощью автоматизированного кода, выполняющего GET-запросы с последующим парсингом HTML-кода, и его преобразованием в необходимый формат, также, как и все смежные методы. В таких случаях на помощь может прийти эмулятор действия пользователя («кликер», «бот», «робот»).

Читать далее

Германия — плюсы, минусы и немыслимое

Reading time15 min
Views167K

Этот пост родился как комментарий к вот этому посту о жизни в Германии. Мне понравился критический взгляд автора на многие вещи и комментарии сообщества. Однако через какое-то время мой планируемый комментарий настолько разросся, что я решил создать отдельную статью со своим видением плюсов и минусов жизни в Германии. Хотя это не совсем правильно: Германия очень разная. Различаются не только земли, но и регионы внутри них и даже города. Поэтому не хочу экстраполировать свой опыт на всю Германию, но опишу реалии проживания в городе Нюрнберг.

Читать далее

Стоит ли стремиться в FAANG или Большие минусы известных компаний

Reading time13 min
Views42K

Привет, Хабр! Заметил, что в сети достаточно много авторских и переводных материалов по темам «как попасть в FAANG», «как пройти собеседование в FAANG», «как подготовиться к собеседованию в FAANG» и т.д. У меня сложилось впечатление, что само попадание в FAANG стало целью многих инженеров.

С одной стороны мотивация понятная, ведь такая работа — это престиж и высокий доход. Но с другой стороны (по моему скромному мнению) — это и сделка с совестью, потому что технологические гиганты делают много такого, в сравнении с чем прошлогодняя попытка Rambler отнять NGNIX у Игоря Сысоева, поднявшая всё сообщество на уши, покажется невинной шалостью. Об этом сегодня и поговорим, пройдясь по грешкам этих корпораций.

Важный дисклеймер: данный пост не ставит себе целью опорочить данные компании (мне кажется, это невозможно) или повлиять на ваше стремление попасть в них (это решать только вам). Я не питаю неприязни ни к одной из компаний (даже после всего того, что они делают) и мне нравятся многие их продукты (но за Facebook Messenger кто-то точно будет гореть в аду). Воспринимайте мой пост как некое развернутое напоминание, что никакую компанию не стоит идеализировать (даже если очень хочется).

Читать далее

Дефицит специалистов не только в IT — он везде. Но денег не платят

Reading time17 min
Views200K

Когда мы писали про рост зарплат в IT, то выяснили, что они растут из-за дефицита специалистов и выравнивания значений по уровню западных зарплат. Но оказывается, что дефицит есть везде. Абсолютно везде. Не хватает учителей, врачей, строителей, металлургов, водителей, инженеров и даже курьеров. На рынке повальный дефицит специалистов, которым предлагают зарплаты на уровне Молдавии или Республики Косово.

Читать далее

«Рост зарплат в IT это плохо? Вы же шутите, да?»

Reading time16 min
Views86K

Недавно мы выпустили статью «Дефицит в IT: платите больше» о росте зарплат. Совпадение или нет, но чуть позже вышла статья о минусах большого заработка у российских айтишников. Автор рассуждал о том, как высокие зарплаты могут навредить IT-отрасли. На первый взгляд аргументы выглядят логично. Но это только на первый взгляд.

Читать далее

Дефицит в IT: платите больше

Reading time5 min
Views73K

Недавно мы опросили рекрутеров агентства GetIT о том, какие зарплаты хотят разработчики. Они выкатили нам большой список ожиданий, в зависимости от языков и направлений. Например, верхняя цифра в вилке ожидаемых зарплат для C#-разработчиков — 280 000. И она не самая большая: сеньоры в Android и Java-разработчке рассматривали ожидаемые зарплаты по 400 000. 

В подтверждение они дали нам исследования и статьи, подтверждающие цифры. И оказалось, что эти ожидания в рынке (а может даже и скромные): на рынке дефицит кадров, зарплаты только будут расти и сейчас самое время говорить о повышении.

Читать далее

Искусство войны ML инженера с FAANG

Reading time10 min
Views17K

Добрый вечер, дамы и господа. Я знаю, что статьи про собеседования в крупные IT-компании видели почти все, и у некоторых это уже вызывает непреодолимый приступ тошноты, но когда ты убиваешь порядочный кусок жизни на получение определенного навыка, тебе кажется, что смысл твоей жизни - поделиться этим опытом с другими. У написания этой статьи есть и вторая причина - я видел много разных статей про Frontend и Backend разработку, но никто никогда не писал про то, как проходят собеседования в IT гиганты для специалистов в области DataScience и Machine learning инженеров.

Всех, кто еще не уснул от скуки, прошу пожаловать под кат.

Читать далее

Зарплаты в Python за последние 10 лет

Reading time5 min
Views35K

2021 год — знаковый для Python: в рейтинге популярности TIOBE он занял первое место. Поэтому сегодня публикуем статистику зарплат разработчика на Python за последние 10 лет. Возьмём условного Python Middle в Москве с опытом от 1 до 3 лет, а ещё рассчитаем реальное изменение доходов с учётом кризисов в экономике, пока у нас начинается курс по Fullstack-разработке на Python. Интересно? Поехали.

Читать далее

Открытый курс машинного обучения. Тема 7. Обучение без учителя: PCA и кластеризация

Reading time19 min
Views212K

Привет всем! Приглашаем изучить седьмую тему нашего открытого курса машинного обучения!


Данное занятие мы посвятим методам обучения без учителя (unsupervised learning), в частности методу главных компонент (PCA — principal component analysis) и кластеризации. Вы узнаете, зачем снижать размерность в данных, как это делать и какие есть способы группирования схожих наблюдений в данных.


UPD 01.2022: С февраля 2022 г. ML-курс ODS на русском возрождается под руководством Петра Ермакова couatl. Для русскоязычной аудитории это предпочтительный вариант (c этими статьями на Хабре – в подкрепление), англоговорящим рекомендуется mlcourse.ai в режиме самостоятельного прохождения.


Видеозапись лекции по мотивам этой статьи в рамках второго запуска открытого курса (сентябрь-ноябрь 2017).

Читать дальше →

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity