Статьи / Закладки / Профиль fralik / Хабр

Vadim Frolov @fralik

Data Scientist

Профиль Публикации 11Комментарии 148Закладки 833

OLZ1 26 сен в 20:01

Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Начало

20 мин

583

Машинное обучение*

Туториал

В первой главе исследования был описан набор данных с временными рядами о погоде, который мы будем использовать для выполнения задачи прогнозирования температуры, а также были приведены шаги по его предварительной подготовке.

В данной главе мы рассмотрим процессы авторегрессии-проинтегрированного скользящего среднего по методологии АРПСС (в англоязычной терминологии - ARIMA). Разберёмся, почему процесс АРПСС позволяет получить широкий класс стационарных и нестационарных моделей, которые адекватно описывают многие встречающиеся на практике временные ряды. А затем применим эту методологию с целью нахождения подходящего подкласса моделей из общего семейства моделей АРПСС для адекватного прогнозирования будущих значений температуры.

hukenovs 29 авг в 13:13

Рецепт идеальной разметки в Computer Vision

Средний

11 мин

2.2K

Блог компании Конференции Олега Бунина (Онтико)Блог компании SberDevicesData Mining*Обработка изображений*Машинное обучение*

Туториал

За два года команда RnD CV из SberDevices выложила в открытый доступ три датасета для задач компьютерного зрения: HaGRID, EasyPortrait и Slovo. Чтобы достичь максимальной точности обработки данных, полученных с краудсорсинговых платформ, мы применили методы агрегации, которые позже объединили в фреймворк.

Привет, Хабр! На связи Карина Кванчиани и Александр Капитанов из SberDevices. В этой статье мы расскажем о фреймворке агрегации разметки данных, который использует наша команда и коллеги из других подразделений. AggregateMe помогает привести несколько разметок к одной и повысить её качество в случае, если исполнители где-то ошиблись. Скоро фреймворк появится в открытом доступе, а здесь расскажем, как он работает.

+17

yadro_team 17 июл в 14:00

Открытый онлайн-курс по цифровой схемотехнике: от истоков до первого устройства

Простой

4 мин

16K

Блог компании YADROСхемотехника*Электроника для начинающих

Привет, Хабр! У нас новости. Мы запустили онлайн-курс по цифровой схемотехнике для начинающих. Он подойдет всем, кому интересно собрать из простых компонентов готовое устройство на макетной плате и узнать больше о «внутренностях» электроники. Присоединяйтесь сами или рассмотрите курс для совместного досуга с ребенком, младшим братом или сестрой. Возможно, кому-то он поможет не только найти новое занимательное хобби, но и определиться с будущей профессией.

Всего в курсе 11 практических роликов с подробными теоретическими материалами к каждому. Будем не просто смотреть на картинки с электрическими схемами, а проводить эксперименты своими руками. Начнем с истоков: познакомимся с оборудованием и линейными электронными компонентами, а закончим сборкой секундомера с применением микросхем цифровой логики. Все подробности — на странице курса и под катом.

+72

yorko 16 июл в 12:11

В 48 собесах от оффера в Гугл

Средний

21 мин

15K

Блог компании Open Data ScienceData Mining*Машинное обучение*Карьера в IT-индустрииNatural Language Processing*

Обзор

Здравствуй, хабр! Что-то я давно не писал, отбился от рук, а ведь когда-то мы целый курс машинного обучения на Хабре вели. Расскажу про свой недавний заход по собесам, что спрашивали, какие выводы сделал. Контекст: Applied Machine Learning science (в том числе этот ваш Generative AI), Нидерланды, уровень синьор+. Я долго получал отказы, старался не унывать и в конце таки нашил лычку Staff GenAI Field Solutions Architect в Google Cloud. Тут поделюсь статистикой собесов, полезными ресурсами и, конечно, всякими советами.

+66

wwakabobik 31 окт 2023 в 11:34

Вы что, хотите как в 90-ые?! Страшно?

Простой

56 мин

6.9K

История ITИгры и игровые консоли

Ретроспектива

Грядёт Хэллуин, ночь ужаса и кошмаров! То время, когда призраки прошлого прорываются в наш мир, и живые завидуют мёртвым! Поэтому для вас я решил успеть поднять мертвечину и написать эту статью.

В этом посте я расскажу о 31 страшной игре для PC из 90-х, которые оставили ужасные шрамы восторга и кошмара на моей душе. Это игры, которые заставили меня вздрогнуть от страха и приковали к экрану на долгие часы. Конечно, не во все я играл (да и не мог из-за языкового барьера и отсутствия их на дискетах и дисках у меня), с половиной я познакомился много позже, но всё-таки ужасы тех времён - не просто тайтлы - это то знакомое ощущение, которые было в тёплое "тогда" детства. Я хочу, чтобы вы почувствовали то же волнение и трепет, которое я испытывал, играя в эти игры. Так что закройте все двери и окна, выключите свет, наденьте наушники и погрузитесь в мир ужаса и кошмаров в эту ночь.

=!= ВНИМАНИЕ =!=
Всё, что описано в статье далее строго 18+ и не рекомендуется для беременных детей, пожилых комсомольцев и высокоморальных борцов с несправедливыми пикселями.
=!= Я вас предупредил. Назад пути нет =!=

Сладость или гадость?!

+14

Cloud4Y 11 окт 2023 в 14:49

Как вырастить солёную пирамидку

11 мин

46K

Блог компании Cloud4YХимияDIY или Сделай самНаучно-популярное

Туториал

Перевод

Да кому нужна эта обычная скучная соль? Превращаем мелкие белые крупинки в потрясающие пирамидальные кристаллы в домашних условиях.

+226

YuriPanchul 6 фев 2023 в 11:46

Стартуем на ПЛИС, но сначала припаяем его с конструктором беспилотного автомобиля Zoox

13 мин

15K

FPGA*Программирование микроконтроллеров*Производство и разработка электроники*DIY или Сделай самЭлектроника для начинающих

Туториал

Однажды мне не спалось ночью и я залип на сайтах про паяльники. Возникло желание купить и сразу появились вопросы: на сколько ватт? Не больше 30? А почему большинство на 60-80 ватт? 60/40 олово свинец? А почему куча паяльных станций идут в комплекте с lead-free проводами припоя? Канифоль сейчас внутри проводов? А почему есть и провода припоя без канифоли? Бронзовую мочалку для очистки? А почему столько комплектов с и белой и бронзовой?

Вспомнил и повод, чтобы научиться паять. Когда-то Руслан Тихонов, руководитель кружка из Москвы, говорил мне что хочет сделать простые упражнения на платах ПЛИС для школьников. Как часть триады "микросхемы малой степени интеграции - ПЛИС - Ардуино". По этому поводу я купил самую дешевую плату с CPLD Altera MAX II (ныне это Intel FPGA), но обнаружил что у нее не припаян переходник.

Я выставил вопросы по паяльники на фейсбук и после оживленной дискуссии мой приятель Денис Никитин вызвался научить меня паять как полагается. Денис работает проектировщиком печатных плат в компании Zoox, ныне часть компании Amazon. Zoox делает беспилотные автомобили, то есть Денис на передовом рубеже паятельного прогресса. Я заснял мастер-класс от Дениса на видео:

+32

artemmarchenko 27 апр 2021 в 11:46

Как выбрать уровень статистической значимости для AB-теста и как интерпретировать результат

10 мин

15K

Тестирование веб-сервисов*Управление продуктом*Статистика в IT

AB-тесты сейчас применяет, возможно, каждый второй менеджер продукта, однако далеко не всегда ясно, как же интерпретировать результат теста и какой уровень статистической значимости использовать. Используем слишком высокий - тесты возможных улучшений будут проваливаться, хотя улучшения на самом деле есть. Используем слишком низкий - часто будем получать "подтверждения" ложных улучшений.

Независимо от выбранного уровня значимости, принимая решения по результатам AB-тестов, время от времени мы будем ошибаться и наносить ущерб бизнесу. Выбирая уровень статистической значимости тестов (или что то же самое - граничные p-value), мы можем ограничить количество ошибок и балансировать между пользой от оправданно успешных экспериментов и ущербом от ошибочно успешных.

jularina 23 мая 2021 в 14:41

Мир статистических гипотез

5 мин

26K

Статистика в IT

Из песочницы

В современном мире мы обладаем все большим и большим объемом данных о событиях, происходящих вокруг. Зачастую у нас появляются вопросы, на которые хотелось бы быстро ответить на основе имеющейся информации, для этого как нельзя лучше подходит процесс, связанный с проверкой статистических гипотез. Однако, многие считают, что это занятие подразумевает под собой большое число вычислений и в принципе довольно сложно для понимания. На самом деле, алгоритм проверки гипотез достаточно прост, а для осуществления расчетов с каждым годом появляется все больше и больше готовых инструментальных средств, не требующих от человека глубоких познаний в области. Далее я попытаюсь показать, что мало того, что процесс проверки гипотез может быть полезным, так и осуществляется достаточно быстро и без серьезных усилий.

itmai 18 фев 2021 в 17:54

Компьютерное зрение в промышленной дефектоскопии: Часть 2 “Генерируем стремные трубы чтобы порадовать нейронку”

13 мин

4.7K

Блог компании IT-центр МАИРабота с 3D-графикой*Машинное обучение*

Туториал

В предыдущей заметке мы рассказали о том, как мы решали задачу из области промышленной дефектоскопии методами современного машинного зрения. В частности, мы упомянули, что одним из подходов к обогащению данных обучающей выборки является генератор синтетических данных. В этой заметке мы расскажем:

как сделали такой генератор на основе Blender и Python,
какие типы масок для задач компьютерного зрения вообще можно получить в Blender.

Читать дальше →

MaxRokatansky 2 фев 2021 в 16:49

Не используйте фикстуры в Cypress и юнит-тесты — используйте фабричные функции

7 мин

Блог компании OTUSТестирование IT-систем*JavaScript*

Перевод

Юнит-тесты — это здорово… когда они надежно работают! На самом деле, есть старая поговорка, что «плохой тест — это хуже, чем вообще никакой тест». Я могу подтвердить, что недели, проведенные в погоне за случайно «ложным отрицательным» тестом, не эффективны. Вместо этого можно было использовать это время для написания рабочего кода, который поможет пользователю.

Так что поговорим об одной из этих простейших методик написания менее нестабильных тестов: тестирование фабричных данных.

Тестирование фабричных данных

MihailAndreev 23 июл 2020 в 15:00

Что такое опционы и кому это нужно. Ликбез для гика, ч. 6

17 мин

53K

Блог компании Технологический Центр Дойче БанкаНаучно-популярноеФинансы в ITЧитальный зал

Меня зовут Михаил Андреев, я разработчик в нашем подразделении FX Derivatives Desk (на сленге отрасли позиция называется Quant Developer). В этом посте расскажу про опционы и все что с ними связано.

Эти инструменты не так близки простому обывателю, как, например, банковский вклад, но для современных финансовых рынков они важны. И их периодически обсуждают в неспециализированных СМИ, и я думаю, что составить общее представление об опционах и том, как с ними работают финансовые компании, полезно.

Кроме этого, эта тема связана с интересной математикой, вычислительными методами и разработкой программных систем — всё как мы любим.

Читать дальше →

+21

skillfactory_school 5 окт 2020 в 15:54

7 бесплатных книг, которые следует прочитать каждому дата-сайентисту

4 мин

14K

Блог компании SkillfactoryУчебный процесс в ITМашинное обучение*Python*Data Engineering*

Перевод

Самообразование — пожалуй, один из самых сложных путей и процессов для взрослого человека. Когда вокруг столько отвлекающих факторов, уже трудно заставить себя довести дело до конца (особенно если мотивация неочевидна). Но самообразование как эволюция — это неотъемлемый элемент жизни любого профессионала или того, кто хочет им стать. Книги в этом случае могут стать тем самым выстрелом, которым убиваются два зайца, вы и растете как специалист, и не «выпадаете из жизни». Автор материала подобрал 7 бесплатных электронных книг, которые помогут вам изучать Data Science и ML.

Читать дальше →

+18

art_pro 22 сен 2020 в 10:04

Лучшие инструменты с открытым исходным кодом и библиотеки для Deep Learning — ICLR 2020 Experience

13 мин

9.6K

Блог компании ГК ЛАНИТМашинное обучение*Python*Data Mining*Big Data*

Перевод

Сложно найти на Хабре человека, который не слышал бы про нейронные сети. Регулярные новости о свежих достижениях нейронных сетей заставляют удивляться широкую публику, а также привлекают новых энтузиастов и исследователей. Привлеченный поток специалистов способствует не только еще большим успехам нейронных моделей, но и приводит к развитию инструментов для более удобного использования Deep Learning подходов. Помимо всем известных фреймворков Tensorflow и PyTorch активно развиваются и другие библиотеки, нередко более гибкие, но менее известные.

Эта статья является переводом одного из постов neptune.ai и освещает самые интересные инструменты для глубокого обучения, представленные на конференции по машинному обучения ICLR 2020.

Читать дальше →

+33

d_krylov 18 авг 2020 в 18:16

Прокачиваем разметку мультимодальных данных: меньше асессоров, больше слоёв

17 мин

4.7K

Блог компании VKПрограммирование*Машинное обучение*Искусственный интеллект

Всем привет! Мы — учёные лаборатории «Машинное обучение» ИТМО и команда Core ML ВКонтакте — проводим совместные исследования. Одна из важных задач VK заключается в автоматической классификации постов: она необходима не только чтобы формировать тематические ленты, но и определять нежелательный контент. Для такой обработки записей привлекаются асессоры. При этом стоимость их работы можно значительно снизить с помощью такой парадигмы machine learning, как активное обучение.

Именно о его применении для классификации мультимодальных данных и пойдёт речь в этой статье. Мы расскажем про общие принципы и методы активного обучения, особенности их применения к задаче, а также инсайты, полученные в ходе исследования.

Читать дальше →

+10

Kircore 10 авг 2020 в 06:12

Анализ данных из последнего слива Intel

48 мин

36K

Data Mining*Информационная безопасность*Производство и разработка электроники*

Я порылся в 20 гигабайтах слитых данных с незащищённого CDN интела в поисках интересного и оценки серьёзности этой утечки.

КДПВ. Прототип ноутбука на Tiger Lake.

Краткое резюме

Большая часть слитой информации предназначена для OEM/ODM разработчиков и производителей, но заинтересует энтузиастов, исследующих BIOS и недокументированные режимы работы процессоров Intel. В них нет внутренней интеловской документации, критичной к обнародованию, или способной раскрыть секретные разработки. Также здесь не найти информации о неизвестных ранее уязвимостях.

Читать дальше →

+61

AbellAI 9 авг 2020 в 23:54

Как работает Object Tracking на YOLO и DeepSort

12 мин

81K

Искусственный интеллектМатематика*Машинное обучение*

Object Tracking — очень интересное направление, которое изучается и эволюционирует не первый десяток лет. Сейчас многие разработки в этой области построены на глубоком обучении, которое имеет преимущество над стандартными алгоритмами, так как нейронные сети могут аппроксимировать функции зачастую лучше.

Но как именно работает Object Tracking? Есть множество Deep Learning решений для этой задачи, и сегодня я хочу рассказать о распространенном решении и о математике, которая стоит за ним.

Итак, в этой статье я попробую простыми словами и формулами рассказать про:

YOLO — отличный object detector
Фильтры Калмана
Расстояние Махаланобиса
Deep SORT

Читать дальше →

+14

NeverWalkAloner 4 авг 2020 в 07:40

Пишем веб сервис на Python с помощью FastAPI

17 мин

120K

Python*Программирование*

Знаю, знаю, наверное вы сейчас думаете «что, опять?!».

Да, на Хабре уже неоднократно писали о фреймворке FastAPI. Но я предлагаю рассмотреть этот инструмент немного подробнее и написать API своего собственного мини Хабра без кармы и рейтингов, зато ~~с блэкджеком и~~ с тестами, аутентификацией, миграциями и асинхронной работой с БД.

Читать дальше →

+22

dsor 5 апр 2020 в 14:44

Сим-сим откройся или реверс инжиниринг умного домофона

3 мин

9.3K

Информационная безопасность*Программирование*Реверс-инжиниринг*

Из песочницы

После прочтения поста Krupnikas возникла мысль разобраться с mitmproxy и посмотреть как устроен бэкенд ежедневно используемых мобильных приложений. Выбор пал на приложение домофон. После авторизации оно позволяет открывать двери и отвечать на видеозвонки. Что из этого вышло и какие дырки мне удалось найти расскажу под катом.

Читать дальше →

+21

barbalion 31 июл 2020 в 21:18

«Просто похудеть» — непросто

15 мин

126K

Здоровье

Интернет наводнен статьями о том, как похудеть "просто съедая меньше чем потратил" и отчетами об успешном опыте некоторых везунчиков. Чего нету (ну или очень мало) в интернете — это отчетов о том, как миллионы людей безрезультатно пытаются просто "съесть меньше", садясь на все новомодные диеты и неизменно возвращаясь к тому, с чего начинали, а иногда и скатываясь по шкале индекса массы тела в еще более красную зону.

В этой статье я постараюсь описать наиболее частые причины неудач и дать некоторые лайфхаки, который позволят обмануть свой мозг и наконец достигнуть своего так желаемого целевого веса.

Хакнуть свой мозг

+166

638

2 3 ...

41 42