Pull to refresh
4
0
Володя @NoobodyKms

User

Send message

Precision и recall. Как они соотносятся с порогом принятия решений?

Reading time3 min
Views35K

Недавно, постигая азы Машинного Обучения и изучая классификацию, я наткнулся на precision и recall. Диаграммки, которые часто вставляют, объясняя эти концепции, мне не помогли понять отличия между ними. Но чудо, я придумал объяснение, которое понятно мне, и я надеюсь, что оно поможет кому-нибудь из вас на пути изучения ML (возможно это объяснение кто-то придумал до меня) .

Перед тем как начинать, давайте представим горку песка, но в этом песке ещё есть песчаные камни, они ведь тоже являются песком, так? Также в этом песке есть некоторый мусор. Наша задача - просеять песок...

Читать далее
Total votes 4: ↑3 and ↓1+2
Comments2

Модель колебательного звена с применением символьного и численного решений дифференциального уравнения на SymPy и NumPy

Reading time5 min
Views8.2K

Задача


В статья использованы возможности пакета SymPy совместно с пакетом NumPy. Всё сводиться к преобразованию символьных выражений в функции способные работать с другими модулями Python.

Процесс решения дифференциальных уравнений становиться наглядным и хорошо контролируемым на каждом этапе вычислений. Следует отметить, что колебательное звено в разных интерпретациях обсуждается в сетях [1,2]. Например, в [3] приводиться модель колебательного звена с подробным исследованием переходных процессов.

Надеюсь, что подобные исследования колебательного звена на Python найдут своих сторонников.
Читать дальше →
Total votes 22: ↑16 and ↓6+10
Comments5

CPPN + музыка. Генерируем музыкальное видео

Reading time7 min
Views2.5K

Привет, Хабр. Мне не удалось найти русскоязычные статьи, посвященные генерации артов с помощью архитектуры CPPN, поэтому я сам расскажу о том, что можно с ней сделать. Это позволит скрасить пару вечеров и сгенерировать себе, например, обои на рабочий стол. А может и придумать что-нибудь серьезное. 

Лично я воспользовался такой архитектурой, чтобы сгенерировать абстрактное музыкальное видео на одну из своих композиций. Плюс добавил к нему ритмических пульсаций, о чем расскажу далее.

Читать далее
Total votes 7: ↑7 and ↓0+7
Comments0

Модельный риск: как увеличить эффективность работы ML моделей в большой компании

Level of difficultyEasy
Reading time7 min
Views2.4K

Привет, Хабр! В этой статье мы – Святослав Орешин и Александр Сахнов – попытались  разобрать достаточно специфичную для классического Data Science и критически важную для бизнеса тему – модельный риск или risk management для машинного обучения. 

Под катом говорим о том, как можно сделать машинное обучение в компании более эффективным, какие бывают риски у ML моделей и как на них реагировать, а также делимся своим опытом, как мы построили систему по модельному риску в X5 Tech – компании с сотнями ML моделей в production.

В современных компаниях машинное обучение используется повсеместно – начиная от предсказания ключевых для бизнеса показателей, до голосовых помощников на основе языковых моделей. При разработке и обучении новой модели обычно основное внимание уделяется данным, метриками, архитектуре и решаемой задачи, и только в редких случаях команда задумывается о поддержке и управлении моделями в будущем.

Читать далее
Total votes 3: ↑2 and ↓1+3
Comments0

Как выглядит техсобес в современном мире и нужно ли к нему готовиться?

Level of difficultyEasy
Reading time8 min
Views21K

Техническое собеседование - важный этап приема на рабочий проект. Мы поговорили с коллегами с рынка (как работающими в нашей компании, так и нет) и обсудили их последний опыт техсобесов, а также важный на наш взгляд вопрос - нужно ли к ним готовиться заранее. 

Спойлер - готовиться нужно. Все это делают по-своему, но мы наметили несколько общих подходов. Подробности под катом.

Читать далее
Total votes 15: ↑11 and ↓4+10
Comments22

Виртуальная клавиатура на Python+OpenCV

Level of difficultyMedium
Reading time5 min
Views7.4K

В данной статье разберемся, как написать виртуальную клавиатуру, используя Python+Opencv.

Идея заключается в создании виртуальной клавиатуры, выводе на экран и возможности ее использования. Подразумевается, что клавиатура будет работать с текстовыми редакторами. Для того, чтобы нажать на кнопку, нам потребуется кликнуть на нее, поэтому представим, что кликом будет служить соединение указательного и среднего пальцев. Теперь можно писать код.

Читать далее
Total votes 16: ↑16 and ↓0+16
Comments4

Революция от OpenAI — полный обзор: что означают последние анонсы для продуктовой разработки

Level of difficultyEasy
Reading time11 min
Views22K

Неделю назад я получил уведомление о начале трансляции первой разработческой конференции от OpenAI. Было неудобно смотреть эфир живьём, так что я уложил детей спать, и ночью, заварив себе какао, с предвкушением открыл YouTube.

Конечно, я к тому времени не выдержал и посмотрел краткие описания анонсов, так что был готов к тому, что увижу, но скажу честно: не смотря на презентацию в стиле студенческих конференций (на финальный слайд (под катом) вообще без слёз не взглянешь), чем дольше я слушал об анонсах, тем больше у меня отвисала челюсть.

Это не просто небольшие улучшения; это действительно скачок вперед. Я слушаю про увеличение длины контекста до 128К, обновлении данных до апреля текущего года, об интеграции в API интерпретатора, нового "рисователя" DALLE-3, анализ изображений, извлечение данных из массивов, безлимитных "ассистентов" и чуть ли не подпрыгиваю на стуле от оживления: решилось огромное количество проблем, которые до этого требовали человеко-месяцы доработки довольно квалифицированной командой.

Как только презентация подходит к концу, я судорожно открываю беклог и начинаю записывать и редактировать идеи. Я уверен, что перед разработчиками открыли действительно большие возможности, которые переопределят способ разработки и восприятия продуктов. И если тема AI вас как минимум интересует и вы ещё и занимаетесь продуктовой разработкой, а перепосченных по 150 раз новостей не хватает понять, что это значит лично для вас и команды, этот обзор будет весьма кстати.

Итак, что нового
Total votes 15: ↑13 and ↓2+13
Comments25

Прогнозирование временных рядов с помощью библиотеки Skforecast

Level of difficultyMedium
Reading time7 min
Views7.1K


В открытом доступе существует огромное число библиотек для построения моделей машинного обучения в Python. Самые популярные — scikit-learn, XGBoost, LightGBM, Catboost, PyTorch. Каждая из них позволяет построить регрессионную модель для прогнозирования на временных рядах, но для этого требуется преобразование данных и создание новых фичей (feature engineering).

Кроме того, временные ряды требуют своих подходов в оценивании моделей машинного обучения, так как стандартная кросс-валидация не подходит для временных данных. В этой статье мы (я + я) рассмотрим нюансы прогнозирования на практике и с помощью библиотеки skforecast.
Читать дальше →
Total votes 20: ↑20 and ↓0+20
Comments3

LangСhain: создаем свой AI в несколько строк

Level of difficultyMedium
Reading time6 min
Views41K

В этой данной статье познакомимся с LangChain, перспективным фреймворком для работы с языковыми моделями. С его помощью можно создать свой собственный аналог ChatGPT всего в несколько строк кода. Благодаря модульной структуре, LangChain позволяет быстро и легко разрабатывать AI приложения различной сложности.

Читать далее
Total votes 13: ↑13 and ↓0+13
Comments8

Как написать идеальный запрос для ChatGPT

Level of difficultyEasy
Reading time4 min
Views52K

Управление промтами – важный навык для работы с нейросетями. Однако иногда не знаешь, как лучше их прописать. В результате ответы, генерируемые чат-ботами, оказываются очень общими и неточными.

Я потратил много часов на различные курсы по промт-инжинирингу и постоянно тестировал различные структуры запросов, чтобы построить формулу, которая могла бы приблизить меня к качественным ответам.

В этой статье я расскажу о 6 основных элементах, из которых должен состоять качественный промт. Вы сами увидите, насколько существенной будет разница, если вы включите эти элементы в свой следующий запрос.

ChatGPT я пользовался через русифицированный сервис MashaGPT, который работает без VPN и виртуальных сим-карт. Все примеры взяты из него.

Читать далее
Total votes 17: ↑11 and ↓6+6
Comments8

Как использовать промты в ChatGPT для генерации кода на Python

Reading time2 min
Views39K

Привет, друзья! Сегодня я хочу рассказать вам о том, как использовать промты в ChatGPT для создания программного кода на Python. Если вы работаете с Python или интересуетесь программированием, то вы, наверняка, знаете, насколько важно уметь быстро и эффективно создавать код.

Для тех, кто не знаком с термином "промт", это специальные подсказки, обычно они выводятся в виде текста, который указывает правила для ответа ИИ.

Чатбот ChatGPT основан на искусственном интеллекте и способен генерировать текст на основе предыдущих входных данных, так же основан на copilot. Таким образом, мы можем использовать его для генерации промтов для создания кода на Python.

После множества экспериментов и ошибок, я нашел наиболее оптимальный промт для работы с ChatGPT, который позволяет мне полностью автоматизировать процесс разработки программы в соответствии с моим ТЗ. Сейчас я готов поделиться с вами своим опытом.

Читать далее
Total votes 11: ↑9 and ↓2+9
Comments41

Введение в data science: инструменты и методы анализа

Level of difficultyEasy
Reading time7 min
Views9K

Представьте, что вам предстоит собрать сложную головоломку, но вы не знаете, как будет выглядеть конечный результат. Наука о данных может помочь нам решить эту головоломку, используя специальные инструменты и методы, чтобы различные фрагменты, собранные вместе, имели смысл. 

Читать далее
Total votes 6: ↑4 and ↓2+2
Comments1

Малоизвестные библиотеки Python для анализа данных, которые сделают вашу жизнь проще

Level of difficultyMedium
Reading time14 min
Views27K

Привет Хабр! В этой статье мы рассмотрим некоторые полезные библиотеки Python для задач обработки данных, с которыми, возможно, вы еще не знакомы. Хотя для задач машинного обучения на ум приходят такие библиотеки, как pandas, numpy, scikit-learn, keras, tensorflow, matplotlib и т.д., но всегда полезно знать о других предложениях Python, особенно если это поможет улучшить ваши проекты.

Читать далее
Total votes 18: ↑17 and ↓1+20
Comments4

Как получить полезную информацию из своих категориальных признаков?

Level of difficultyEasy
Reading time9 min
Views6K

В этой статье я выскажу свою точку зрения о том, что из себя представляют категориальные признаки. Расскажу про способы работы с ними, которыми пользуюсь сам как антифрод-аналитик в Каруне.

Читать далее
Total votes 10: ↑10 and ↓0+10
Comments5

Как получить работу в области Data Science? 8 простых шагов

Level of difficultyEasy
Reading time10 min
Views16K

Перспективность и привлекательность карьеры в области Data Science привела к закономерному росту конкуренции. В условиях жесточайшей конкуренции между многочисленными кандидатами, стремящимися получить немногочисленные должности, выбор зачастую падает на тех, кто не только обладает всеми необходимыми навыками и опытом, но также способен эффективно коммуницировать. Сегодня мы поговорим с вами о требованиях к соискателям и действиях, которые можно предпринять, чтобы получить работу в области Data Science, представленных в виде восьми последовательных шагов.

Читать далее
Total votes 12: ↑9 and ↓3+8
Comments4

“Ну и долго мне ещё до магазина?” Или пара слов о геоинформационном анализе с помощью Python

Level of difficultyMedium
Reading time11 min
Views5.9K

Привет, хабр! Сегодня мы хотели бы продолжить тему обработки пространственных данных средствами Python библиотеки estaty. Мы уже рассказывали о том как можно Объединять открытые данные Open Street Map и Landsat для уточнения площадей зеленых зон вокруг объектов недвижимости.

Теперь же поговорим о более сложном анализе

Ну правда, долго?
Total votes 11: ↑10 and ↓1+10
Comments0

Что такое MLOps? Операции машинного обучения на пальцах

Reading time8 min
Views12K

В этой статье я расскажу вам об операциях машинного обучения (MLOps) — области, которую можно охарактеризовать как DevOps для машинного обучения.

Читать далее
Total votes 6: ↑6 and ↓0+6
Comments2

Как не разочароваться в программировании и не отчислиться после второго курса

Reading time9 min
Views54K

Предисловие: это гайд для старшеклассников, первокурсников и тех кто отчаялся в программировании и подумал, что это сложно и не для меня.

Здравствуй, Хабр! Это моя первая статья, не судите строго, надеюсь помогу кому-то своими наблюдениями и опытом. На своем жизненном пути через универ я повстречал немало людей, которые мало того, что отчисляются со специальностей, на которые они поступили, так еще и некоторые умудряются еле закончить злосчастные 4 курса, поступить в магистратуру и по итогу пойти работать в школу танцев (если речь шла не о танцевальном училище) или продавцом-консультантом в модные бутики и ловить с этого кайф. Я никого не осуждаю, каждый выбирает свой путь и свое место сам, но потраченных лет уже не вернуть. И речь идет не только про айти специальности, но говорить мы будем сегодня именно про них.

Читать далее
Total votes 42: ↑19 and ↓23+2
Comments148

Считаем медиану быстрее numpy

Level of difficultyEasy
Reading time18 min
Views5.7K

Нетрадиционный способ вычисления медианы массива значений с плавающей точкой при помощи нескольких проходов по исходному массиву по словам, начиная с более значащих, с использованием целочисленной арифметики, что даёт возможность в некоторых случаях несколько обогнать по скорости "традиционные" классические алгоритмы.

Читать далее
Total votes 13: ↑13 and ↓0+13
Comments18

Прогнозирование нагрузки солнечных электростанций

Reading time7 min
Views2.3K

Прогнозируем нагрузку группы солнечных электростанций на сутки вперед с помощью машинного обучения. Сравниваем два метода — Random Forest и LSTM.

Читать далее
Total votes 3: ↑3 and ↓0+3
Comments1

Information

Rating
Does not participate
Location
Одинцово, Москва и Московская обл., Россия
Date of birth
Registered
Activity

Specialization

Systems Analyst, Data Scientist
Junior
From 100,000 ₽
Python
English
Pandas
TENSORFLOW
Pytorch
NumPy
Computer vision
Machine learning
Neural networks