Pull to refresh
61
0.5
Send message

Это телефонный разговор: как мы учили модели прогнозировать успех звонка из банка

Reading time9 min
Views3.1K

Кто-то гадает по звёздам и кофе, кто-то — по фото, а нам в ВТБ пришлось обучить модель предсказания по телефонным звонкам. А заодно пройтись по граблям обработки текстов и звука, выяснить, какие фичи можно извлечь из аудио, как привлечь ML и прикрутить к нему нейросеть, — и сделать всё на основе opensource. 

Меня зовут Алексей Климачев, и я data scientist ВТБ. В прошлом году банк доверил мне провести исследование аудиоданных для целей collection. Если вам интересно, чем может быть полезна правильно обученная модель, анализирующая звонки и прогнозирующая их исход, что использовать для её обучения, с какими сложностями можно столкнуться в процессе и как их обойти, заглядывайте в статью.

Читать далее
Total votes 7: ↑5 and ↓2+6
Comments3

Grafana+Zabbix: Визуализация работы производственной линии

Reading time6 min
Views73K

В этой статья я хочу поделиться опытом использования open source систем Zabbix и Grafana для визуализации работы производственных линий. Информация может быть полезна тем, кто ищет быстрый способ визуального отображения или аналитики собранных данных в проектах промышленной автоматизации или IoT. Статья не является подробным руководством, это скорее концепция системы мониторинга, основанная на открытом программном обеспечении для производственного предприятия.

Читать дальше →
Total votes 17: ↑17 and ↓0+17
Comments7

Новая блокировка OpenVPN и Wireguard замедляет интернет в России

Reading time3 min
Views161K

Позавчера, 15 января ночью, по всему Рунету пошли сигналы, что протоколы WireGuard/OpenVPN массово «отвалились». Судя по всему, с понедельника Роскомнадзор снова взялся за VPN, экспериментируя с блокировками OpenVPN и Wireguard в новом масштабе.

Мы в Xeovo заметили это по большому наплыву пользователей, которые вообще не знали что протоколы блокируются (где они были все это время). Уже учения были много раз, и мы предупреждали клиентов, но, видимо, OpenVPN и WireGuard до сих пор очень хорошо работали у всех. На настоящий момент блокировка продолжается. Возможно, тестируют, как все работает перед выборами. 

Читать далее
Total votes 118: ↑82 and ↓36+70
Comments379

Визуализация статистики о том, что и так все знают

Level of difficultyEasy
Reading time7 min
Views15K

Привет, Хабр! Меня зовут Тагир, я занимаюсь аналитикой игровых механик. Недавно я наткнулся на статью, в которой визуализировали жизни тысяч людей с точностью до минуты — люди отмечали, на что они тратят свое время в течение дня, а автор агрегрировал эти данные и сделал визуализацию, разбив активности по категориям. 

Я переложил эту логику на банковские транзакции, чтобы посмотреть, на что люди тратят свои деньги в определенный момент времени, и получил статистику, о которой все и так вроде бы знают. На обед люди ходят в ближайшее кафе и заправляют машину, после работы — в супермаркет, а на выходных — отдыхают в увеселительных заведениях. Но визуализировав эти данные, увидел, что выглядит это весьма залипательно.

Читать далее
Total votes 28: ↑27 and ↓1+28
Comments11

Гайд по Scratch для детей: как запустить игру на Android

Level of difficultyEasy
Reading time7 min
Views3.2K

Детское программирование стремительно набирает популярность. Многие школьники, интересующиеся видеоиграми, нередко задумываются о создании собственного виртуального мира. К счастью, сейчас для этого есть множество технических возможностей: в большинстве современных семей есть компьютеры, а дети идут в первый класс уже со смартфонами. 

Читать далее
Total votes 9: ↑9 and ↓0+9
Comments2

В открытом доступе бесплатно лекция о современном состоянии раздела о выносливости спортивной физиологии (рекламы НЕТ)

Reading time4 min
Views7.5K

Лекция, в которой есть ключевые моменты современной спортивной физиологии. Все бесплатно в открытом доступе, ничего не продается, рекламы нет.

Читать далее
Total votes 31: ↑20 and ↓11+9
Comments18

Попробуй спрячься: расширяем возможности обнаружения эксплуатации WinRM

Reading time9 min
Views5.8K

Идея написать блог о том, как злоумышленники используют для перемещения в инфраструктуре жертвы возможности службы Windows Remote Management (WinRM) (Т1021.006), возникла у Антона Величко, руководителя Лаборатории компьютерной криминалистики компании F.A.C.C.T., еще в январе 2022 года. И виной тому стали не затянувшиеся новогодние праздники и наличие свободного времени, как может показаться, а как раз наоборот. В тот момент криминалисты F.A.C.C.T. столкнулись с очередным «праздничным» всплеском кибератак на российские компании, и в процессе реагирования на инцидент у одного из наших клиентов обнаружили интересный кейс, о котором Антон Величко и его соавтор — Кирилл Полищук захотели подробно рассказать.

Читать далее
Rating0
Comments0

Жилье в Москве для здорового образа жизни

Level of difficultyMedium
Reading time12 min
Views1.8K

Группа Ленинград в их клипе про ЗОЖ преувеличивала последствия неумелого злоупотребления спортом в угоду зрелищности, но я согласен с ними что ко всему надо подходить с умом, без фанатизма. В Москве у меня есть друзья, которые покупают абонемент на фитнес и ходят туда не только первый и последний месяц его действия и не за пару недель до начала купального сезона.

Если вам важен спорт, то жить рядом с объектами спортивной инфраструктуры это не просто удобство, это основа здорового образа жизни.

Читать далее
Total votes 4: ↑2 and ↓2+1
Comments4

Dropout и Batch normalization

Level of difficultyEasy
Reading time8 min
Views7.4K


Привет, Хабр!

Dropout и Batch Normalization очень хороши в оптимизации процесса обучения и борьбе с одной из основных проблем ml — переобучением.
Читать дальше →
Total votes 34: ↑34 and ↓0+34
Comments4

Всё, что вам нужно знать про Windows Server 2016

Reading time2 min
Views56K
Всем, привет! У нас накопилось много русскоязычных материалов о Windows Server 2016, которыми хотелось бы с вами поделиться. К тому же, в начале месяца вышла русскоязычная версия книги «Введение в Windows Server 2016». Об этом, а также о других интересных статьях и видео по серверной тематике вы узнаете ниже.


Читать дальше →
Total votes 15: ↑13 and ↓2+11
Comments17

Выбор оборудования для корпоративного облачного хранилища

Reading time9 min
Views21K


Данные — основа любого бизнеса. Если место их хранения недостаточно надежно или неспособно обеспечить постоянный доступ, то под угрозой будет практически вся деятельность предприятия.

Конечно, можно и нужно обеспечивать сохранность и доступность информации правильным выбором серверного ПО и грамотной конфигурацией. Но не менее важно и железо — оборудование, которое хранит и обрабатывает данные. Если оно не соответствует потребностям компании, то никакой софт не сделает его достаточно надежным и отказоустойчивым.

В этой статье мы рассмотрим один из подходов к выбору железа для создания корпоративного облачного хранилища.
Читать дальше →
Total votes 16: ↑14 and ↓2+12
Comments9

NIC Teaming в Windows Server 2012

Reading time6 min
Views129K
С выходом Windows Server 2012 технология NIC Teaming стала штатным средством серверной операционной системы. Долгое время решения по объединению (группировке) сетевых адаптеров для платформы Windows предоставлялись только сторонними производителями, прежде всего, поставщиками оборудования. Теперь Windows Server 2012 содержит инструменты, которые позволяют группировать сетевые адаптеры, в том числе, адаптеры разных производителей.
Читать дальше →
Total votes 19: ↑14 and ↓5+9
Comments10

Распознавание русского жестового языка: распознаём до 3+ жестов в секунду на обычном ПК без видеокарты

Level of difficultyEasy
Reading time8 min
Views4.9K

Привет!

Меня зовут Максим Новопольцев, я техлид RnD команды Центра развития технологий AI во благо общества, Sber AI. Мы занимаемся проектами, направленными на решение важных социальных и экологических задач, таких как сохранение биоразнообразия, создание инклюзивной среды, прогнозирование климатических рисков.

В этой статье я расскажу как и зачем мы создавали модель распознавания русского жестового языка и покажу, что из этого получилось.

Сегодня в России нет достаточного количества специалистов-переводчиков русского жестового языка (РЖЯ), с помощью которого общаются люди с ограничением слуха. По данным Всероссийского общества глухих, нехватка специалистов в этой сфере в России - около 4 тыс.

А между тем, глухие или неговорящие - достаточно большая группа людей, которая посещает государственные учреждения, ходит в магазины, банки и пр. По данным ВОЗ, более 5% населения мира, или 430 миллионов человек, имеют проблемы со слухом, а к 2050 г. с этой проблемой столкнется каждый десятый, или более 700 миллионов человек.

Читать далее
Total votes 14: ↑13 and ↓1+16
Comments11

Анализ вакансий и портрет специалиста по качеству данных

Reading time9 min
Views2.2K

Собственно, сам портрет вы видите на КДПВ, а под катом найдете информацию о том, кто такой специалист по качеству данных, чем он занимается и что должен уметь по мнению работодателей. Для тех, у кого возникнет желание повторить анализ для других профессий, в статью добавлены некоторые подробности.

Читать далее
Total votes 3: ↑2 and ↓1+2
Comments2

Малоизвестные библиотеки Python для анализа данных, которые сделают вашу жизнь проще

Level of difficultyMedium
Reading time14 min
Views28K

Привет Хабр! В этой статье мы рассмотрим некоторые полезные библиотеки Python для задач обработки данных, с которыми, возможно, вы еще не знакомы. Хотя для задач машинного обучения на ум приходят такие библиотеки, как pandas, numpy, scikit-learn, keras, tensorflow, matplotlib и т.д., но всегда полезно знать о других предложениях Python, особенно если это поможет улучшить ваши проекты.

Читать далее
Total votes 18: ↑17 and ↓1+20
Comments4

Как мы определили веса алгоритмов ранжирования крупнейших маркетплейсов на открытых данных

Level of difficultyEasy
Reading time6 min
Views5.6K

Привет, Хабр! Меня зовут Владислав Абрамов, я аналитик в команде разработки компании Easy Commerce. Перед нами стояла задача создать алгоритм, который определяет влияние характеристик карточки товара на поисковую позицию в крупнейших российских маркетплейсах. Большинство из них не раскрывают принципы ранжирования — эту проблему нужно было решить с помощью анализа открытых данных. В этой статье расскажу, как мы прошли этот путь и проверили, что решение действительно работает. 

Читать далее
Total votes 11: ↑10 and ↓1+12
Comments7

Борьба с несбалансированными данными

Level of difficultyMedium
Reading time12 min
Views12K

Привет,Хабр!

Почему несбалансированные данные - это такая большая проблема? Все начинается с того, что в реальном мире классы могут быть не равномерно представлены в наших данных. Например, в задаче обнаружения мошенничества с кредитными картами, обычные транзакции будут составлять большую часть данных, в то время как мошеннические операции будут редкими. Если модель обучается на таких данных, она склонна к смещению в сторону более представленного класса, и это может привести к плохим результатам в реальном мире.

Борьба с несбалансированными данными - это не просто задача улучшения производительности моделей, это вопрос надежности и безопасности.

Что же делает борьбу с несбалансированными данными такой сложной задачей?

Читать далее
Total votes 12: ↑9 and ↓3+9
Comments2

У нас в Excel поселился замечательный Python

Level of difficultyMedium
Reading time5 min
Views44K

На Хабре уже была новость об этом знаменательном событии. Правда, она похожа на пересказ официального пресс-релиза Microsoft, но такой и должна быть "новость".

Читать далее
Total votes 28: ↑26 and ↓2+32
Comments65

Как получить полезную информацию из своих категориальных признаков?

Level of difficultyEasy
Reading time9 min
Views7.3K

В этой статье я выскажу свою точку зрения о том, что из себя представляют категориальные признаки. Расскажу про способы работы с ними, которыми пользуюсь сам как антифрод-аналитик в Каруне.

Читать далее
Total votes 10: ↑10 and ↓0+10
Comments5

Работа с временными рядами в Python. Часть 2

Level of difficultyEasy
Reading time10 min
Views12K


Добро пожаловать во вторую часть нашей серии статей "Работа с временными рядами в Python." В первой части, мы ознакомились с основами работы с временными рядами и научились анализировать и визуализировать их. Теперь мы переходим к более продвинутым аспектам этой увлекательной темы.
Читать дальше →
Total votes 19: ↑17 and ↓2+21
Comments3

Information

Rating
1,875-th
Date of birth
Registered
Activity

Specialization

Frontend Developer, Game Developer
Middle
From 1,100 €
JavaScript
HTML
SQL
.NET
PostgreSQL
Microsoft SQL Server
MySQL
C#
Python