Articles / Profile of art

Артем@art_pro

Пользователь

ProfileArticles12PostsNewsComments42

@art_pro Jul 11 at 14:21

Fast & Furious: оценка ошибок измерений в футбольной аналитике. Часть 2

9 min

Artificial IntelligenceMachine learning * Video equipmentWorking with video *

Привет! В предыдущей статье про аналитику футбольных матчей я рассказал вам о нашем пайплайне в целом и тонкостях сглаживания, а также о нескольких упражнениях для игроков, которые помогают нам моделировать реальные ситуации.

В этой же части, как и обещал ранее, будет рассказ про упражнение «2*2» (проверяем, сможет ли трекинговая система нормально отслеживать игроков в условиях резких перемещениях в ограниченной локации), синтетические тесты и выводы.

Давайте по порядку.

В качестве вступления, несколько основных моментов из первой части:

Определение скорости возможно только с определенной погрешностью. Точность этой оценки важна как при выявлении превышения скоростного режима на дорогах, так и при анализе спортивных результатов, где даже небольшие ошибки могут повлиять на выводы.

Положение футболиста на поле можно определять различными способами.

Для этого используются:

@art_pro Jul 9 at 11:44

Need for speed: оценка ошибок измерений в футбольной аналитике. Часть 1

Medium

11 min

Working with video * Programming * Artificial IntelligenceMachine learning *

Case

Привет! Меня зовут Артем, и я занимаюсь разработкой систем компьютерного зрения в сервисе Яндекс Спорттех. Среди основных задач нашей команды — футбольная аналитика и работа со статистическими данными.

Яндекс Спорттех обеспечил интеграцию технологических решений в РПЛ — все стадионы участников чемпионата были оборудованы камерами 6К, для клубов организована передача в режиме онлайн фитнес-данных и продвинутых данных на стыке технико-тактических действий. С помощью современных методов компьютерного зрения мы осуществляем детекцию игроков и мяча, ведём их трекинг, а также вычисляем различные ключевые спортивные метрики — пройденные дистанции, максимальные скорости, спринты и рывки, а также экстренные торможения и другие фитнес-показатели, важные как для аналитиков, так и для тренеров и поклонников игры.

В этих двух статьях мы подробно рассмотрим, почему точное измерение скорости движения и пройденной дистанции игроков критически важно для качественного анализа футбольных матчей. Расскажем, почему любые систематические ошибки и неточности могут весьма существенно исказить выводы и рекомендации для тренерского штаба и аналитиков.

А ещё поделимся нашим опытом, расскажем о типичных источниках ошибок, возникающих при расчёте скорости и пробега, и опишем подходы, которые позволяют уменьшить их влияние.

+12

@art_pro Jun 15 2021 at 07:02

ТОП-10 трендов в сфере данных и аналитики 2021. Версия Gartner

8 min

11K

ГК ЛАНИТ corporate blogMachine learning * Artificial IntelligenceBig Data *

Translation

Оракул технологического мира Gartner регулярно и охотно делится с обществом своими наблюдениями относительно текущих трендов. Эксперты компании составили подборку из 10 трендов в сфере данных и аналитики, которые стоит учитывать ИТ-лидерам в 2021 году – от искусственного интеллекта до малых данных и применения графовых технологий.

Материал Gartner является отличной пищей к размышлению, а в некоторых случаях он может сыграть важную роль при принятии стратегических решений. Для того, чтобы оставаться в курсе основных трендов и в то же время не тратить ресурсы на собственный анализ, уберечься от ошибок субъективного мнения, удобно пользоваться предоставленным отчетом, перевод которого и предлагается в этой статье.

Источник

Читать дальше →

+48

@art_pro Apr 13 2021 at 07:01

Неявные нейронные представления с периодическими функциями активации

12 min

ГК ЛАНИТ corporate blogMachine learning * Artificial IntelligenceAlgorithms * Data Mining *

Знакомые с нейронными сетями читатели скорее всего слышали про термин «функция активации». Такие варианты функции активации, как сигмоида, гиперболический тангенс (TanH) и ReLU (линейный выпрямитель), активно применяются в нейронных сетях и широко известны энтузиастам, занимающимся экспериментами с нейронными архитектурами. Исследователи нейронных сетей не останавливаются на достигнутом и подбирают альтернативы, позволяющие расширить границы возможностей. Один из вариантов подхода, предложенного в 2020 году, показывает выдающиеся результаты по сравнению с классическими функциями активации. Про впечатляющие отличия и пойдет речь в этой статье: на основе материала Vincent Sitzmann, Julien N. P. Martel, Alexander Bergman, David B. Lindell, Gordon Wetzstein и кода на нескольких наглядных примерах будет продемонстрировано превосходство нового метода.

+34

@art_pro Nov 24 2020 at 07:02

Назад в Будущее: какие подходы NLP будут востребованы на NIPS 2020

6 min

2.7K

ГК ЛАНИТ corporate blogConferencesReading room

Translation

Стремительно и неотвратимо приближается ключевое событие года в области Data Science: конференция NIPS 2020, запланированная на 6-12 декабря 2020. Традиционно на самом масштабном событии года будут представлены значимые результаты, свежие идеи и перспективные подходы в различных областях Data Science, в том числе и в области математической обработки и понимания естественного языка. Каждому специалисту хочется если и не предложить новаторскую идею, то оказаться ранним последователем той идеи, которая «выстрелит», и не хочется попасть в хвост отстающих скептиков, которым приходится догонять и осваивать уже признанную большинством методику.

Полезным подходом для обнаружения перспективных идей на ранней стадии является мониторинг динамики в докладах на различных конференциях в течение года. С этой целью для сообщества Хабр был выполнен этот обзор самых ярких докладов в области NLP c конференции ICLR 2020, сделанный на основе перевода статьи Kamil Kaczmarek. Мы вернемся на несколько месяцев в Прошлое, чтобы затем на NIPS 2020 заглянуть в Будущее развития технологий по работе с текстами.

Если вам интересна тема NLP, вы хотите легко находить общий язык с моделями, непринужденно общаться с ~~девушками на улице~~ передовыми специалистами и не отстать от быстрого движения современного мира, то вам может помочь эта статья. Поехали!

Источник

Читать дальше →

+22

@art_pro Sep 22 2020 at 07:04

Лучшие инструменты с открытым исходным кодом и библиотеки для Deep Learning — ICLR 2020 Experience

13 min

11K

ГК ЛАНИТ corporate blogMachine learning * Python * Data Mining * Big Data *

Translation

Сложно найти на Хабре человека, который не слышал бы про нейронные сети. Регулярные новости о свежих достижениях нейронных сетей заставляют удивляться широкую публику, а также привлекают новых энтузиастов и исследователей. Привлеченный поток специалистов способствует не только еще большим успехам нейронных моделей, но и приводит к развитию инструментов для более удобного использования Deep Learning подходов. Помимо всем известных фреймворков Tensorflow и PyTorch активно развиваются и другие библиотеки, нередко более гибкие, но менее известные.

Эта статья является переводом одного из постов neptune.ai и освещает самые интересные инструменты для глубокого обучения, представленные на конференции по машинному обучения ICLR 2020.

Читать дальше →

+30

@art_pro Jun 22 2020 at 07:01

В поисках обеда: распознавание активности по данным фитнес-трекера

10 min

5.2K

ГК ЛАНИТ corporate blogMachine learning * Data Mining * Data Engineering * Big Data *

Мне посчастливилось участвовать в проекте SOLUT, который стартовал в ЛАНИТ около года назад. Проект развивается благодаря активному участию Центра компетенции больших данных ЛАНИТ (ЦК Дата), и главное технологическое новшество проекта заключается в использовании машинного обучения для мониторинга человеческой активности. Основным источником данных для нас являются сенсоры фитнес-трекеров, закрепленные на руках работников. В первую очередь, результаты распознавания помогают поднять производительность труда и оптимизировать производственные процессы на стройке. Также анализ поведения рабочих позволяет отслеживать самочувствие человека, соблюдение техники безопасности и напоминает строителям про обед.

Источник

Читать дальше →

+45

@art_pro Nov 26 2019 at 08:04

8 лучших трендов International Conference on Learning Representations (ICLR) 2019

13 min

4.4K

ГК ЛАНИТ corporate blogAlgorithms * Artificial IntelligenceMachine learning *

Translation

Тема анализа данных и Data Science в наши дни развивается с поразительной скоростью. Для того, чтобы понимать актуальность своих методов и подходов, необходимо быть в курсе работ коллег, и именно на конференциях удается получить информацию о трендах современности. К сожалению, не все мероприятия можно посетить, поэтому статьи о прошедших конференциях представляют интерес для специалистов, не нашедших времени и возможности для личного присутствия. Мы рады представить вам перевод статьи Чип Хен (Chip Huyen) о конференции ICLR 2019, посвященной передовым веяниям и подходам в области Data Science.

Читать дальше →

+51

@art_pro Aug 13 2019 at 08:01

Natural Language Processing онлайн-чеков: курс уроков волшебства для обычного кота и другие проблемы

10 min

ГК ЛАНИТ corporate blogMachine learning * Artificial IntelligenceThe future is here

Компания CleverDATA занимается разработкой платформы для работы с большими данными. В частности, на нашей платформе есть возможность работать с информацией из чеков онлайн-покупок. Перед нами стояла задача научиться обрабатывать текстовые данные чеков и строить на них выводы о потребителях для создания соответствующих характеристик на бирже данных. Было естественно для решения этой задачи обратиться к машинному обучению. В этой статье мы хотим рассказать про проблемы, с которыми встретились при классификации текстов онлайн-чеков.

Источник

Читать дальше →

+61

@art_pro Jun 25 2019 at 08:02

Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение

9 min

27K

ГК ЛАНИТ corporate blogThe future is hereArtificial IntelligenceMachine learning *

Translation

Представляю вашему вниманию перевод статьи «Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение» о том, как искусственный интеллект применяется для создания музыки. Автор не использует нейронные сети для генерации музыки, а подходит к задаче, исходя из знания теории музыки, на основе мелодии и гармонии. Другой особенностью статьи является метод сравнения музыкальных произведений на основе матриц самоподобия. Такой подход, конечно, не является исчерпывающим, но он полезен как промежуточный шаг для генерации качественной музыки методами машинного обучения.

+65

@art_pro May 15 2018 at 08:01

Женские сети: кто делает за нас выбор?

10 min

27K

ГК ЛАНИТ corporate blogMachine learning * Data Mining * Big Data *

Взлет интереса к машинному обучению во многом связан с тем, что модели способны дать ощутимый прирост прибыли в областях, связанных с предсказанием поведения сложных систем. В частности, той сложной системой, чье поведение предсказывать выгодно, является человек. Обнаружить мошенничество на ранней стадии, выявить склонность клиентов к оттоку – эти задачи возникают регулярно и уже стали классическими в Data Science. Безусловно, их можно решать различными методами, в зависимости от пристрастий конкретного специалиста и от требований бизнеса.

У нас была возможность использовать нейронные сети для решения задачи по предсказанию поведения людей, а специфика области применения была связана с индустрией красоты. Основной аудиторией для “опытов” стали женщины. Мы по сути пришли к вопросу: может ли искусственная нейронная сеть понять настоящую нейронную сеть (человека) в той области, в которой даже сам человек еще не осознал своего поведения. Как мы ответили на этот вопрос и что у нас получилось в итоге, можно узнать далее.

Читать дальше →

+47

@art_pro May 31 2017 at 11:00

О чем говорят женщины? (Text mining of beauty blogs)

13 min

33K

ГК ЛАНИТ corporate blogBig Data * Data Mining * Data visualization *

В руках нашей команды из CleverDATA оказался уникальный материал – около 100 тыс. страниц англоязычных блогов, посвященных бьюти-сфере. Этот корпус к нам попал благодаря желанию одной косметической корпорации узнать законы, по которым «работает» блогосфера. Компания хотела эффективнее взаимодействовать с бьюти-блогерами – получать больший рекламный эффект, отдавая свои продукты в добрые руки лояльных авторов.

Источник

Читать дальше →

+45