Как стать автором
Обновить
0
0
Молдабеков Ильяс @ilyantos

Аналитик баз данных

Отправить сообщение

Демократизация данных в убере

Время на прочтение2 мин
Количество просмотров2.6K

Всем привет!


Под хеллоувин я побывал на конференции в Будапеште (Data Crunch) и послушал там ряд интересных докладов. Один из них был от Uber, которые рассказывали о том, на каких подходах они организовали свою платформу управления данными. Этот доклад был не столько технический, сколько менеджерский и продуктовый.


Uber обширно используется данные, которые собирает в результате взаимодействия с пассажирами и водителями. Они рассчитывают стоимость поездки, оценивают потоки людей, меняют алгоритмы цены, дают рекомендации водителям, как им больше заработать и все это основываясь на собранных данных. В такой компании вся работа с данными не может быть сконцентрирована в руках группы аналитиков и DS, т.к. иначе придется нанять их слишком много, да к тому же они не всегда погружены в бизнес контекст.

Читать дальше →
Всего голосов 14: ↑10 и ↓4+6
Комментарии4

Лингвистический Epic fail, или Как запихнуть весь словарь русского языка в Power BI

Время на прочтение7 мин
Количество просмотров9.1K
image

Как-то, решая проблему лингвистического анализа в Power BI и заодно подыскивая примеры для моей предыдущей статьи, я вспомнил о задаче, которую пытался решить в Excel ещё несколько лет назад: нужно было внедрить в аналитическую систему словарь русского языка для лингвистического анализа большого количества запросов на естественном языке. Причём желательно было использовать стандартные офисные инструменты. Подавляющее большинство людей сразу взялись бы решать эту задачу в Excel, и я когда-то пошёл по тому же пути. В качестве словаря использовал открытый корпус русского языка (http://opencorpora.org/).

Но меня ждало разочарование — словарь состоял из 300 тыс. словоформ, более 5 млн записей, а для Excel это в принципе невозможный объём. Даже если запихнуть в него «всего лишь» 1 млн строк, то выполнять с ними какие-то манипуляции или, упаси боже, вычисления, сможет только очень терпеливый человек, который вообще никогда и никуда не торопится. Но в этот раз я решил натравить на задачу более подходящий инструмент — Power BI.
Читать дальше →
Всего голосов 24: ↑23 и ↓1+22
Комментарии18

Сколько нужно Data-Scientistов, чтобы закрутить лампочку (или какая команда заставит данные работать на бизнес)

Время на прочтение6 мин
Количество просмотров3.6K


— Сколько нужно дейта-сайентистов, чтобы закрутить лампочку?
— Один, если историческая выборка успешно закрученных лампочек достаточна.

Это, конечно, шутка, но когда в какой-либо компании речь заходит о том, чтобы приручить big data для улучшения бизнес-показателей, далеко не все понимают, кто именно будет приручать. Классическое мнение: нужен дейта сайентист (data scientist) — аналитик данных, который умеет строить модели, разбирается в искусственном интеллекте и машинном обучении. И этот человек в одну голову всё порешает.

Также, есть тренд, что когда в компании формируется подразделение Big Data, то Data Scientistы это те, кого в первую очередь нанимают.

В реальности все сложнее. Без дейта сайентиста, конечно, нет и работы с big data, однако он — один в поле не воин. Кто же еще должен воевать плечом к плечу с ним, лучше понять на примерах.
Читать дальше →
Всего голосов 12: ↑7 и ↓5+2
Комментарии1

Посекундный биллинг, маркетплейс и песочницы для Big Data: что могут тестовые среды в облаке

Время на прочтение7 мин
Количество просмотров4.6K

Любой компании, разрабатывающей софт, нужны тестовые среды, приближенные к продакшн-окружению. Особенно это актуально для коробочного ПО, у которого длинный цикл релизов.
Многие проблемы построения тестовых сред решает их размещение в облаке. Мы расскажем про возможности тестирования на нашей облачной платформе Mail.Ru Cloud Solutions (MCS). Но часть из того, что мы расскажем, верна для любого облака.
Читать дальше →
Всего голосов 28: ↑28 и ↓0+28
Комментарии9

Как научить искусственный интеллект продавать

Время на прочтение5 мин
Количество просмотров3.8K


Роботы [пока] не научились поведению человека даже в текстовых чатах, хоть и вовсю пытаются. Но ниша для применения искусственного интеллекта давно есть. Машины не умеют красиво вести беседу, зато на основе больших данных уже облегчают жизнь бизнесу, автоматически подбирая конкретный продукт для конкретного клиента. Контакт-центру остается только связаться с последним и с большой (или как минимум бОльшей) вероятностью завершить продажу. Причем — при гораздо меньших предварительных усилиях со стороны людей.

Мы уже разбирались, что нужно сделать, прежде чем хвататься за работу с моделями, и как собрать толковую команду по оптимизации продаж с помощью big data. Как же теперь соединить продукты бизнеса с клиентами?
Читать дальше →
Всего голосов 3: ↑3 и ↓0+3
Комментарии1

Как мы учили машину говорить с миллионами людей

Время на прочтение6 мин
Количество просмотров6.2K
Маркетинг в Х5 – это большие объемы данных. «Пятёрочка», например, отправляет более 30 млн коммуникаций каждый месяц, и это число постоянно растёт. Одному клиенту одновременно можно отправить несколько предложений, и важно правильно выбрать, какие именно. Акции магазина должны быть интересны клиенту и экономически обоснованы для ритейлера. В этом посте расскажем, как мы начали определять действительно востребованные предложения с помощью машинного обучения и исключать эффект спама.


Читать дальше →
Всего голосов 24: ↑13 и ↓11+2
Комментарии7

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность