Статьи / Закладки / Профиль ilyantos / Хабр

Молдабеков Ильяс @ilyantos

Аналитик баз данных

Профиль Публикации Комментарии 1Закладки 6

Shmidtk 5 ноя 2018 в 10:47

Демократизация данных в убере

2 мин

2.6K

Data Mining*Big Data*Growth Hacking*Управление продуктом*

Всем привет!

Под хеллоувин я побывал на конференции в Будапеште (Data Crunch) и послушал там ряд интересных докладов. Один из них был от Uber, которые рассказывали о том, на каких подходах они организовали свою платформу управления данными. Этот доклад был не столько технический, сколько менеджерский и продуктовый.

Uber обширно используется данные, которые собирает в результате взаимодействия с пассажирами и водителями. Они рассчитывают стоимость поездки, оценивают потоки людей, меняют алгоритмы цены, дают рекомендации водителям, как им больше заработать и все это основываясь на собранных данных. В такой компании вся работа с данными не может быть сконцентрирована в руках группы аналитиков и DS, т.к. иначе придется нанять их слишком много, да к тому же они не всегда погружены в бизнес контекст.

Читать дальше →

JetHabr 8 ноя 2018 в 10:18

Лингвистический Epic fail, или Как запихнуть весь словарь русского языка в Power BI

7 мин

9.1K

Семантика*Программирование*Big Data*Блог компании Инфосистемы ДжетСофт

Как-то, решая проблему лингвистического анализа в Power BI и заодно подыскивая примеры для моей предыдущей статьи, я вспомнил о задаче, которую пытался решить в Excel ещё несколько лет назад: нужно было внедрить в аналитическую систему словарь русского языка для лингвистического анализа большого количества запросов на естественном языке. Причём желательно было использовать стандартные офисные инструменты. Подавляющее большинство людей сразу взялись бы решать эту задачу в Excel, и я когда-то пошёл по тому же пути. В качестве словаря использовал открытый корпус русского языка (http://opencorpora.org/).

Но меня ждало разочарование — словарь состоял из 300 тыс. словоформ, более 5 млн записей, а для Excel это в принципе невозможный объём. Даже если запихнуть в него «всего лишь» 1 млн строк, то выполнять с ними какие-то манипуляции или, упаси боже, вычисления, сможет только очень терпеливый человек, который вообще никогда и никуда не торопится. Но в этот раз я решил натравить на задачу более подходящий инструмент — Power BI.

Читать дальше →

+22

SergeyMarin 9 ноя 2018 в 10:10

Сколько нужно Data-Scientistов, чтобы закрутить лампочку (или какая команда заставит данные работать на бизнес)

6 мин

3.6K

Big Data*Математика*Машинное обучение*Блог компании Школа ДанныхИскусственный интеллект

— Сколько нужно дейта-сайентистов, чтобы закрутить лампочку?
— Один, если историческая выборка успешно закрученных лампочек достаточна.

Это, конечно, шутка, но когда в какой-либо компании речь заходит о том, чтобы приручить big data для улучшения бизнес-показателей, далеко не все понимают, кто именно будет приручать. Классическое мнение: нужен дейта сайентист (data scientist) — аналитик данных, который умеет строить модели, разбирается в искусственном интеллекте и машинном обучении. И этот человек в одну голову всё порешает.

Также, есть тренд, что когда в компании формируется подразделение Big Data, то Data Scientistы это те, кого в первую очередь нанимают.

В реальности все сложнее. Без дейта сайентиста, конечно, нет и работы с big data, однако он — один в поле не воин. Кто же еще должен воевать плечом к плечу с ним, лучше понять на примерах.

Читать дальше →

ndal 13 ноя 2018 в 09:49

Посекундный биллинг, маркетплейс и песочницы для Big Data: что могут тестовые среды в облаке

7 мин

4.6K

Тестирование IT-систем*Блог компании VKBig Data*Облачные сервисы*

Любой компании, разрабатывающей софт, нужны тестовые среды, приближенные к продакшн-окружению. Особенно это актуально для коробочного ПО, у которого длинный цикл релизов.
Многие проблемы построения тестовых сред решает их размещение в облаке. Мы расскажем про возможности тестирования на нашей облачной платформе Mail.Ru Cloud Solutions (MCS). Но часть из того, что мы расскажем, верна для любого облака.

Читать дальше →

+28

SergeyMarin 14 ноя 2018 в 12:29

Как научить искусственный интеллект продавать

5 мин

3.8K

Big Data*Математика*Машинное обучение*Блог компании Школа ДанныхИскусственный интеллект

Роботы [пока] не научились поведению человека даже в текстовых чатах, хоть и вовсю пытаются. Но ниша для применения искусственного интеллекта давно есть. Машины не умеют красиво вести беседу, зато на основе больших данных уже облегчают жизнь бизнесу, автоматически подбирая конкретный продукт для конкретного клиента. Контакт-центру остается только связаться с последним и с большой (или как минимум бОльшей) вероятностью завершить продажу. Причем — при гораздо меньших предварительных усилиях со стороны людей.

Мы уже разбирались, что нужно сделать, прежде чем хвататься за работу с моделями, и как собрать толковую команду по оптимизации продаж с помощью big data. Как же теперь соединить продукты бизнеса с клиентами?

Читать дальше →

X5Tech 16 ноя 2018 в 15:46

Как мы учили машину говорить с миллионами людей

6 мин

6.2K

Big Data*Машинное обучение*Управление продажами*Блог компании X5 Tech

Маркетинг в Х5 – это большие объемы данных. «Пятёрочка», например, отправляет более 30 млн коммуникаций каждый месяц, и это число постоянно растёт. Одному клиенту одновременно можно отправить несколько предложений, и важно правильно выбрать, какие именно. Акции магазина должны быть интересны клиенту и экономически обоснованы для ритейлера. В этом посте расскажем, как мы начали определять действительно востребованные предложения с помощью машинного обучения и исключать эффект спама.

Читать дальше →