Pull to refresh

Вебинар: Российский BI в мессенджере с ИИ. Новые возможности

Reading time1 min
Views611

Приглашаем Вас на вебинар о российской BI-системе с искусственным интеллектом, которая работает в мессенджерах, – Easy Report.

Тема вебинара: “Российский BI в мессенджере с ИИ. Новые возможности”

Дата: 27 февраля

Время: 11:00 Мск

Продолжительность: 1 час.

Запись вебинара будет доступна всем зарегистрированным! Зарегистрироваться.

Подробности про вебинар + голосование
Total votes 3: ↑3 and ↓0+3
Comments0

Data-driven митап

Reading time1 min
Views1.2K

X5 выходит на тропу митапов. 2 апреля приходите на онлайн #meetupХ5 по data-driven подходу в наших проектах. Обещаем – все только самое интересное и эксклюзивное от самых главных спецов Big Data X5. С соблюдением дистанции, но с широким виртуальным охватом спикеры Х5 не только поговорят о последних разработках Х5, но и ответят на ваши вопросы.

Читать далее
Total votes 4: ↑3 and ↓1+2
Comments0

Data-driven организация: когда алгоритмы заменят людей

Reading time1 min
Views2.3K

В Data-Driven подходе все принимаемые решения основаны на big data. Что это — новый эффективный инструмент или дань моде, а может хайповое название привычных вещей?

Вместе с экспертами рынка поговорим о том, как и зачем становиться Data-Driven компанией и почему иногда кейсы работы с данными не приносят реальной пользы бизнесу. А также поразмышляем, могут ли алгоритмы заменить людей или за цифрами все же нужен человек?

Читать далее
Total votes 4: ↑3 and ↓1+2
Comments0

Поведенческая реклама ≠ правительственная слежка. Пора внести ясность

Reading time5 min
Views11K
image

Комментарий переводчика:
В последнее время вопросы приватности данных и вторжения государства в частную жизнь не сходят со страниц газет и блогов. Поскольку для нас этот вопрос являлся ключевым с точки зрения бизнеса, регулярно как в профессиональных встречах, так и в личных беседах приходилось рассказывать и доказывать, чем же аккуратное использование данных для конкретных бизнес-целей отличается от слежки за пользователями Интернета. Поэтому статья, перевод которой приведен ниже, показалась мне очень актуальной.

Когда мы начинали разрабатывать алгоритмы для оптимизации интернет-рекламы в Maxifier, то вопрос доступности и конфиденциальности данных был одним из первых, от которых зависели и потенциальные возможности нашего продукта, и общее позиционирование компании. Для себя мы однозначно решили, что не будем использовать персонифицированные данные о пользователе, а работать только с усредненными статистическими данными. Да, это несколько обедняет алгоритмы. Да, результат для каждого конкретного человека будет чуть менее точным — т.к. мы будем использовать автоматически реконструированные шаблоны поведения, но не знания о поведении в сети этого конкретного пользователя. Создали самообучающуюся систему; со временем она становится все более «умной» — статистические знания о пользователях накапливаются, шаблоны уточняются. Такое решение позволило нам избежать всех проблем с последовавшими законами о конфиденциальности данных в Европе, например, из-за которых потом сильно пострадали все системы behavior targeting'a. А то, что мы изначально строили алгоритмы, предполагая высокий уровень шума и загрубленность данных, в дальнейшем нам даже позволило сделать это дополнительным конкурентным преимуществом — т.к. наш продукт работает в случаях недостатка информации или отсутствия доступа к ней из-за политики сайтов и рекламных сетей – в ситуациях, когда решения конкурентов- обладателей баз данных не справлялись по показателям качества.

Читать дальше →
Total votes 26: ↑15 and ↓11+4
Comments5

Data-driven подход к продакшну / Фильтры по акциям

Reading time6 min
Views3.3K
data analysis

Что вас ждет в статье:
Описание подхода, который мы применили для исследования фильтров на сайте одного из наших клиентов, а также детальное описание технологий.

На кого рассчитана статья:
Статья будет интересна веб-аналитикам и всем, кто сталкивается с задачами исследования пользовательского опыта на основе количественных данных.

Дисклеймер:
Все описанное в статье является лишь мнением автора (Артем Кулбасов, веб-аналитик AGIMA) и не является единственно верным решением задачи. Многие описанные в статье технологии могут быть заменены аналогами.

Читать дальше →
Total votes 19: ↑13 and ↓6+7
Comments2

Продажи на основе сквозной бизнес аналитики

Reading time5 min
Views4.1K
В этой статье я раскрою суть сквозной аналитики для малого и среднего бизнеса. Она нацелена на предпринимателей, которые всегда считали, что сквозная аналитика — это круто, но очень дорого и подходит только для гигантов, крупных компаний.
Читать дальше →
Total votes 9: ↑9 and ↓0+9
Comments0

Как быть data driven. С самого начала

Reading time7 min
Views23K
Цифры много значат для нас. Мы инвестируем в данные, слушаем и понимаем их. Мы руководствуемся ими при принятии решений. Несмотря на то, что в плане инфраструктуры работы с данными у нас еще многое впереди, сам data driven подход был с нами всегда. В этом тексте — рассказ о том, какой путь мы прошли, какие уроки выучили и какие грабли собрали.

image
Читать дальше →
Total votes 7: ↑5 and ↓2+3
Comments0

Осмысленные интерфейсы

Reading time6 min
Views9.5K

Недавно в команде произошел случай, который заставил обратить наше внимание на статью 2013 года. Материал не потерял актуальности, а перевода я не нашел, поэтому решил заполнить пробел. Но сначала немного предыстории.

Комьюнити-менеджеры обратили внимание на редко всплывающий баг в приложении: если пользователь закрепит контент вверху своего профиля, а затем модератор этот контент по каким-то причинам забанит, то у пользователя нет возможности ничего с этим закреплённым и забаненным контентом сделать: открепить его нельзя и другими способами от него избавиться тоже не получится. Типичный краевой случай, который редко встречается в реальной жизни. Я хоть и менеджер, но решил не отвлекать никого из команды на эту мелочь, а пофиксить баг самостоятельно, заодно стряхнуть немного пыль с навыков разработки.

Буквально через два уровня абстракций я оказался в коде, датированном 2016-2017 годами, то есть занялся software archeology. В какой-то момент меня возмутило, что вместо интерфейса репозитория в конструктор класса сервиса была передана реализация. Ещё одним уровнем абстракции ниже оказалось, что это всё-таки был интерфейс, но назывался он просто ContentRepository, а не ContentRepositoryInterface, как написал бы любой адепт ООП и принципов SOLID. Это уже не лезло ни в какие ворота, и я потребовал у архитектора оснований (кстати, рекомендую его статью о том, как мы вдвое ускорили построение лент подписок). Он в свою очередь невозмутимо показал пункт внутренних правил оформления кода, где была проставлена ссылка на статью 2013 года («А» — археология, как и было сказано).

Под катом — перевод этого материала.

Читать далее
Total votes 44: ↑41 and ↓3+38
Comments10

Доказательная разработка или как data-driven подход добавил смысла работе

Reading time5 min
Views7.6K

На собеседованиях стороны чаще всего хотят понять, подходят ли они друг другу и будет ли им комфортно работать вместе. Я руковожу командой разработки бэкенда, которая за последние два года выросла вдвое, поэтому собеседований было достаточно. Кандидаты чаще всего задают вопросы о процессах и правилах в компании, а я всегда хочу узнать, что им нравится или не нравится в текущей работе, а также — какой они видят идеальную команду для себя.

С этих собеседований вынес интересное наблюдение: в первую тройку «пожеланий» попадает такая трудно формулируемая вещь, как «хочется, чтобы в работе был смысл». Если начать раскручивать этот клубок, то часто приходим к более негативной формулировке «прошлый заказчик/бизнес не знает, чего хочет и постоянно меняет требования».

В такие моменты всегда вспоминаю, как познакомился с data-driven подходом. Для себя больше люблю называть это доказательной разработкой (по аналогии с доказательной медициной) и расскажу на примере. Сейчас этот подход кажется обычным и естественным, но когда-то стал для меня настоящим откровением. И, судя по вопросам кандидатов на собеседованиях, все еще может быть полезен, хотя обсуждается уже давно.

Читать далее
Total votes 52: ↑49 and ↓3+46
Comments2

Первый взгляд на Xataface — систему построения дата-центрированных приложений на PHP и MySQL

Reading time3 min
Views3.2K
Приветствую многоуважаемых хабражителей.

Поиск по Хабру по ключевым словам «dataface» и «xataface» привёл к пустой странице результатов, поэтому считаю своим долгом поделиться с честной публикой своим давним открытием, до сей поры остававшимся в тени.

Рунет так же не в курсе такой замечательной штуки, которая, между тем, существует свыше трёх лет и имеет определенную популярность в узких кругах.

Подробности под катом.
Читать дальше →
Total votes 39: ↑36 and ↓3+33
Comments40

Парадигмы программирования. Data Driven vs Domain Driven

Reading time7 min
Views61K
Информационные технологии развиваются семимильными шагами, появляются новые устройства, платформы, операционные системы, и вместе с этим растет спектр задач, который приходится решать разработчикам. Но, не все так плохо — на помощь программистам спешат новые средства разработки, ide’шки, новые языки программирования, методологии и т.д. Один только список парадигм программирования впечатляет, а с учетом современных мультипарадигменных ЯП (например, C#) резонно встает вопрос: «Как с этим всем быть? Что выбрать?».

Попробуем немного разобраться.
Читать дальше →
Total votes 51: ↑37 and ↓14+23
Comments97

Управляемое данными тестирование с использованием Cucumber

Reading time4 min
Views3.2K

Тестирование на основе данных позволяет сократить объем ручных действий, необходимых для проведения тестирования, а также упростить управление и сопровождение тест-кейсов. В целом использование тестирования на основе данных позволяет повысить качество программного обеспечения и гарантировать, что оно соответствует требованиям и ожиданиям пользователей. В этой статье рассмотрим Data-driven тестирование с использованием Cucumber.

Читать далее
Total votes 14: ↑12 and ↓2+10
Comments3

А/Б тестирование с CUPED: детальный разбор

Reading time14 min
Views7.8K

Хабр, привет! Сегодня обсудим, как применять CUPED для повышения чувствительности А/Б тестов. Рассмотрим на простом примере принцип работы CUPED, покажем теоретически за счёт чего снижается дисперсия и приведём пример оценки эксперимента. Обсудим, как выбирать ковариату, как работать с бинарными метриками и что делать при противоречивых результатах.

Читать далее
Total votes 12: ↑12 and ↓0+12
Comments0

Как рассчитать SLA на примере Nginx-сервера

Level of difficultyEasy
Reading time5 min
Views6.1K

Соглашение об уровне обслуживания (SLA) – это соглашение с клиентами или пользователями, где описывается уровень обслуживания, который поставщик обещает предоставить клиенту. SLA можно представить в виде измеряемой метрики, например, как время безотказной работы или суммарное количество ошибок. Перевели статью, где рассматривается простой способ расчета SLA на примере Nginx-сервера.

Читать далее
Total votes 9: ↑7 and ↓2+5
Comments1

Определяем оптимальный размер групп при множественном А/Б тестировании

Reading time3 min
Views9.7K

Привет, Хабр! В этой статье мы затронем один из аспектов множественного тестирования, а именно определение оптимальных размеров групп в случае общей контрольной группы. Докажем теоретически, что предлагаемый способ является оптимальным и сравним его с другими популярными подходами.

Читать далее
Total votes 5: ↑5 and ↓0+5
Comments4

Метрики Эффективности Команд. Data driven подход к улучшению эффективности команд и бизнес результатов

Level of difficultyMedium
Reading time7 min
Views4.6K

Как понять эффективность команд? Как узнать можем ли мы перформить лучше и экономить ресурсы? Многие поднимают эти вопросы в компаниях.

Последние несколько лет я активно занимаюсь вопросом внедрения метрик эффективности в компании и команды и с многими компаниями мы прошли большой путь по использованию метрик. За это время сформировался фреймворк метрик, который позволяет построить сквозную аналитику того, как вы поставляете ценность, насколько эффективны ваши процессы и флоу поставки ценности. Все это дает картину и данные для того, чтобы управлять эффективностью ваших процессов и команд и улучшать их.

Но что такое эффективность? И какие метрики действительно являются ключевыми? Какие из них позволят не только измерить текущее состояние, но и помогут принимать обоснованные решения для улучшения работы? В данной статье мы рассмотрим важные метрики, которые помогут вам ответить на эти вопросы и повысить результативность вашей инженерной команды.

Читать далее
Total votes 11: ↑7 and ↓4+3
Comments5

Как мы посчитали уровень Data Driven’ности в компании и вклад в него каждого аналитика?

Reading time7 min
Views3.7K

Салют! Меня зовут Ваня Леонтьев, я директор по аналитике в СберМаркете. Эта статья о том, как мы оцифровали такую сложную концепцию как data-культура в компании. Поделюсь предпосылками, нашим подходом к расчету и планами по её развитию. Думаю, наш опыт будет интересен аналитикам, лидам аналитических команд, руководителям продукта и компаний в целом — всем тем, кто кто стремится продвигать культуру данных в своей компании. А также тем, кто хочет иметь инструмент для приоритизации и управления в команде аналитики.

Читать далее
Total votes 9: ↑7 and ↓2+5
Comments4

RICE на стероидах или новая модель скоринга «RIDE»

Level of difficultyMedium
Reading time11 min
Views1.8K

Если вы создавали свой стартап, занимались маркетингом ИТ продуктов или были частью продуктовой команды, то возможно знакомы с фреймворком планирования RICE для приоритизации продуктовых замыслов, идей и фич. Но сегодня речь не о нём. Будем обсуждать альтернативную версию этого фреймворка – «RIDE».

Подробнее
Total votes 4: ↑4 and ↓0+4
Comments4

Структура команды Data Science: ключевые модели и роли

Reading time16 min
Views8.6K

Если вы следили за мнениями специалистов в data science и прогностической аналитики, то, скорее всего, сталкивались с рекомендациями использовать машинное обучение. Как рекомендует Джеймс Ходсон в Harvard Business Review, умнее всего будет стремиться к решению самой лёгкой задачи, а затем масштабировать процессы на более сложные операции.

Недавно мы обсуждали платформы machine-learning-as-a-service (MLaaS). Основной вывод из современных тенденций прост: машинное обучение становится более доступным для средних и мелких бизнесов, постепенно превращаясь в массовый товар. Ведущие поставщики (Google, Amazon, Microsoft и IBM) предоставляют API и платформы для выполнения основных операций ML без собственной инфраструктуры и большого опыта в data science. На первых этапах самым умным шагом будет выбор такого гибкого и экономного подхода. С ростом возможностей аналитики можно изменять структуру команды для ускорения её работы и расширения арсенала аналитики.

В этот раз мы поговорим о структуре команд data science и их сложности.
Читать дальше →
Total votes 2: ↑1 and ↓10
Comments2
1