Articles / Profile of Rebelqwe / Habr

Михаил @Rebelqwe

Начальник отдела программирования

ProfileArticles8PostsNews2Comments136

Rebelqwe Oct 9 at 13:00

Всё что надо знать менеджеру по маркетинговым исследованиям в агентстве и маркетологу компании об оформлении анкеты

Hard

4 min

292

Research and forecasts in IT * InterviewInternet marketing * Statistics in ITData visualization *

Tutorial

Стандартное форматирование анкет маркетингового исследования — это не просто вопрос эстетики или формальности, а ключевой элемент обеспечения качества, достоверности и сопоставимости получаемых данных. Для менеджера, отвечающего за сбор и интерпретацию рыночной информации, знание и применение единых стандартов оформления анкет критически важно по следующим причинам:

Единообразная структура вопросов, логическая последовательность блоков и чёткая формулировка и единообразное форматирование инструкций снижают вероятность недопонимания интервьюерами и программистами. Это минимизирует ошибки при создании скрипта, заполнении анкеты и повышает точность собранных данных.

Нестандартные формулировки, двусмысленные вопросы или хаотичная структура анкеты могут привести к неявным искажениям в собранных данных.

Стандартное форматирование включает проверенные методики построения шкал, формулировок и логики переходов, что снижает когнитивную нагрузку на разработчика, интервьюера и уменьшает время разработки и тестирования анкеты перед началом поля.

Применяя стандарт менеджер не тратит время на "изобретение велосипеда" для каждого нового опроса. Он использует готовый, утвержденный шаблон. Это ускоряет создание анкеты в разы, снижает количество правок и время на их согласование будет потрачено на полевой этап и более качественный анализ результатов.

Данные с чистой, стандартизированной анкеты прописаны в задачах анализа в упорядоченном виде. Аналитику не приходится тратить 80% времени на "очистку" данных, исправление ошибок кодировки и приведение переменных к единому виду и поиску, какой именно вопрос имел ввиду менеджер фразой "Имиджевые высказывания в разрезе на возраст". Аналитик сразу приступает к анализу Q3s с банером Age.

Узнать стандарты оформления

Rebelqwe Jun 28 2024 at 09:01

Руководство по задачам, возникающим при использовании речевой аналитики Яндекс SpeechSense (Часть 2)

Medium

8 min

665

Serverless * Artificial IntelligenceData visualization * PowerShell * Python *

Tutorial

Если у вас имеется собственный контактный центр, задача найти упоминание чего-либо конкретного в большом количестве аудиозаписей возникает регулярно. Недавно я опубликовал статью о том, как настраивать это решение с нуля. Во второй части я хочу показать, какие решения мне пришлось разработать дополнительно для использования речевой аналитики Яндекс SpeechSense, какие дополнительные задачи при этом появились и как их решать.

Задача, которую я решал, формулировалась вот так. Необходимо проанализировать 25000 аудиозаписей разговоров оператора с клиентом по телефону, найти и вывести список всех аудиозаписей, где есть поздравления с праздниками.

Перейти к решениям

Rebelqwe Jun 21 2024 at 18:27

Руководство по началу с нуля настройки решений речевой аналитики Яндекс SpeechSense и документации по платформе

Medium

5 min

1.7K

Python * PowerShell * Data visualization * Artificial IntelligenceServerless *

Tutorial

Если у вас имеется собственный контактный центр, задача найти упоминание чего-либо конкретного в большом количестве аудиофрагментов возникает регулярно. Недавно нам удовлетворили заявку на доступ к prewiev режиму сервиса Яндекса SpeechSense и я решил попробовать одну из таких задач решить при помощи этого сервиса.

Все трудности, тонкие моменты и полный путь от начала настройки и до победы описаны в этой статье.

В принципе в документации описан функционал, который мало отличается от других систем речевой аналитики, и это только на первый взгляд. Сюрпризом стало полное отсутствие собственных средств загрузки аудиофрагментов в систему. Всю загрузку необходимо реализовать самостоятельно. В документации описан только один способ, при помощи bash и Python под unix. Поэтому в этой статье я еще и опишу, как такие инструкции адаптировать под Windows и PowerShell.

Сама инструкция довольно короткая https://yandex.cloud/ru/docs/speechsense/operations/data/upload-data я рассчитывал справиться за пару часов, это мне не удалось. Так что Ваша выгода от прочтения статьи может составлять 2-3 рабочих дня. Или больше.

Прочитать

Rebelqwe Jun 3 2024 at 18:37

Про обязательность поправки на множественные сравнения, которая часто игнорируется адептами Data Driven методов

Easy

11 min

4.3K

Research and forecasts in IT * R * Mathematics * Algorithms * Data Mining *

Review

✏️ Technotext 7

Когда проводится один статистический тест на значимость различий, всегда есть шанс (ошибка первого рода = 5%, на уровне значимости p=0.05) получить ложный положительный результат случайно. Эта ошибка означает, что мы можем ложно утверждать, что значимое различие существует, притом, что в реальности этой значимости нет.

Когда проводится несколько однотипных тестов подряд, каждый из них имеет 5% шанс на ложный положительный результат. Если коррекция отсутствует, то вероятность, что хотя бы один из этих тестов даст ложный положительный результат, быстро возрастает.

Предположим, что делается 20 однотипных тестов. Вероятность того, что получится ложный положительный результат равна 1 - (1 - 0.05)^20 ≈ 64%.

Как контролировать ошибки читать далее

+11

Rebelqwe Jan 30 2024 at 14:32

Топ 5 моментов при разработке бота ТГ на R, на Serverles functions Яндекса

Medium

3 min

1.1K

API * R * Serverless *

Analytics

Возьмем пример: Как создать бота в Telegram

Если вы когда нибудь читали документацию Яндекс облака, вы в курсе. Для остальных могу пояснить. Возьмите лапидарный текст, удалите из него ясность и чёткость и вы получите документацию Яндекс облака.

В статье я хочу поделиться теми моментами которые всплыли при разработке бота в телеграм, но не описаны в документации.

-2

Rebelqwe Jul 7 2023 at 13:44

Поиск в War Thunder режима персонального угнетения (РПУ) при помощи анализа статистики побед/поражений (Часть 1)

Medium

3 min

21K

Games and game consolesGame design * Research and forecasts in IT *

Analytics

✏️ Technotext 2023

С 12.07.2019 по 22.07.2019 я тщательно собирал и заносил в таблицу статистику своих побед и поражений в игре в War Thunder, с целью убедится в наличии или отсутствии РПУ, при помощи тестирования статистических гипотез о равенстве средних. Спустя 2 года я наконец-то набрался сил и смелости, чтобы написать данную статью, опубликовать полученных данные и представить результаты их анализа для публичного обсуждения.

Полученные данные позволяют сделать вывод о гипотезе наличия/отсутствия РПУ в игре, приводят к очень необычным выводам относительно изучаемого объекта, обладают научной новизной и за 2 года так и не были высказаны в других публикациях. Также в статье я постараюсь сделать некоторые обоснованные выводы о характеристиках и свойствах изучаемого объекта.

Узнать подробности.

Rebelqwe Jul 26 2022 at 10:34

Автоматизация оценки мнения аудитории о видеофрагменте, на основе количественного CAWI опроса

3 min

757

Data Mining * Data visualization * Research and forecasts in IT * Internet marketing * Email-marketing *

Technotext 2022

В этой стать хочу рассказать о том, что оценивать мнение аудитории о происходящем на видео можно, и даже нужно, не только качественными, но и количественным методом, получая результаты сразу без каких-либо задержек.

К плюсам количественного способа оценки я бы отнес следующее:

Rebelqwe Jan 22 2018 at 08:27

Максимально просто про перебор комбинаций в реальных бизнес-задачах

4 min

10K

Algorithms * Programming * Development for Office 365 *

From sandbox

Если начать искать материал про перебор комбинаций, возникает масса примеров как перебрать все сочетания всех букв или всех цифр. Но как создать все сочетания элементов матрицы, в которой заранее неизвестна размерность, не углубляясь в Иосифа Романовского и его «Дискретный Анализ», такого материала я не нашел, поэтому и решил написать его здесь. Вдруг кому-то понадобится.

Читать дальше →

Всё что надо знать менеджеру по маркетинговым исследованиям в агентстве и маркетологу компании об оформлении анкеты

Руководство по задачам, возникающим при использовании речевой аналитики Яндекс SpeechSense (Часть 2)

Руководство по началу с нуля настройки решений речевой аналитики Яндекс SpeechSense и документации по платформе

Про обязательность поправки на множественные сравнения, которая часто игнорируется адептами Data Driven методов

Топ 5 моментов при разработке бота ТГ на R, на Serverles functions Яндекса

Поиск в War Thunder режима персонального угнетения (РПУ) при помощи анализа статистики побед/поражений (Часть 1)

Автоматизация оценки мнения аудитории о видеофрагменте, на основе количественного CAWI опроса

Максимально просто про перебор комбинаций в реальных бизнес-задачах

Information

Specialization