Статьи / Закладки / Профиль boggis30 / Хабр

@boggis30

Пользователь

Профиль Публикации 1Комментарии 6Закладки 56

xeovo 19 янв в 13:05

Жизнь после запрета писать про VPN: зачем мы остаёмся на Хабре

3 мин

53K

Информационная безопасность*Законодательство в ITБлог компании Xeovo VPN

Как мы уже писали, с 1 декабря прошлого года Роскомнадзору разрешено блокировать сайты с информацией о VPN и иных способах обхода блокировок. С понедельника началась новая волна блокировок протоколов OpenVPN и WireGuard, приведшая к перебоям с VPN у многих пользователей.

В итоге, складывается парадоксальная ситуация: писать о VPN запрещено в тот самый момент, когда людям нужнее всего новости о том, что происходит с VPN. Кто-то должен вести хронику борьбы с VPN в России — поэтому, пока у нас есть физическая возможность писать на Хабре, мы продолжим вести блог Xeovo VPN.

+130

157

Mike-M 7 янв в 16:45

М.Видео: Нам всё равно

Простой

34 мин

51K

Веб-разработка*Тестирование IT-систем*Верстка писем*Service Desk*Лайфхаки для гиков

Кейс

3 месяца и 40 обращений. Ровно столько времени и усилий мне потребовалось, чтобы прийти к выводу в заголовке статьи.
Но статья – не жалобная книга. Опираясь на полученный опыт, я поделюсь с вами полезными советами, как решать проблемы с компанией М.Видео. Да и с другими компаниями тоже.
Помимо этого, в статье масса примеров того, как делать не надо с точки зрения UI и UX.

Хочу всё знать

+95

230

nikita_volkov 19 окт 2023 в 12:55

От A/B-тестирования к Causal Inference в оффлайн ритейле

Средний

31 мин

10K

Data Mining*Big Data*Машинное обучение*Блог компании X5 Tech

Туториал

✏️ Технотекст 2023

Приветствуем всех читателей! Сегодня команда Ad-Hoc аналитики X5 Tech приоткроет дверь в увлекательный мир ~~A/B-тестирования~~ Causal Inference. С момента написания предыдущей статьи прошло уже 4 года. За это время наш подход к оценке инициатив значительно эволюционировал. Мы собирали бизнес-кейсы, изучали научную литературу, экспериментировали с реальными данными и в итоге пришли не только к другой модели для оценки эффекта, но и изменили методологию в целом.

aizakharov94 18 авг 2022 в 17:00

Прогнозирование спроса: как СберМаркет прогнозирует, что вы закажете вечером в пятницу

5 мин

7.9K

Разработка под e-commerce*Машинное обучение*Блог компании СберМаркет

Привет! Меня зовут Андрей Захаров, я Senior Data Scientist в СберМаркете. Когда вы заказываете продукты к пятничному ужину, мы должны быть уверены, что для доставки хватит сборщиков и курьеров. Поэтому мы прогнозируем число заказов в каждом магазине с точностью до часа. В статье — как мы это сделали на данных, которые устаревают уже за 3 месяца.

Читать дальше →

Anna_sila 21 ноя 2023 в 19:53

Эксперимент: сделать Telegram канал и зарабатывать на рекламе больше 500 тысяч в месяц

8 мин

120K

Интернет-маркетинг*Бизнес-модели*Социальные сети и сообщества

Из песочницы

Привет! Меня зовут Аня!
Хабр я читаю уже давно, решила что теперь и у меня есть интересный материал, чтобы с вами поделиться :)

В начале 2023 года начала заниматься Telegram каналами и за 10 месяцев я создала 6 каналов в Telegram, на которые подписано уже более 70 000 подписчиков.

До Telegram я занималась парсингом данных сайтов на VB, созданием сайтов (wordpress, tilda) и бизнес-презентациями. Был даже свой собственный интернет-магазин детских товаров 2 года (опыт был неудачным, тогда еще нельзя было продавать через маркетплейсы ))

Я расскажу вам о своем опыте создания и монетизации Telegram-каналов, об ошибках, которые я допустила в начале своего пути, и постараюсь сформулировать основные принципы и возможности заработка в этой сфере (кстати считаю, что IT -тематика одна из самых перспективных сегодня для создания телеграм-канала)

-73

karpovcourses 12 сен 2023 в 18:38

Почему анализ ошибок – это начало разработки ML системы, а не конец?

20 мин

9.2K

Машинное обучение*

Мнение

Мы школа онлайн-образования, которая уже три года делает курсы по Data Science и разработке. Одна из наших целей – собрать коммьюнити классных специалистов и делиться крутыми и неочевидными знаниями. Так был рождён Симулятор ML – место, в котором начинающие и опытные специалисты решают задачи разной сложности, разрабатывают проекты в командах, осваивают новые инструменты, развивают продуктовое мышление и постоянно растут в профессии.

А, как это свойственно коммьюнити, горящему идеей, студенты и авторы хотят делиться своими инсайтами и открытиями, которые дадут свежий взгляд на устоявшиеся практики. Сегодня хотим поделиться статьей автора Симулятора ML Богдана Печёнкина о том, как лучше использовать анализ ошибок для разработки ML систем.

HGordon 14 авг 2018 в 10:43

Паттерны корутин asyncio: за пределами await

22 мин

38K

Python*

Туториал

Из песочницы

Предисловие переводчика:
В очередной раз наступив на грабли при работе с python asyncio я отправился на просторы интернета, чтобы найти что-то более приятное, чем сухая документация. Мне попалась статья Yeray Diaz "Asyncio Coroutine Patterns: Beyond await", в которой автор весьма увлекательно рассматривает применение asyncio и делится некоторыми приемами. Поскольку я не нашел ничего такого же цельного на русском языке, то решился её перевести.

Asyncio — конкурентная мечта python программиста: пишешь код, граничащий с синхронным, и позволяешь Python сделать все остальное. Это очередной импорт библиотеки антигравитации: import antigravity

На самом деле все совсем не так, конкурентное программирование — тяжелое занятие и, пока корутины позволяют нам избегать ада обратных вызовов, что может увести вас достаточно далеко, вам все еще нужно думать о создании задач, получении результатов и элегантном перехвате исключений. Печально.

Хорошие новости в том, что все из этого возможно в asyncio. Плохие новости в том, что не всегда сразу очевидно что неправильно и как это исправить. Ниже несколько паттернов, которые я обнаружил во время работы с asyncio.

Читать дальше →

+15

Ipukhov 25 янв 2022 в 14:24

Как менеджер продукта, я проверил гипотезу приложения за 2 часа — и вы сможете

4 мин

8.9K

Управление продуктом*

Из песочницы

Работаю продактом уже 8-й год, и часть работы — это проверять гипотезы. Нужно уметь быстро убедиться, сработает ли фича/бизнес идея или нет. Вот ситуации из жизни:

Есть своя идея приложения, нужно понять стоит ли ей заниматься.

По работе, у вас есть несколько идей/фич на текущий квартал и вы хотите узнать, какая наиболее перспективная. Ведь если команда работает над слабой фичей, в то же время она НЕ работает над чем-то сильным и нужным. А время идет.

Начальство спустило дурацкую идею сверху, надо аргументированно похоронить этот проект, чтобы не отвлекаться от важной работы.

Чтобы фича/идея имела смысл, ваш продукт должен быть кому-то нужен. Причем желательно часто, и сильно. В этой статье я покажу три простых шага проверки идеи, на примере приложения для выбора велосипеда.

+11

muxeu 28 дек 2022 в 20:09

Обзор пакетов SciPy, Pyomo и CVXPY для решения задач условной оптимизации

15 мин

Python*Алгоритмы*Математика*Блог компании X5 Tech

Привет, Habr! На связи Михаил Будылин и Антон Денисов, мы работаем в отделе аналитики данных X5 Tech.

В этой статье мы продолжаем говорить про прикладное применение теории оптимизации. В частности, делаем краткий обзор существующих open-source решений в Python, с которыми мы сталкивались на практике. Затрагиваем их различия и особенности, приводим примеры задач, которые можно решать с их помощью.

X5Tech 21 сен 2021 в 18:34

Построение архитектуры проекта при работе с PySpark

19 мин

7.7K

Python*Анализ и проектирование систем*Big Data*Блог компании X5 TechData Engineering*

В настоящее время уже сложно найти крупную компанию, которая не использовала бы возможности накопления и использования больших данных. Меня зовут Никита Сурков и я работаю в проекте ценообразования "Пятёрочки" X5 Group. Проект является ярким примером использования больших данных, так как Пятёрочка -- это 18000 магазинов по всей стране. Чтобы построить систему ценообразования в такой сети требуется обработка миллиардов строк информации из чеков, данных по остаткам, себестоимостей и многих других данных. Для всего этого преимущественно используется PySpark, как один из популярных инструментов для работы с расперделёнными системами. В данной статье будет представлен один из методов написания кода на PySpark таким образом, чтобы он был более читаем, легко тестируем и поддерживаем. Сразу оговорюсь, что не представляю здесь единственное правильное решение, но оно доказало свою жизнеспособность на примере того проекта, в котором я работал.

MaxRokatansky 16 мая 2023 в 16:49

Бандиты для оптимизации рекомендательных систем

7 мин

Контекстная реклама*Повышение конверсии*Блог компании OTUS

Перевод

Каждый, кто делал покупки на Amazon, слушал музыку на Spotify или искал достойный просмотра сериал на Netflix, сталкивался с персонализированными рекомендациями. Компании используют рекомендательные системы для увеличения вовлеченности клиентов и роста доходов. Эти алгоритмы принимают на входе метаданные о пользователе, продукте и контексте и создают персонализированный динамический контент на выходе с помощью методов коллаборативной или фильтрации по содержанию.

Качество рекомендательной системы часто измеряется с помощью экспериментов A/B-тестирования. Однако A/B-тестирование традиционно используется для измерения коэффициентов конверсии в статичных вариантах пользовательского интерфейса (например, синяя ссылка в сравнении с зеленой). Именно это натолкнуло меня на мысль об исследовании многоруких бандитов в качестве альтернативы A/B-тестированию в области рекомендательных систем.

Для начала мы рассмотрим классический мысленный эксперимент "многорукий бандит". Затем последует дискуссия о контекстном многоруком бандите с помощью формального определения и примера. Наконец, мы проведем сравнение традиционных экспериментов A/B-тестирования с многоруким бандитом.

Leono 17 апр 2020 в 17:53

Увеличение чувствительности A/Б-тестов с помощью Cuped. Доклад в Яндексе

12 мин

30K

Анализ и проектирование систем*Блог компании ЯндексМатематика*

CUPED (Controlled-experiment Using Pre-Experiment Data) — техника A/Б-экспериментов, которую стали применять в продакшене сравнительно недавно. Она позволяет увеличить чувствительность метрик за счёт использования данных, полученных ранее. Чем больше чувствительность, тем более слабые изменения можно замечать и учитывать в эксперименте. Первой компанией, внедрившей CUPED, была Microsoft. Теперь этой техникой пользуются многие международные фирмы. В своём докладе Валерий Бабушкин venheads объяснил, в чём заключается смысл CUPED и каких результатов можно достичь, а перед этим разобрал метод стратификации, который также улучшает чувствительность.

https://youtu.be/pZpUM08mv-E

— Меня зовут Валерий Бабушкин, я директор по моделированию и анализу данных в X5 Retail Group и советник в Яндекс.Маркете. В свободное время преподаю в Высшей школе экономики и частенько летаю в Казахстан, преподаю в Нацбанке Казахстана.

Читать дальше →

Reshin 16 янв 2023 в 12:14

Как машинное обучение помогает проекту «ЗабастКом» анализировать новости и освещать трудовые конфликты

Средний

16 мин

6.3K

Алгоритмы*Блог компании Open Data ScienceИскусственный интеллектDIY или Сделай самIT-компании

Кейс

В посте расскажу о моем успешном взаимодействии с некоммерческим проектом ЗабастКом, который поддерживает наемных работников в отстаивании своих трудовых прав и интересов. Моя цель была реализовать что-то похожее на ML4SG проект, где волонтеры-специалисты по анализу данных направляют свою энергию на пользу обществу. Например, применяют алгоритмы искусственного интеллекта для спасения потерявшихся людей, для мониторинга качества воздуха или для анализа новостного потока.

Для Забасткома получилось улучшить систему автоматической обработки новостей с помощью алгоритмов машинного обучения. Это привело к увеличению охвата важных событий и уменьшению ручного труда редакторов. Добавлю, что работа с ребятами была похожа на мечту любого DS специалиста: "заказчик" легко шел на контакт; присутствовала заинтересованность и неплохое понимание ML алгоритмов; некоторая продакшн-система уже функционировала; данные для обучения алгоритмов легко собирались. А под катом — поделюсь подробностями и кодом.

Читать дальше →

+54

Laggg 15 дек 2022 в 14:00

Трекинг множества объектов без разметки или как следить за пузырьками во время пенной флотации

10 мин

9.3K

Обработка изображений*Машинное обучение*Блог компании Open Data ScienceНаучно-популярноеИскусственный интеллект

Технотекст 2022

Привет, Хабр! Меня зовут Клоков Алексей, сегодня поговорим об алгоритмах компьютерного зрения, обработке видеопотока и методах трекинга множества объектов без разметки (unsupervised multiple object tracking) на примере пузырьков. Методичка будет полезна как опытным специалистам, перед которыми стоит похожая задача, так и начинающим энтузиастам. На основе черновика этого текста и экспериментов получилось опубликовать научную статью в Journal of Mineral and Material Science.

В тексте вы найдете:
— описание домена данных и технологического процесса флотации;
— подход к cегментации множества подобных объектов;
— существующие методы трекинга без разметки;
— подход к одновременному сопровождению множества подобных объектов;
— сравнение качества работы алгоритмов и много демонстраций

Читать дальше →

+60

daniilgorbenko 7 ноя 2022 в 08:30

Подборка полезных сервисов с применением нейронных сетей

4 мин

16K

Python*Программирование*Машинное обучение*Искусственный интеллектБудущее здесь

Искусственный интеллект и машинное обучение стали неотъемлемой частью нашей жизни, что привело к появлению огромного числа продуктов, основанных на нейронных сетях. Давайте посмотрим на несколько полезных сервисов, в которых используются технологии искусственного интеллекта.

Ознакомиться

+30

honyaki 28 окт 2022 в 21:06

Создание 3D-сетки из изображения с помощью Python

7 мин

12K

Python*Обработка изображений*Блог компании SkillfactoryМашинное обучение*

Перевод

Несколько лет назад генерация 3D-сетки из единственного двумерного изображения была сложной задачей. Но сегодня благодаря продвижению глубокого обучения разработано множество монокулярных моделей оценки глубины, дающих точную оценку карты глубины изображения. С помощью этой карты, выполнив реконструкцию поверхности, можно создать сетку. Подробности — к старту нашего курса по Fullstack-разработке на Python.

Читать дальше →

janvarev 7 фев 2022 в 14:58

Ирина — опенсорс русский голосовой помощник. Offline-ready

9 мин

48K

Open source*Python*Голосовые интерфейсы*

- Ирина, таймер...
- Ставлю таймер на пять минут.

Вполне себе обыденная история из моего быта. Я таки сделал собственного автономного голосового помощника.

TL;DR> Ирина вполне неплохо работает дома 24x7.

Потребуется установить Python 3.5+ и зависимости через pip (немного знаний Python).

Скиллы "из коробки": таймер, погода, контроль медиа (громче/тише/дальше), контроль плеера MPC-HC, запуск медиа из папки, расписание ближайших электричек, "подбрось кубик/монетку".

Плагинами добавляются: другие скиллы, Text-to-Speech и Speech-to-Text движки.

Интересно? Поехали >

+106

dmytrohoi 2 фев 2022 в 19:14

Чат-боты — это больше, чем вы думали, и вот почему

5 мин

16K

Мессенджеры*Анализ и проектирование систем*Проектирование и рефакторинг*

В этой статье хочу поделиться некоторыми тезисами на тему создания чат-ботов и разработки подобных решений. Я работаю Python Software Engineer в Grid Dynamics. На статью меня, в том числе, натолкнуло участие во внутреннем проекте, который за полгода вырос, по сути, до мини-отдела по разработке ботов. Цель данного материала — посмотреть на чат-боты под другим углом: не как на разработку, которую может реализовать даже новичок в программировании, а как на функциональное и коммерчески выгодное решение.

-5

NewTechAudit 24 янв 2022 в 08:52

Инструменты для решения NER-задач для русского языка

5 мин

5.1K

Python*Программирование*Машинное обучение*

Зачастую приходится работать с большими объемами документов, к примеру, исполнительными листами, заявлениями, договорами, из текстов которых нам необходимо извлечь весьма конкретную информацию: ФИО, даты рождения, наименования должности, паспортные данные, адрес, ИНН и наименование компаний, даты подписания документов и так далее. Всё это относится к задаче распознавания именованных сущностей (NER). Какие инструменты могут помочь нам в решении данной задачи для русского языка?

Пожалуй, первое что приходит в голову Data Scientist’у, когда речь идет о NLP или конкретно NER-задачах — это проекты DeepPavlov. Немного углубимся в данную тему, разберем все по порядку.

DeepPavlov — это фреймворк (open source), который помогает в разработке различных голосовых ботов, соответственно, решая различные NLP задачи.

На вход подается непредобработанный (регистры, знаки и т.д. сохранены) текст, а на выходе мы хотим увидеть, так называемые, спаны — фрагменты текста, с которыми уже можно работать (например, отнести к определенной категории).

MagisterLudi 19 янв 2022 в 17:40

Онтол: Мышление Джефа Безоса

6 мин

23K

Управление e-commerce*Читальный залНаучно-популярноеКосмонавтикаБудущее здесь

«Пусть у моих детей будет поменьше пальцев на руках, зато они не вырастут слабаками».
— Джеф Безос

Джеф Безос летом 2021 года слетал в космос. Я решил разобраться, как устроено мышление человека, который совершил прорыв в построении триллионной компании и построил свой космический корабль (и часы на 10 000 лет).

На радостях за 20 часов сделал подборку всех статей и интервью Безоса на русском, но так и не опубликовал их. Сейчас стартовала инициатива по полному переводу «писем Безоса», и думаю, что сейчас будет кстати, опубликовать мои находки. Кто хочет помочь с переводом, пишите Юрию.

«Если вы делаете что-то интересное в мире, то будьте готовы к критике. Если вы не в состоянии выдержать критику, то не делайте ничего нового или интересного».

«Если вы думаете, что [Fire Phone] — это был мой самый большой провал, спешу вас уверить, мы сейчас работаем над гораздо большими провалами — и я не шучу. Некоторые из них заставят Fire Phone выглядеть мелкой букашкой».

Читать дальше →

-10

2 3