Pull to refresh
3
0
Андрей @andrewbugakov

Пользователь

Send message

Как подготовить будущих аналитиков данных и ML-специалистов к реальным бизнес-задачам

Level of difficultyEasy
Reading time6 min
Views6.4K

Будущие аналитики данных, BI-аналитики, ML-разработчики и Data Scientists используют готовые датасеты для выполнения студенческих заданий, чтобы научиться понимать принципы обработки данных, искать и валидировать гипотезы, строить предсказательные модели. 

Однако задачи, которые решают студенты, часто недостаточно полезны как для них самих, так и для владельцев данных. Студенты не получают опыт решения практических задач, а также понимания, что результат их работы может быть полезен для бизнеса. В статье разбираюсь, почему так происходит и как получить опыт, который пригодится в работе.

Читать далее
Total votes 26: ↑25 and ↓1+26
Comments10

Apache Pulsar как основа для системы очередей

Reading time13 min
Views19K

Меня зовут Агалецкий Павел, я старший инженер в команде Архитектуры. Эта статья про новую для нас в Авито технологию — Apache Pulsar и построение системы очередей, Queues as a Service, на её основе.

Читать далее
Total votes 19: ↑19 and ↓0+19
Comments28

Обучаем SVTR-Tiny для распознавания текста сцены

Reading time7 min
Views4.5K

Сегодня мы расскажем вам, как дообучить новую state-of-the-art модель SVTR-Tiny для распознавания текста сцены (текста в реальных уличных условиях) на собственноручно сгенерированных изображениях с помощью API библиотеки PaddleOCR.

Читать далее
Total votes 7: ↑7 and ↓0+7
Comments2

Flipper Zero — мы начали доставку

Reading time5 min
Views105K

Коробки с Flipper Zero готовые к отгрузке
Flipper Zero — проект карманного мультитула для хакеров в формфакторе тамагочи, который мы разрабатываем. Предыдущие посты [1],[2],[3],[4],[5],[6],[7],[8],[9],[10],[11],[12],[13],[14],[15],[16],[17],[18],[19],[20],[21],[22],[23],[24]

А-А-А-А-А-А-а-а-а!!!11 Мы постепенно запускаем доставку. Это самый волнительный момент за всю историю проекта. Сейчас мы готовим к отправке 5к устройств, и это не просто, так как нам нужно согласовать доставку в 120+ стран мира! Пришлось оформить все таможенные документы, сертификаты соответствия, нотификации о криптографии и прочие бумажки. Целая куча бумажной работы.

Мы по прежнему испытываем сложности с дефицитом компонентов, и нам приходится сталкиваться с новыми вызовами производства. Внутри расскажем как выглядит процесс подготовки к отправке, на каком этапе производство и что будет происходить дальше.
Читать дальше →
Total votes 143: ↑139 and ↓4+164
Comments61

Как мы обучали категоризатор фискальных чеков DataCheckEngine

Reading time6 min
Views2.1K

Задача актуальна для фин. организаций и ретейла. Расскажем, как мы подошли к ней и почему выбрали для обучения уменьшенную версию модели DistilBert.

Читать далее
Total votes 8: ↑8 and ↓0+8
Comments7

Дорогой Хабр, формат GIF устарел, включи пожалуйста H.264

Reading time1 min
Views53K
image
Анимированная GIF. Файл весит 4МБ

Эта анимированная гифка весит 4МБ, хотя может весить В ДЕСЯТЬ РАЗ МЕНЬШЕ — 380кб! Это ужасно, потому что нагружает интернет-каналы в десятки раз больше, чем должно.

Почему GIF должен умереть


  • Вес файла GIF ровно в 10 раз больше чем H264
  • Анимированный GIF поддерживает только 256 цветов
  • Формат H264 поддерживают ВСЕ современные браузеры
  • Так как H264 это по сути видео, к нему опционально можно добавить элементы управления: перемотку, паузу.

Я делаю сложные большие статьи с кучей видео, демонстраций функций, анимаций. Совесть не позволяет мне вставлять гифки по 20МБ в статью, потому что это преступление против современных технологий и каналов провайдеров. Поэтому я прошу хабр добавить возможность вставлять H264 с автовоспроизведением БЕЗ звука, при этом скрывать элементы управления плеера.
Total votes 245: ↑222 and ↓23+269
Comments270

Information

Rating
Does not participate
Location
Самара, Самарская обл., Россия
Date of birth
Registered
Activity