• Kaggle-подходы для CV в проде: внедрить нельзя выпилить

      Среди дата сайнтистов ведется немало холиваров, и один из них касается соревновательного машинного обучения. Действительно ли успехи на Kaggle показывают способности специалиста решать типичные рабочие задачи? Арсений arseny_info (R&D Team Lead @ WANNABY, Kaggle Master, далее в тексте A.) и Артур n01z3 (Head of Computer Vision @ X5 Retail Group, Kaggle Grandmaster, далее в тексте N.) отмасштабировали холивар на новый уровень: вместо очередного обсуждения в чате взяли микрофоны и устроили публичное обсуждение на митапе, по мотивам которого и родилась эта статья.
      Читать дальше →
      • +52
      • 9,8k
      • 4
    • Открытый курс машинного обучения. Тема 6. Построение и отбор признаков

        Сообщество Open Data Science приветствует участников курса!


        В рамках курса мы уже познакомились с несколькими ключевыми алгоритмами машинного обучения. Однако перед тем как переходить к более навороченным алгоритмам и подходам, хочется сделать шаг в сторону и поговорить о подготовке данных для обучения модели. Известный принцип garbage in – garbage out на 100% применим к любой задаче машинного обучения; любой опытный аналитик может вспомнить примеры из практики, когда простая модель, обученная на качественно подготовленных данных, показала себя лучше хитроумного ансамбля, построенного на недостаточно чистых данных.


        UPD: теперь курс — на английском языке под брендом mlcourse.ai со статьями на Medium, а материалами — на Kaggle (Dataset) и на GitHub.



        Читать дальше →
      • Ускорение Python-скриптов без приложения умственных усилий

          Одно из распространенных применений Python — небольшие скрипты для обработки данных (например, каких-нибудь логов). Мне часто приходилось заниматься такими задачами, скрипты обычно были написаны наспех. Вкупе с моим слабым знанием алгоритмов это приводило к тому, что код получался далеко не оптимальным. Это меня ничуть ни расстраивало: лишняя минута выполнения не сделает погоды.

          Ситуация немного изменилась, когда объем данных для обработки вырос. И после того, как время выполнения очередного скрипта перевалило за сутки, я решил уделить немного времени оптимизации — все-таки хотелось бы получить результат до того, как он потеряет актуальность. В рамках этой статьи я не планирую говорить о профилировании, а затрону тему компиляции Python-кода. При этом обозначу условие: варианты оптимизации не должны быть требовательными к времени разработчика, а, напротив, быть дружественными к «пыщ-пыщ и в продакшен».
          Читать дальше →
          • +9
          • 22,6k
          • 2
        • Как я повышал конверсию машинным обучением

            В этой статье я попробую ответить на такие вопросы:
            • может ли один доклад умного человека сделать другого человека одержимым?
            • как окунуться в машинное обучение (почти) с нуля?
            • почему не стоит недооценивать многоруких бандитов?
            • существует ли серебряная пуля для a/b тестов?

            Ответ на первый вопрос будет самым лаконичным — «да». Услышав это выступление bobuk на YaC/M, я восхитился элегантностью подхода и задумался о том, как бы внедрить похожее решение. Я тогда работал продуктовым менеджером в компании Wargaming и как раз занимался т.н. user acquisition services – технологическими решениями для привлечения пользователей, в число которых входила и система для A/B тестирования лендингов. Так что зерна легли на благодатную почву.

            К сожалению, по всяким причинам я не мог плотно заняться этим проектом в обычном рабочем режиме. Зато когда я слегка перегорел на работе и решил устроить себе длинный творческий отпуск, одержимость превратилась в желание сделать такой сервис умной ротации лендингов самостоятельно.
            Читать дальше →
          • Product management: от неплохой идеи к уместной фиче

              Product manager – позиция неоднозначная. На постсоветском пространстве еще не сложилось полноценной культуры управления продуктом, хотя продуктовых компаний уже в общем-то немало. «Продактами» становятся бывшие бизнес-аналитики, проектные менеджеры, маркетологи и другие специалисты, каждый из которых по-своему подходит к своим новым задачам. Я хотел бы поделиться несколькими тезисами о работе с новыми фичами продукта, которые кажутся важными с моей колокольни.

              image
              Это тоже в своем роде управление продуктами, но речь пойдет о другом.

              Disclaimer:

              Едва ли хоть что-то из сказанного ниже может являться универсальным советом. Я в основном занимаюсь сервисами, с которыми практически не сталкивается пользователь, что накладывает своеобразный отпечаток на работу и те правила, которыми я руководствуюсь.
              Читать дальше →
              • +12
              • 13,6k
              • 7
            • Указ №60 и Открытое письмо Президенту РБ

                image Основная тема для бурных обсуждений белорусских интернетчиков — это Указ №60 и смежные постановления, госрегистрация сайтов и другие странности. Мы все понимаем нелепость и бесполезность отдельных положений. Понимают ли госчиновники? Честно говоря, я не вполне уверен.

                Уважаемый мной человек, учредитель веб-студии «Интернет-маркетинг», подготовил разумное открытое письмо Президенту, в котором описаны видимые слабые места указа. Это открытое письмо было размещено на специально созданном сайте, где каждый желающий может подписаться под письмом. После сбора подписей коллективное обращение будет отправлено заказным письмом в Администрацию Президента.

                Если вы считаете, что это может что-то изменить, или вам просто не лень написать свое имя под текстом (конечно, при условии, что вы разделяете несогласие с основными положениями указа), добро пожаловать на сайт ukaz60.net, вот непосредственно Открытое письмо Президенту Республики Беларусь.

                P.S. Специально для скептиков: ни я, ни автор письма не отличаемся наивностью и не были замечены в розовых очках. Однако мы считаем, что даже такая инициатива с низким шансом на успех всяко лучше бездействия.
                Читать дальше →
              • Кому нужен шум о белорусском провайдинге?

                  Говорить о провайдинге в Беларуси можно в любое время, независимо от веяний на рынке и объективных тенденций. Исторически так сложилось, что рынок, существующий под прессом государственной монополии, развивается неравномерно и медленно, а пользователи готовы сорваться с цепи, как только в разговоре промелькнет слово «Белтелеком», «анлим» или что-нибудь еще, напрямую увязанное с местным миром телекоммуникаций.

                  Соответственно, хватает малейшей искры, чтобы взвилось серьезное пламя. На этот раз не просто искрой, а спичкой послужила публикация небезывестного IT-аналитика fed на его сайте Electroname.com. Злободневный текст о «катастрофическом» положении провайдеров разошелся по Байнету за полдня, осев и на оппозиционной «Хартии», и в тематическом разделе гиковского «Хабрахабра», и в тематическом ЖЖ-сообществе by_providers. Огонь даже не понадобилось раздувать – народ, недовольный политикой государственного оператора электросвязи и завистливо поглядывающий на значительно более либеральные тарифы в соседних государствах, начал осыпать «Белтелеком» разнообразными проклятиями, не особенно задумываясь над фактами.
                  Читать дальше →
                • Миниконференция «Хостинг для владельцев сайтов» состоялась

                    Недавно я публиковал на Хабре анонс мини-конференции по хостингу.

                    Мини-конференция довольно-таки успешно состоялась. С докладами выступили представители компаний Microsoft Ukraine, RedGraphic и NivalNetwork. В зале Университета Культуры собралось более 70 специалистов.
                    Читать дальше →
                  • Миниконференция «Хостинг для владельцев сайтов»

                      28 марта (в эту субботу) в Минске состоится миниконференция «Хостинг для владельцев сайтов».

                      Докладчики:
                      1. Роман Шатерник, технический директор RedGraphic, «Перенос сайта: работа над ошибками».
                      2. Игорь Шаститко, ITPro Evangelist, Microsoft Ukraine, «Обзор технологий веб-платформы Microsoft».
                      3. Сергей Караткевич, Nival Network, системный администратор, «Cloud хостинг. Особенности реализации и перспективы развития».

                      Место проведения: Минск, Рабкоровская 17, (здание Университета Культуры и Искусств, метро «институт культуры»), 28 марта. Начало мероприятия в 10.45.

                      По этой ссылке можно зарегистрироваться.