• Построение автоматической системы модерации сообщений

      image
      Автоматические системы модерации внедряются в веб-сервисы и приложения, где необходимо обрабатывать большое количество сообщений пользователей. Такие системы позволяют сократить издержки на ручную модерацию, ускорить её и обрабатывать все сообщения пользователей в real-time. В статье поговорим про построение автоматической системы модерации для обработки английского языка с использованием алгоритмов машинного обучения. Обсудим весь пайплайн работы от исследовательских задач и выбора ML алгоритмов до выкатки в продакшен. Посмотрим, где искать готовые датасеты и как собрать данные для задачи самостоятельно.
      Читать дальше →
    • Kaggle и Titanic — еще одно решение задачи с помощью Python

      • Tutorial
      Хочу поделиться опытом работы с задачей известного конкурса по машинному обучению от Kaggle. Этот конкурс позиционируется как конкурс для начинающих, а у меня как раз не было почти никакого практического опыта в этой области. Я немного знал теорию, но с реальными данными дела почти не имел и с питоном плотно не работал. В итоге, потратив пару предновогодних вечеров, набрал 0.80383 (первая четверть рейтинга).



      Читать дальше →
      • +29
      • 66,4k
      • 6
    • Сделай сам: MSc Computer Science на уровне топ американских университетов из дома

        Вступление


        Давно хотел написать статью про образование в Computer Science, но руки не доходили. Решил все-таки это наконец сделать. Итак, о чем пойдет речь? Речь о том, что из себя представляет диплом MSc Computer Science топовых университетов США (во всех подробностях, включая основные курсы, книги и проекты) и как ему соответствовать.

        Почему именно MSc? Это — некая развилка: с одной стороны после MSc — вы уже готовый к жизни инженер (да, речь идет о инженерной подготовке, как мне кажется это самое больное место в нашей системе образования), с другой — можно спокойно идти по пути PhD. Как известно, в PhD программу можно попасть и не особо умея программировать — особенно это касается теоретического Computer Science. С другой стороны найти работу программиста тоже дело не очень сложное, и часто не требует мощного образования. Но достигнув уровня MSc — вы получаете возможность разбираться как во всех новый идеях в Computer Science, так и возможность их воплотить в практику. То есть с одной стороны круто разобраться в каком-нибудь deep learning и сделать в нем что-то новое, а также взять и написать свою операционную систему (кто так сделал?). Причем вы не зажаты в рамки узкой специализации (если конечно продолжаете учиться). То есть вы теперь — универсальный солдат, готовый на все.

        Надеюсь что эта статья будет полезна:
        1. Студентам, которые хотят соответствовать высоким стандартам топ вузов США, или собирающиеся туда в аспирантуру по Computer Science
        2. Профессионалам, которые хотят закрыть «дыры» и пробелы
        3. Может кто-то из преподавателей возьмет на заметку для своих курсов.
        4. Студентам, аспирантам американских вузов — хотелось бы тоже получить фидбэк, особенно касается последних трендов в образовании

        Что же здесь будет написано? Минимум философии и общих мыслей: конкретная программа undergraduate и graduate курсов, конечно из дисциплин наиболее мне близких. Все курсы были лично прочувствованы на собственной шкуре, по этому и пишу. (Я пытался записаться на все интересные курсы, которые были, но мой основной упор — системное программирование, базы данных и искусственный интеллект. Отсюда конечно некий bias, но пытаюсь предложить более-менее универсальную программу).
        Читать дальше →
      • Коллекция ресурсов для frontend и backend разработчиков

          image

          Некий dypsilon выложил на GitHub огромную коллекцию ссылок на ресурсы по веб-разработке, за что ему огромное спасибо.

          Список состоит из ссылок на библиотеки, руководства и статьи.

          Frontend: github.com/dypsilon/frontend-dev-bookmarks
          Backend: gist.github.com/dypsilon/5819528 (много node.js)

          Ссылок много, но все — строго по делу и упорядочены по группам (пример для фронтенда):
          1. Архитектура
          2. Фреймворки
          3. Cross Browser
          4. Cross Device
          5. Паттерны и сниппеты
          6. Манипуляция с DOM
          7. … и многое другое

          matmuchrapna советует еще frontdesk Вячеслава Олиянчука.
          Настоятельно рекомендуется добавить в закладки, а лучше — почитать.