Книга «Машинное обучение»

    image Привет, Хаброжители к нам из типография наконец-то пришла новинка от Хенрика Бринка, Джозефа Ричардса и Марка Февероволофа.

    Эта книга позволит программистам, аналитикам данных, статистикам, специалистам по обработке данных и всем остальным применить машинное обучение к решению реальных задач или хотя бы просто понять, что оно собой представляет. Читатели, не прибегая к глубокому теоретическому изучению конкретных алгоритмов, получат практический опыт обработки реальных данных, моделирования, оптимизации и развертки систем машинного обучения. Для тех, кому интересна теория, мы обсуждаем математическую основу машинного обучения, объясняем некоторые алгоритмы и даем ссылки на материалы для дополнительного чтения. Основной акцент делается на практических результатах при решении поставленных задач.


    Книга предназначена для тех, кто хочет применять машинное обучение к решению различных задач. В ней описываются и объясняются процессы, алгоритмы и инструменты, относящиеся к основным принципам машинного обучения. Внимание акцентируется не на способах написания популярных алгоритмов, а на их практическом применении. Каждый этап построения и использования моделей машинного обучения иллюстрируется примерами, сложность которых варьируется от простого до среднего уровня.

    Структура книги


    Часть I «Последовательность действий при машинном обучении» знакомит с пятью этапами основной последовательности машинного обучения:

    • В главе 1 «Что такое машинное обучение?» рассказывается, что представляет собой машинное обучение и для чего оно нужно.

    • В главе 2 «Реальные данные» подробно рассматриваются характерные стадии подготовки данных для моделей с машинным обучением.

    • Глава 3 «Моделирование и прогнозирование» обучает с помощью распространенных алгоритмов и библиотек созданию простых ML-моделей и генерированию прогнозов.

    • В главе 4 «Оценка и оптимизация модели» ML-модели подробно рассматриваются с целью оценки и оптимизации их производительности.

    • В главе 5 «Основы проектирования признаков» рассказывается о том, как увеличить количество необработанных данных, используя информацию из поставленной перед нами задачи.

    В части II «Практическое применение» вводятся техники масштабирования моделей, а также техники извлечения признаков из текста, изображений и временных рядов, увеличивающие эффективность решения многих современных задач с машинным обучением. Эта часть содержит три главы с практическими примерами.

    • Глава 6 «Пример: чаевые для таксистов» — первая, полностью посвященная рассмотрению примера. Мы попытаемся предсказать шансы таксиста на получение чаевых.

    • Глава 7 «Усовершенствованное проектирование признаков» знакомит с более сложными техниками проектирования признаков, предназначенными для извлечения значений из текстов, изображений и временных рядов.

    • В главе 8 «Пример обработки естественного языка» усовершенствованные техники проектирования признаков используются для предсказания тональности рецензий на фильмы.

    • Глава 9 «Масштабирование процесса машинного обучения» знакомит с техниками, дающими ML-системам возможность работать с большими объемами данных, обеспечивающими более высокую скорость прогнозирования и уменьшающими время их ожидания.

    • В главе 10 «Пример с цифровой рекламой» на большом объеме данных строится модель, предсказывающая вероятность перехода по рекламному баннеру.

    Как читать эту книгу


    Тех, кто пока не имеет опыта в области машинного обучения, главы с 1-й по 5-ю познакомят с процессами подготовки и исследования данных, проектированием признаков, моделированием и оценкой моделей. В примерах кода на языке Python используются такие популярные библиотеки, как pandas и scikit-learn. Главы с 6-й по 10-ю включают в себя три практических примера машинного обучения наряду с такими продвинутыми темами, как проектирование признаков и оптимизация. Так как основная вычислительная сложность инкапсулирована в библиотеках, приведенные фрагменты кода легко адаптировать к вашим собственным ML-приложениям.

    Об авторах


    Хенрик Бринк — специалист по обработке и анализу данных и разработчик программного обеспечения, имеющий огромный практический опыт машинного обучения как в области производства, так и в сфере научной деятельности.

    Джозеф Ричардс — старший научный сотрудник в области прикладной статистики и предсказательной аналитики. Хенрик и Джозеф совместно основали компанию Wise.io, которая занимается разработкой решений с машинным обучением для промышленности.

    Марк Феверолф — основатель и президент компании Numinary Data Science, специализирующейся в области управления данными и предсказательной аналитики. Он работал статистиком и разработчиком аналитических баз данных в области социальных наук, химической инженерии, производительности информационных систем, планирования объема производства, кабельного телевидения и приложений для рекламы в Интернете.

    » Более подробно с книгой можно ознакомиться на сайте издательства
    » Оглавление
    » Отрывок

    Для Хаброжителей скидка 25% по купону — Машинное обучение
    Поделиться публикацией
    Похожие публикации
    Комментарии 27
      +3
      Было бы интересно прочесть эту книгу. Очень хочу научиться применять нейронные сети и машинное обучение для разного рода задач как в стартапах так и в быту.
        0
        в быту?
          0
          Я об «умном доме» говорил. Естественно целый дом делать «умным» я не хочу, но вот истории подобны этой — вдохновляют и каждый наверняка найдёт, что бы он автоматизировал в своём быту (необязательно дома кстати).
        0
        Уже купил.
          +2
          Сделал заказ, где скачать так и не нашел, написал в поддержку, в почте ссылка на заказ есть, но в личном кабинете заказов нет. Просьба сделать сайт человеческим.
            0

            Да там вcё не очевидно сделано. Мне в итоге прямо на почту ссылка пришла.

            +6
            Хотел как-то купить книгу, но не понял, зачем вам мой номер телефона?
              0
              спам рассылать
              +1
              Оплатил, купил книгу, а ссылки на скачивание нет!
              Почему по почте не пришла ссылка?
              Как вообще получить оплаченный товар?
                0
                По телефону издательства (800)500-42-17 никто не отвечает, либо сбрасывают трубку.
                Что вообще происходит?
                  0
                  Надеюсь, что мои улетевшие в трубу 412 руб. были последними деньгами, которые вы получили.
                  Не рекомендую никому покупать книги у издательства «Питер»
                  «Почитал», блин, книжку :(
                +2
                Ау, «Питер»!
                Почему в 2017-м году приходится оплаченный товар на вашем сайте искать через помощь на хабре?
                Я оплатил, но ничего не получил, в обратной связи обращения уходят в никуда, нет истории переписки.
                Сильно попахивает лохотроном.
                У вас сайт фрилансеры на коленке делали что ли?
                Чтобы я ещё раз у вас что-то заказал? Никогда!
                  +3

                  Купил у них уже около 5 книг. Мне все ссылки на почту приходили, возможно у них проблема с отправкой почты на Ваш ящик. У меня ящик на gmail, с ним проблем нету.


                  Тут не "лохотрон" а идеализированное представление о доставке контента через электронную почту. :)

                    –2
                    А я больше ни одной книги у них не куплю. Это была первая «покупка» и последняя.
                    Заметьте, даже здесь они не отвечают.
                    Как и на телефоны, по обратной связи и. т.д.
                    Поэтому при первой же проблеме вы ничего решить не сможете.
                    Задумайтесь — а оно вам надо, рисковать так?
                      –2
                      Вот, дозвонился по вышеуказанному номеру телефона.
                      Проблему решили, книгу получил.
                        +3

                        И стоило устраивать истерику в коментариях, когда вашу проблему решили за 2 часа? :-)
                        Не быстро, конечно, но все равно довольно неплохо для интернет торговли...

                    0
                    Попробуйте поискать в спаме. Бывает, что письмо попадает в нежелательный список. Если почтовый адрес правильно указали, то только в этом проблема. «Питер» ни разу не обманывал меня, да и смысла в этом не вижу абсолютно.
                    +2
                    Купил, бегло пролистал и начал читать. Если вы хотите увидеть in-depth разбор чего-то про ML, то эта книга явно плохой выбор. Здесь всё очень поверхностно с упором на то, «что писать, куда смотреть», и с желанием охватить побольше тем.

                    И ещё хотелось бы, чтобы вы как-то поменяли схему работы с курьерской доставкой в Москву. Дважды заказывал книги и дважды курьер приезжал совершенно без предупреждений. Один раз ему повезло застать меня дома. Второй раз — нет, и пришлось переназначать встречу. Крайне неудобно.
                      0
                      Спасибо, написали в личку для уточнения.
                        0
                        А может Вы всё же отправляете и за границу, в страны Европа? Иначе придётся заказать через какой-нибудь интернет магазин и соответственно без скидки.
                          0
                          Отправляем, любой почтовой службой, правда доставка очень дорогая будет. Напишите на сайте или сюда в личку город. Рассчитаем.
                      +1
                      Всегда было интересно, почему именно язык питон ассоциируется с машинным обучением, что в этом языке такого магического? (опыта программирования на питоне не имею)
                        0
                        1. Питон за счёт нестрогой типизации и многих других вольностей позволяет очень быстро готовить данные, а правильно препарированные данные — немалая часть успеха в ML.

                        2. Есть такая штука, как IPython Notebook — интерактивная среда, где можно очень быстро экспериментировать без необходимости компиляции программы каждый раз.

                        Эти два фактора и сделали Питон де-факто стандартом для аналитика данных. Дальше всё обросло зрелыми и быстрыми библиотеками для машинного обучения и сделало Python лидером в ML.
                          0
                          А что насчет lua? Ведь он тоже нестрого типизированный язык. Так же, на сколько я понял — самый быстрый скриптовой язык. Тогда почему именно Питон? Не считая вашу штуку, как IPython Notebook, не особо понятен хайп, сложивший вокруг него.
                            0
                            У них разная специализация. В базовый комплект Lua не входит почти ничего, т.к. он задумывался как встраиваемый язык с тем, чтобы быстро накидать алгоритм и дёрнуть внешний API. У Python нет таких ограничений — в комплекте поставки очень богатая стандартная библиотека для решения всех «бытовых» задач.

                            И, конечно, 1-based индексация массивов это какой-то ад.

                            >> не особо понятен хайп, сложивший вокруг него

                            Когда-то был сделан выбор в пользу Python, и он оброс таким количеством библиотек для ML, что альтернативы на сегодняшний день просто нет. Можно, конечно, привести в пример R, но он уже уступает по популярности, особенно с популяризацией нейронок и библиотек под них.
                      • НЛО прилетело и опубликовало эту надпись здесь
                          0

                          Эх, жаль что на питоне вся практическая часть ...

                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                          Самое читаемое