Добрый день, уважаемые читатели.
В прошлых статьях, на практических примерах, мной были показаны способы решения задач классификации (задача кредитного скоринга) и основ анализа текстовой информации (задача о паспортах). Сегодня же мне бы хотелось коснуться другого класса задач, а именно восстановления регрессии. Задачи данного класса, как правило, используются при прогнозировании.
Для примера решения задачи прогнозирования, я взял набор данных Energy efficiency из крупнейшего репозитория UCI. В качестве инструментов по традиции будем использовать Python c аналитическими пакетами pandas и scikit-learn.
Многие материалы по нейронным сетям сразу начинаются с демонстрации довольно сложных архитектур. При этом самые базовые вещи, касающиеся функций активаций, инициализации весов, выбора количества слоёв в сети и т.д. если и рассматриваются, то вскользь. Получается начинающему практику нейронных сетей приходится брать типовые конфигурации и работать с ними фактически вслепую.
В статье мы пойдём по другому пути. Начнём с самой простой конфигурации — одного нейрона с одним входом и одним выходом, без активации. Далее будем маленькими итерациями усложнять конфигурацию сети и попробуем выжать из каждой из них разумный максимум. Это позволит подёргать сети за ниточки и наработать практическую интуицию в построении архитектур нейросетей, которая на практике оказывается очень ценным активом.
Этим постом мы завершаем серию лекций с Data Fest. Одним из центральных событий конференции стал доклад Дмитрия Ветрова — профессора факультета компьютерных наук НИУ ВШЭ. Дмитрий входит в число самых известных в России специалистов по машинному обучению и, начиная с прошлого года, работает в Яндексе ведущим исследователем. В докладе он рассказывает об основах байесовского подхода и объясняет, какие преимущества дает этот подход при использовании нейронных сетей.
Думаю многие из нас, хотя бы однажды интересовались искусственным интеллектом и нейронными сетями. В теории нейронных сетей далеко не последнее место занимает факторный анализ. Он призван выделить так называемые скрытые факторы. У этого анализа есть много методов. Особняком стоит метод главных компонент, отличительной особенностью которого является полное математическое обоснование. Признаться честно, когда я начал читать статьи по приведенным выше ссылкам — стало не по себе от того, что я ничего не понимал. Мой интерес поутих, но, как это обычно бывает, понимание пришло само по себе, нежданно-негаданно.
Революция Искусственного интеллекта — путь к Супер-интеллекту
Это перевод статьи, написанной Тимом Урбаном, автором блога www.waitbutwhy.com. После прочтения у меня зашевелились волосы на голове от желания с кем-то обсудить эту статью, но на русском ее прочитать негде, поэтому я без устали пересказывал всем своим друзьям. Прочитайте — это круто!
Примечание: причина, по которой на написание этого поста ушло три недели, состоит в том, что разбираясь в теме, я просто не мог поверить в то, что читал. Довольно быстро я понял, что, то, что происходит в мире Искусственного Интеллекта — это не просто важно, а ЧРЕЗВЫЧАЙНО важно для нашего будущего. Я захотел узнать об этом как можно больше, а узнав, решил написать пост, который бы смог объяснить ПОЧЕМУ это все настолько важно. Чтобы не пугать вас длинной этого текста, я разбил его на две части. Это часть 1.
Мы стоим на пороге перемен, сопоставимых с появлением человеческой жизни на Земле. Вернор Виндж