Как стать автором

Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

anastasiagrishina 16 дек 2016 в 10:53

Как мы запускали программу Deep Learning

8 мин

11K

Блог компании New Professions LabBig Data * Data Mining * Машинное обучение *

Хабр, привет.

Как вы знаете, для обучения глубоких нейронных сетей оптимально использовать машины с GPU. Наши образовательные программы всегда имеют практический уклон, поэтому для нас было обязательно, чтобы во время обучения у каждого участника была своя виртуальная машина с GPU, на которой он мог решать задачи во время занятий, а также лабораторную работу в течение недели. О том, как мы выбирали инфраструктурного партнера для реализации наших планов и подготавливали среду для наших участников, и пойдет речь в нашем посте.

Читать дальше →

+6

AlexeyR 15 дек 2016 в 21:17

Логика сознания. Часть 9. Искусственные нейронные сети и миниколонки реальной коры

26 мин

55K

Программирование * Алгоритмы * Обработка изображений * Машинное обучение * Робототехника

Приходит ветеринар к терапевту. Терапевт: — На что жалуетесь? Ветеринар: — Нет, ну так каждый может!

Искусственные нейронные сети способны обучаться. Воспринимая множество примеров, они могут самостоятельно находить в данных закономерности и выделять скрытые в них признаки. Искусственные нейронные сети во многих задачах показывают очень неплохие результаты. Закономерный вопрос — насколько нейронные сети похожи на реальный мозг? Ответ на этот вопрос важен главным образом для того, чтобы понять, можно ли, развивая идеологию искусственных нейронных сетей, добиться того же, на что способен человеческий мозг? Важно понять, носят ли различия косметический или идеологический характер.

Как это ни удивительно, но очень похоже, что реальный мозг противоречит всем базовым принципам искусственных нейронных сетей. Это вдвойне удивительно, учитывая, что изначально искусственные нейронные сети создавались как попытка воспроизвести именно биологические механизмы. Но в том и коварство подобных ситуаций. Очень часто то, что на первый взгляд выглядит правдоподобно, на поверку оказывается полной противоположностью того, что есть на самом деле.

Читать дальше →

+37

m31 15 дек 2016 в 10:30

Вебинар: Введение в Data Science

1 мин

6.2K

Блог компании FlyElephantBig Data * Data Mining * Высоконагруженные системы * Машинное обучение *

Команда FlyElephant приглашает всех 21 декабря в 18.00 (EET) на вебинар «Введение в Data Science». В его рамках мы рассмотрим на примерах, что такое Data Science, Data Mining, Machine Learning и Deep Learning, кто такой data scientist и какими инструментами он пользуется для сбора, хранения, обработки и визуализации данных. Поговорим о платформе FlyElephant и чем она может быть полезна для работы data scientist’а.

Зарегистрироваться на вебинар можно здесь.

+13

imalion 15 дек 2016 в 07:55

Яндекс использовал нейросеть и научился прогнозировать осадки с точностью до минут

6 мин

62K

Блог компании ЯндексМашинное обучение * Математика * Алгоритмы *

Сегодня я вновь хотел бы поговорить с вами о погоде. Вновь — потому что почти год назад мы уже о ней разговаривали: я рассказал про нашу технологию построения прогнозов Метеум, основанную на метеомоделировании и машинном обучении. Теперь я хочу поговорить не о той погоде, которая будет завтра, на следующей неделе или в новогоднюю ночь, — а о той, которая уже установилась за окном, и о той, которая наступит в ближайшие несколько часов.

Под катом я расскажу о том, что такое наукастинг и как мы над ним работали.

Читать дальше →

+108

Indexator 14 дек 2016 в 17:32

Создайте свои собственные “Нейронные Картины” с помощью Глубокого Обучения

3 мин

21K

Open source * Машинное обучение *

Туториал

Перевод

Нейронные сети могут делать много разных вещей. Они могут понимать наши голоса, распознавать изображения и переводить речь, но знаете ли вы, что еще они умеют рисовать? Изображение сверху демонстрирует некоторые сгенерированные результаты применения нейронного рисования.

Сегодня я собираюсь познакомить вас с тем как это делается. Прежде всего, убедитесь, что у вас обновленная копия Ubuntu (14.04 — та, что использовал я). Вам необходимо иметь несколько гигов свободного пространства на жестком диске и в оперативной памяти, хотя бы не менее 6 GB (больше оперативки для больших выводимых разрешений). Для запуска Ubuntu как виртуальной машины, вы можете использовать Vagrant вместе с VirtualBox.

Читать дальше →

+34

mnv 14 дек 2016 в 11:50

Синтаксический анализ текстов с помощью SyntaxNet

4 мин

39K

Машинное обучение * Алгоритмы * Python * PHP * Программирование *

Для одной из задач мне понадобился синтаксический анализатор русскоязычных текстов. Что это такое. Например, у нас есть предложение «Мама мыла раму». Нам нужно получить связи слов в этом предложении в виде дерева:

Из этого дерева понятно, что связаны слова «мама» и «мыла», а также «мыла» и «раму», а слова «мама» и «раму» напрямую не связаны.

Статья будет полезна тем, кому понадобился синтаксический анализатор, но не понятно, с чего начать.

Я занимался этой темой несколько месяцев назад, и на тот момент нашел не много информации по поводу того, где бы взять готовый и желательно свободный анализатор.

Читать дальше →

+29

Schvepsss 13 дек 2016 в 13:10

Как выбирать алгоритмы для машинного обучения Microsoft Azure

12 мин

36K

Блог компании MicrosoftМашинное обучение * Алгоритмы * Microsoft Azure *

Перевод

В статье вы найдете шпаргалку по алгоритмам машинного обучения Microsoft Azure, которая поможет вам выбрать подходящий алгоритм для ваших решений предиктивной аналитики из библиотеки алгоритмов Microsoft Azure. А также вы узнаете, как ее использовать.

Читать дальше →

+24

anastasiagrishina 12 дек 2016 в 09:15

Предсказание тяжести страховых требований для компании Allstate. Дипломный проект нашего выпускника

26 мин

10K

Блог компании New Professions LabBig Data * Data Mining * Машинное обучение *

Хабр, привет! Наш выпускник 4-го набора программы «Специалист по большим данным» Кирилл Данилюк поделился своим исследованием, которое он выполнил в качестве финального проекта в одном из курсов. Вся документация и описание есть на его гитхабе. Здесь же мы приводим перевод его отчета. Осторожно — лонгрид.

Читать дальше →

+13

itmo 12 дек 2016 в 07:50

Дайджест Университета ИТМО: Подборка ресурсов по искусственному интеллекту

5 мин

9.7K

Блог компании ИТМОПрограммирование * Машинное обучение * Анализ и проектирование систем * Разработка под e-commerce *

Искусственный интеллект оброс большим количеством мифов, обещающих страшные полуфантастические сценарии. Поэтому мы решили составить подборку (прошлый выпуск нашего дайджеста о резидентах наших акселераторов) надежных источников не только об этой области и ее истории, но и о перспективных направлениях развития и конкретных исследованиях, проводящихся как в России, так и за рубежом.

Читать дальше →

+18

unlocker 8 дек 2016 в 19:53

Нелинейная регрессия в Apache Spark. Разрабатываем своими руками

11 мин

7.1K

Big Data * Scala * Машинное обучение *

Туториал

При решении задач обработки сигналов часто применяют метод аппроксимации сырых данных моделью регрессии. Исходя из структуры, модели можно разделить на три типа – линейные, сводящиеся к линейным и нелинейные. В модуле машинного обучения «Spark ML» Apache Spark функционал для первых двух типов представлен классами LinearRegression и GeneralizedLinearRegression соответственно. Обучение нелинейных моделей в стандартной библиотеке не представлено и требует самостоятельной разработки.

Читать дальше →

+16

The_Freeman 7 дек 2016 в 17:42

Оптимальная аппроксимация сплайнами

5 мин

56K

Алгоритмы * Data Mining * Машинное обучение * Математика *

Туториал

Пусть нам дан набор точек

и соответствующий им набор положительных весов

. Мы считаем, что некоторые точки могут быть важнее других (если нет, то все веса одинаковые). Неформально говоря, мы хотим, чтобы на соответствующем интервале была проведена красивая кривая таким образом, чтобы она «лучше всего» проходила через эти данные.

Под катом находится алгоритм, раскрывающий, каким образом сплайны позволяют строить подобную красивую регрессию, а также его реализация на Python:

Читать дальше →

+37

Jabher 7 дек 2016 в 10:21

Нейронные сети на JS. Создавая сеть с нуля

8 мин

92K

Блог компании EPAMJavaScript * Алгоритмы * Машинное обучение * Программирование *

КПДВ про нейронные сети

Нейронные сети сейчас в тренде. Каждый день мы читаем про то, как они учатся писать комментарии в интернете, торговаться на рынках, обрабатывать фотографии. Список бесконечен. Когда я впервые посмотрел на масштаб кода, который приводит это в движение, я был напуган и хотел больше не видеть эти исходники.

Но врожденные любознательность и энтузиазм довели меня до того, что я стал одним из разработчиков Synaptic — проекта фреймворка для построения нейронных сетей на JS с 3к+ звезд на GitHub. Сейчас мы с автором фреймворка занимаемся созданием Synaptic 2.0 с ускорением на GPU и WebWorker-ах и с поддержкой почти всех основных фич любого приличного NN-фреймворка.

В итоге оказалось, что нейронные сети — это несложно, они работают на достаточно простых принципах, которые несложно понять и воспроизвести. Самая трудная задача — это обучение, но для этого почти всегда пользуются готовыми алгоритмами, а скопировать их не очень сложно.
Доказать это просто. Ниже в статье реализация нейронной сети с нуля без каких-либо библиотек.

Читать дальше →

+48

m31 7 дек 2016 в 08:11

Опрос Data Science Tools

1 мин

3.8K

Блог компании FlyElephantМашинное обучение * Высоконагруженные системы * Big Data *

Хабр, привет! Хочу пригласить всех дата сайентистов принять участие в небольшом опросе об инструментах, которые вы используете в своей работе. Результаты опроса обязательно опубликуем в нашем блоге.

+16

ImBoo 7 дек 2016 в 07:58

Формула доверия

8 мин

8.1K

Блог компании СоларМашинное обучение * Математика * Информационная безопасность * Data Mining *

Сегодня мы расскажем об одной из ключевых фишек нашей DLP-системы — уровне доверия. Это показатель, который присваивается каждому человеку в компании и отражает вероятность того, что данный сотрудник окажется нарушителем.

Сейчас в DLP-решениях на первый план выходит аналитика. Пару лет назад все российские вендоры стали понемногу пытаться «разворачивать» DLP-системы от борьбы с утечками в сторону выявления и предотвращения других нелегитимных действий сотрудников — мошенничества, откатов, сговоров и т.п. Однако каждый человек генерирует такое количество информации в день, что отслеживать действия каждого невозможно даже в средних компаниях, не говоря о крупном бизнесе. Поэтому способность системы сделать качественную аналитику в автоматическом режиме и очертить круг лиц «под подозрением» была бы очевидным преимуществом. Так возникла идея создания уровня доверия, основной целью которого была прозрачность ситуации с внутренними угрозами в компании.

Читать дальше →

+14

alex4321 5 дек 2016 в 11:25

Бот для telegram с состоянием в СУБД и классификацией текста

7 мин

15K

Машинное обучение *

Т.к. мой классификатор из прошлого поста таки работает (впрочем, параметры «из коробки» не всегда удачны, потому я вынес возможность слегка настроить Conv1d-слои и скрытый слой) — я решил прикрутить его к боту. Да, запоздал я на этот хайп ) Кстати, заранее уточню, что прикрутить русский я пока таки не пробовал, хотя это не должно стать проблемой — в nltk поддерживаются нужные фичи, обучение word2vec концептуально не отличается от английского, да и предобученные модели вроде бы имеются.

Ну и сходу возникают вопросы:

под какие платформы его пилить — пока решил остановиться на telegram. В теории — конструкция позволяет легко дописать обертки для других платформ (как будто он кому-то понадобится )
как описывать «сценарий». Навелосипедил свою структуру с классами и сущностями поверх YAML
ну и неплохо бы хранить ботов/состояние в какой-нибудь БД

Читать дальше →

+12

TimKruz 5 дек 2016 в 06:53

МСУИИ AmigaVirtual — универсальный ИИ для каждого

14 мин

5.7K

Delphi * Машинное обучение * Программирование *

Из песочницы

Логотип

Привет всем любителям и исследователям искусственного интеллекта! В данной статье я хотел бы рассказать об интересном проекте: модульной системе универсального искусственного интеллекта (МСУИИ) «Amiga Virtual» (AV, «Виртуальная Подружка»). Я расскажу об основных принципах её работы и опишу некоторые детали реализации, а самые любопытные смогут исследовать все исходные коды. Разработка ведётся на Delphi, но модули теоретически могут быть написаны на любом ЯП. Данная система будет интересна как конечным пользователям чат-ботов и связанных с ними систем, так и разработчикам ИИ — ведь на её основе можно разработать практически любой тип ИИ.

Читать дальше →

+7

Leono 4 дек 2016 в 15:53

Порождение и выбор моделей машинного обучения. Лекция в Яндексе

11 мин

23K

Блог компании ЯндексАлгоритмы * Занимательные задачкиМатематика * Машинное обучение *

Применение машинного обучения может включать работу с данными, тонкую настройку уже обученного алгоритма и т. д. Но масштабная математическая подготовка нужна и на более раннем этапе: когда вы только выбираете модель для дальнейшего использования. Можно выбирать «вручную», применяя разные модели, а можно и этот процесс попробовать автоматизировать.

Под катом — лекция ведущего научного сотрудника РАН, доктора наук и главного редактора журнала «Машинное обучение и анализ данных» Вадима Стрижова, а также большинство слайдов.

+48

snowman647 2 дек 2016 в 14:44

Как создать торгового робота с помощью генетического программирования

15 мин

34K

Алгоритмы * Программирование * Машинное обучение *

Из песочницы

Доброго времени суток. В этой статье расскажу о создании системы в которой генетические алгоритмы пишут роботов. В теории эти роботы могли бы торговать на бирже.

Я фанат трех вещей — искусственного интеллекта, высокопроизводительных машин и практического применения любых знаний. Имея некоторое свободное время, я спроектировал небольшую задачку, приобрел железо и сел творить.

Проект возник из желания попробовать на практике генетическое программирование. Первым вариантом было создавать бота к какой-нибудь игре, но я остановился на торговых роботах, где биржа тоже своего рода игра.

Читать дальше →

+25

anastasiagrishina 1 дек 2016 в 10:42

Как мы участвовали в HR-хакатоне. Наши выпускники делятся своим решением и впечатлениями от участия

7 мин

5.2K

Блог компании New Professions LabBig Data * Data Mining * Машинное обучение *

Всем привет!

23-24 ноября в Digital October проходил хакатон по анализу данных в HR-сфере, в котором победила команда выпускников нашей программы "Специалист по большим данным". Кирилл Данилюк, Игорь Парфенов, Егор Андреев и Александр Иваночкин делятся своим решением и впечатлениями от участия.

Читать дальше →

+12

Schvepsss 29 ноя 2016 в 14:56

Deep Learning: Cочетание глубокой сверточной нейронной сети с рекуррентной нейронной сетью

6 мин

23K

Блог компании MicrosoftОбработка изображений * Машинное обучение * Алгоритмы *

Перевод

Представляем вам завершающую статью из цикла по Deep Learning, в которой отражены итоги работы по обучению ГСНС для изображений из определенных областей на примере распознавания и тегирования элементов одежды. Предыдущие части вы найдете под катом.

Читать дальше →

+25

1 2 ...

415

416 417 ...