Статьи / Закладки / Профиль stuurmann / Хабр

Все потоки

@stuurmann^{read⁠-⁠only}

Machine Learning Researcher

ПрофильЗакладки77

io_io 18 авг 2015 в 12:08

Как легко понять логистическую регрессию

5 мин

250K

Блог компании .ioBig Data * Анализ и проектирование систем * Машинное обучение *

Туториал

Перевод

Логистическая регрессия является одним из статистических методов классификации с использованием линейного дискриминанта Фишера. Также она входит в топ часто используемых алгоритмов в науке о данных. В этой статье суть логистической регрессии описана так, что она станет понятна даже людям не очень близким к статистике.

Читать дальше →

+12

m1rko 30 окт 2018 в 10:18

Генерация произвольных реалистичных лиц с помощью ИИ

10 мин

54K

Open source * Машинное обучение * Обработка изображений *

Перевод

Контролируемый синтез и редактирование изображений с использованием новой модели TL-GAN

Пример контролируемого синтеза в моей модели TL-GAN (transparent latent-space GAN, генеративно-состязательная сеть с прозрачным скрытым пространством)

Весь код и онлайн-демо доступны на странице проекта.

Читать дальше →

+58

N01Z3 13 сен 2018 в 11:05

Пицца аля-semi-supervised

6 мин

9.4K

Блог компании Open Data SciencePython * Машинное обучение * Обработка изображений *

В этой статье я бы хотел рассказать про некоторые приемы работы с данными при обучении модели. В частности, как натянуть сегментацию объектов на ббоксы, а также как обучить модель и получить разметку датасета, разметив всего несколько сэмплов.

Читать дальше →

+28

Siarshai 4 янв 2017 в 11:18

Методы оптимизации нейронных сетей

17 мин

245K

Алгоритмы * Математика * Машинное обучение *

В подавляющем большинстве источников информации о нейронных сетях под «а теперь давайте обучим нашу сеть» понимается «скормим целевую функцию оптимизатору» лишь с минимальной настройкой скорости обучения. Иногда говорится, что обновлять веса сети можно не только стохастическим градиентным спуском, но безо всякого объяснения, чем же примечательны другие алгоритмы и что означают загадочные $\inline \beta$ и $\inline \gamma$ в их параметрах. Даже преподаватели на курсах машинного обучения зачастую не заостряют на этом внимание. Я бы хотел исправить недостаток информации в рунете о различных оптимизаторах, которые могут встретиться вам в современных пакетах машинного обучения. Надеюсь, моя статья будет полезна людям, которые хотят углубить своё понимание машинного обучения или даже изобрести что-то своё.

Под катом много картинок, в том числе анимированных gif.

Читать дальше →

+78

siberiano 23 мар 2012 в 13:33

Перестаньте писать классы

9 мин

190K

Python * Проектирование и рефакторинг *

Фото Джэка Дидриха из профиля на G+

Признак того, что объект не должен быть классом — если в нём всего 2 метода, и один из них — инициализация, __init__. Каждый раз видя это, подумайте: «наверное, мне нужна просто одна функция».

Каждый раз когда из написанного класса вы создаёте всего один экземпляр, используете только раз и тут же выбрасываете, следует думать: «ой, надо бы это отрефакторить! Можно сделать проще, намного проще!»

Перевод доклада Джэка Дидриха, одного из ключевых разработчиков языка Питон. Доклад прозвучал 9 марта 2012 на конференции PyCon US.

Читать дальше →

+178

exeditor 3 мар 2012 в 14:26

Машины без водителей — перекрёстки без светофоров

2 мин

13K

Искусственный интеллект

Питер Стоун — доцент Техасского университета в Остине, специалист по искусственному интеллекту и многоагентным системам занимается моделированием дорожного движения с учетом широкого распространения автомобилей под управлением компьютера. Стоун считает, что машины-роботы способны сделать транспортную систему намного более эффективной. “Каждым перекрёстком — говорит Стоун — должен управлять автономный интеллектуальный агент, регулирующий режим движения каждого автомобиля индивидуально, а не светофор, запрещающий или разрешающий движение всего потока”.

Читать дальше →

+106

AlexSerbul 25 мая 2018 в 17:27

Bigdata, машинное обучение и нейросети – для руководителей

11 мин

16K

Блог компании Битрикс24Big Data * Машинное обучение *

Если менеджеру попытаться разобраться в этой области и получить конкретные бизнес-ответы, то, скорее всего, страшно заболит голова и екнет сердце от ощущения ежеминутно упускаемой выгоды.

"AlphaGo обыграл чемпиона по Go" впервые за всю историю человечества, скоро наши улицы заполонят беспилотные автомобили, распознавание лиц и голоса теперь в порядке вещей, а в квартиру к нам завтра постучатся AI-секс-куклы с грудью наивысшего размера с шампанским под мышкой и настраиваемым уровнем интенсивности и продолжительности оргазма.

Все оно так, но что делать-то прямо сейчас. Как на этом заработать в краткосрочной перспективе? Как заложить прочный фундамент на будущее?

Постараюсь дать исчерпывающие ответы на все мучающие вас вопросы, «вскрыть» подводные камни и, главное — здраво оценить риски в AI и научиться ими правильно управлять. Ведь то, что не понимаем, то и не “танцуем”.

Читать дальше →

-2

JuliaKoroleva 1 июн 2018 в 07:54

ТОП 8 книг, которые стоит прочитать этим летом

5 мин

28K

Блог компании TS SolutionBig Data * Информационная безопасность * Серверное администрирование * Читальный зал

Добрый день, уважаемые хабровчане!

Поздравляем вас с первым днем лета! Лето – это время отдыха, но важно провести его еще и с пользой. Сегодня мы хотим отойти немного от нашей стандартной темы анализа данных в Splunk и представить вам на обозрение список книг, которые, по нашему мнению, стоит прочитать этим летом, если вы хотите быть на волне последних тенденций и трендов, быть в курсе интересных публикаций по развитию информационных технологий, IoT, анализу данных, информационной безопасности и т.п. или же хотите усовершенствовать свои навыки.

Читать дальше →

-3

Rumyantsev 29 мая 2018 в 22:02

Как быстро найти и не потерять AI и Data Science специалистов

9 мин

11K

Big Data * Data Mining * Управление персоналом *

В соавторстве с Анной Перовой

Введение

Каждый день человечество создает, использует и хранит огромные объемы данных. Каждая статья, пост в блоге или instagram, каждый лайк да и вообще каждый факт коммуникации — данные, которые, будучи обработанными становятся ценными, приносят прибыль и предостерегают от рисков того кто ими владеет и умеет извлекать соответствующую информацию.

С ростом возможностей анализа данных и осознания полезности имеющихся архивов повышается и потребность в экспертах по Data Science, машинного обучения и искусственного интеллекта (AI), способных работать с данными и создавать на их основе полезные модели, а также, системы самостоятельно обрабатывающие данные и заставляющие их работать.

Почему тем, кто набирает команды в этой сфере необходимо задуматься о новых методах рекрутинга?

Как еще в 2015 году писали на TechCrunch, по мнению Mckinsey, которые, надо признать оказались не далеко от истины, 490 000 специалистов потребуется в этой области к 2018 году.

Читать дальше →

-1

a-pichugin 29 мая 2018 в 08:34

ConvNets. Создание прототипа проекта с помощью Mask R-CNN

7 мин

8.4K

Блог компании New Professions LabBig Data * Python * Машинное обучение * Обработка изображений *

Привет, Хабр! Мы, наконец, дождались еще одной части серии материалов от выпускника наших программ “Специалист по большим данным” и “Deep Learning”, Кирилла Данилюка, об использовании популярных на сегодняшний день нейронных сетей Mask R-CNN как части системы для классификации изображений, а именно оценки качества приготовленного блюда по набору данных с сенсоров.

Рассмотрев в предыдущей статье игрушечный набор данных, состоящий из изображений дорожных знаков, теперь мы можем перейти к решению задачи, с которой я столкнулся в реальной жизни: «Возможно ли реализовать Deep Learning алгоритм, который мог бы отличить блюда высокого качества от плохих блюд по одной фотографии?». Вкратце, бизнес хотел вот это:

_{Что представляет бизнес, когда думает о машинном обучении:}

Читать дальше →

+6

egor_labintcev 12 мая 2017 в 10:59

Метрики в задачах машинного обучения

9 мин

828K

Блог компании Open Data ScienceData Mining * Python * Математика * Машинное обучение *

Привет, Хабр!

В задачах машинного обучения для оценки качества моделей и сравнения различных алгоритмов используются метрики, а их выбор и анализ — непременная часть работы датасатаниста.

В этой статье мы рассмотрим некоторые критерии качества в задачах классификации, обсудим, что является важным при выборе метрики и что может пойти не так.

Читать дальше →

+35

lytr 28 янв 2015 в 11:53

Deep learning и Caffe на новогодних праздниках

9 мин

56K

Big Data * Обработка изображений * Data Mining *

Из песочницы

Мотивация

В данной статье вы познакомитесь c применением deep learning на практике. Будет использован фреймворк Caffe на датасете SVHN.

Deep Learning. Этот buzz word уже давно звенит в ушах, но попробовать его на практике никак не удавалось. Подвернулся удобный случай это исправить! На новогодние праздники был назначен контест на kaggle по распознаванию номеров домов в рамках курса по анализу изображений.

Читать дальше →

+20

AlexSerbul 3 авг 2016 в 17:08

Deep Learning — что же делать, кого бить

3 мин

23K

Блог компании Битрикс24Big Data * Машинное обучение *

Нигде, наверно, нет такой насущной необходимости в синергии знаний разных областей науки — как в области машинного обучения и Deep Learning. Достаточно открыть капот TensorFlow и ужаснуться — огромное количество кода на python, работающее с тензорами внутри… C++, вперемешку с numpy, для выкладки в продакшн требующее чуток покодить «на плюсах», вприкуску с bazel (это так волнует, всю жизнь мечтал об этом!). И другая крайность — ребята из Deeplearning4j прокляли python к чертовой матери и вращают тензоры на старой и доброй java. Но дальше всех ушли, похоже, студенты из университета Нью-Йорка — люди, причем не только студенты, причем давно и серьезно жгут на Luajit + nginx (аминь по католически). Ситуация осложняется недавним демаршем Google DeepMind в отношении «дедушки torch»: все проекты переводят на свой внутренний движок, родившийся из DistBelief.
Полнейший хаос и бардак.

Читать дальше →

+12

kozyrevskaya 5 авг 2016 в 14:40

8 лекций, которые помогут разобраться в машинном обучении и нейросетях

2 мин

86K

Блог компании SurfingbirdData Mining * Математика * Машинное обучение *

Мы собрали интересные лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться. Первая лекция рассчитана скорее на тех, кто вообще не понимает, как работает machine learning, в остальных много интересных кейсов.

Читать дальше →

+40

ZlodeiBaal 7 авг 2016 в 19:00

Kaggle – наша экскурсия в царство оверфита

19 мин

38K

Обработка изображений * Машинное обучение * Анализ и проектирование систем * Алгоритмы *

Туториал

Kaggle — это платформа для проведения конкурсов по машинному обучению. На Хабре частенько пишут про неё: 1, 2, 3, 4, и.т.д. Конкурсы на Kaggle интересные и практичные. Первые места обычно сопровождаются неплохими призовыми (топовые конкурсы — более 100к долларов). В последнее время на Kaggle предлагали распознавать:

И многое-многое другое.

Мне давно хотелось попробовать, но что-то всё время мешало. Я разрабатывал много систем, связанных с обработкой изображений: тематика близка. Навыки более лежат в практической части и классических Computer Vision (CV) алгоритмах, чем в современных Machine Learning техниках, так что было интересно оценить свои знания на мировом уровне плюс подтянуть понимание свёрточных сетей.

И вот внезапно всё сложилось. Выпало пару недель не очень напряжённого графика. На kaggle проходил интересный конкурс по близкой тематике.Я обновил себе комп. А самое главное — подбил vasyutka и Nikkolo на то, чтобы составить компанию.

Сразу скажу, что феерических результатов мы не достигли. Но 18 место из 1.5 тысяч участников я считаю неплохим. А учитывая, что это наш первый опыт участия в kaggle, что из 3х месяц конкурса мы участвовали лишь 2.5 недели, что все результаты получены на одной единственной видеокарте — мне кажется, что мы хорошо выступили.

О чём будет эта статья? Во-первых, про саму задачу и наш метод её решения. Во-вторых, про процесс решения CV задач. Я писал достаточно много статей на хабре о машинном зрении(1,2,3), но писанину и теорию всегда лучше подкреплять примером. А писать статьи по какой-то коммерческой задаче по очевидным причинам нельзя. Теперь наконец расскажу про процесс. Тем более что тут он самый обычный, хорошо иллюстрирующий как задачи решаются. В-третьих, статья про то, что идёт после решения идеализированной задаче в вакууме: что будет когда задача столкнётся с реальностью.

Читать дальше →

+61

qc-enior 8 авг 2016 в 13:42

Распознавание образов в R с использованием сверточных нейронных сетей из пакета MXNet

8 мин

15K

Блог компании Инфопульс УкраинаR * Машинное обучение * Обработка изображений *

Туториал

Перевод

Это подробная инструкция по распознаванию образов в R с использованием глубокой сверточной нейронной сети, предоставляемой пакетом MXNet. В этой статье приведен воспроизводимый пример, как получить 97,5% точность в задаче распознавания лиц на R.

Читать дальше →

+30

m9_psy 8 авг 2016 в 06:39

Математика для искусственных нейронных сетей для новичков, часть 2 — градиентный спуск

8 мин

139K

Python * Машинное обучение *

Часть 1 — линейная регрессия

В первой части я забыл упомянуть, что если случайно сгенерированные данные не по душе, то можно взять любой подходящий пример отсюда. Можно почувствовать себя ботаником, виноделом, продавцом. И все это не вставая со стула. В наличии множество наборов данных и одно условие — при публикации указывать откуда взял данные, чтобы другие смогли воспроизвести результаты.

Градиентный спуск

В прошлой части был показан пример вычисления параметров линейной регрессии с помощью метода наименьших квадратов. Параметры были найдены аналитически —

, где

— псевдообратная матрица. Это решение наглядное, точное и короткое. Но есть проблема, которую можно решить численно. Градиентный спуск — метод численной оптимизации, который может быть использован во многих алгоритмах, где требуется найти экстремум функции — нейронные сети, SVM, k-средних, регрессии. Однако проще его воспринять в чистом виде (и проще модифицировать).

Читать дальше →

+22

elcoyot 18 янв 2014 в 11:51

Как математика помогает Яндексу зарабатывать?

4 мин

50K

Блог компании ЯндексМатематика * Поисковые технологии *

Яндекс зарабатывает сотни миллионов долларов в год, хотя наш поиск — бесплатный. Основной доход мы получаем от рекламы, соединяя продавцов с покупателями. Чтобы делать это хорошо, мы используем сложные алгоритмы, созданные на основе математической статистики, теории вероятностей, машинного обучения, теории игр и теории аукционов. Улучшение алгоритмов всего на несколько процентов — это дополнительные десятки миллионов долларов в год. Из этой лекции вы узнаете, как математика может работать в рекламе.

Конспект лекции

+79

julia 18 янв 2007 в 12:16

«Яндекс» поделит 5 млн рублей между 31 ученым

1 мин

808

Математика *

«Яндекс» опубликовал список победителей конкурса «Интернет-математика 2007». 31 грант на полугодовые исследовательские проекты выделит компания из общего фонда в 5 млн рублей. Сообщается, что всего на конкурс пришло 156 заявок.

Победившие соискатели проведут исследовательские работы, например, в сфере «Поиска портретных изображений по содержанию», «Организации поиска в текстовых коллекциях на русском языке XVIII века», «Применения декомпозиции на основе подстрок при построении индексов для поиска по сходству». На время исследования им будет предоставлен доступ к уникальным наборам реальных данных компании.

«Яндекс» отмечает, что конкурс «Интернет-математика» проводится во второй раз. Основная его цель — стимулирование научных исследований в области информационного поиска и смежных дисциплин.

Отчет о проведенных исследованиях победители конкурса представят компании к 1 июля 2007 года. Как и раньше, тексты всех работ будут выложены в открытый доступ.

+6

JuliaP 15 ноя 2013 в 14:27

ScienceHub #06: Компьютерная лингвистика

7 мин

23K

Блог компании Content AIБлог компании ПостНаука

Продолжая поездки по лабораториям ученых, мы попали в компанию ABBYY, и побеседовали с Анатолием Старостиным, руководителем группы семантического анализа и преподавателем кафедры «Компьютерная лингвистика» в МФТИ. Он рассказал о работе своей группы, направлениях компьютерной лингвистики в ABBYY и кто такие онтоинженеры.

Читать дальше →

+32

1