Статьи / Закладки / Профиль virl / Хабр

@virl

Пользователь

Профиль Публикации Комментарии 20Закладки 206

vkantor 19 сен 2017 в 10:00

Как мы обучали приложение Яндекс.Такси предсказывать пункт назначения

7 мин

23K

Блог компании ЯндексBig Data*Data Mining*Алгоритмы*Машинное обучение*

Представьте: вы открываете приложение, чтобы в очередной раз заказать такси в часто посещаемое вами место, и, конечно, в 2017 году вы ожидаете, что все, что нужно сделать – сказать приложению «Вызывай», и такси за вами тут же выедет. А куда вы хотели ехать, через сколько минут и на какой машине — все это приложение узнает благодаря истории заказов и машинному обучению. В общем-то все, как в шутках про идеальный интерфейс с единственной кнопкой «сделать хорошо», лучше которого только экран с надписью «все уже хорошо». Звучит здорово, но как же приблизить эту реальность?

На днях мы выпустили новое приложение Яндекс.Такси для iOS. В обновленном интерфейсе один из акцентов сделан на выборе конечной точки маршрута («точки Б»). Но новая версия – это не просто новый UI. К запуску обновления мы существенно переработали технологию прогнозирования пункта назначения, заменив старые эвристики на обученный на исторических данных классификатор.

Как вы понимаете, кнопки «сделать хорошо» в машинном обучении тоже нет, поэтому простая на первый взгляд задача вылилась в довольно захватывающий кейс, в результате которого, мы надеемся, у нас получилось немного облегчить жизнь пользователей. Сейчас мы продолжаем внимательно следить за работой нового алгоритма и еще будем его менять, чтобы качество прогноза было стабильнее. На полную мощность запустимся в ближайшие несколько недель, но под катом уже готовы рассказать о том, что же происходит внутри.

Читать дальше →

+59

Alexeynew 14 сен 2017 в 15:50

Как написать свой первый Linux device driver

7 мин

60K

C*Разработка под Linux*

Из песочницы

Здравствуйте, дорогие хабрачитатели.

Цель данной статьи — показать принцип реализации драйверов устройств в системе Linux, на примере простого символьного драйвера.

Для меня же, главной целью является подвести итог и сформировать базовые знания для написания будущих модулей ядра, а также получить опыт изложения технической литературы для публики, т.к. через полгода я буду выступать со своим дипломным проектом (да я студент).

Это моя первая статья, пожалуйста не судите строго!

P.S

Получилось слишком много букв, поэтому я принял решение разделить статью на три части:

Часть 1 — Введение, инициализация и очистка модуля ядра.
Часть 2 — Функции open, read, write и trim.
Часть 3 — Пишем Makefile и тестируем устройство.

Перед вступлением, хочу сказать, что здесь будут изложены базовые вещи, более подробная информация будет изложена во второй и последней части данной статьи.

Итак, начнем.

Читать дальше →

+45

spiritus_sancti 8 сен 2017 в 17:26

Руководство по материалам электротехники для всех. Часть 1

15 мин

114K

Блог компании MakeItLabНаучно-популярноеDIY или Сделай сам

Туториал

Привет гиктаймс! Я решил опубликовать по частям свое руководство по материалам, используемым не только в электротехнике, но и вообще в технике, в том числе самодельщиками. С описанием, примерами применения, заметками по работе. Руководство написано максимально просто, и будет понятно всем, от школьника до пенсионера.

В этой части начинаем разбирать проводники — Серебро, Медь, Алюминий.

Добро пожаловать под кат (ТРАФИК)

узнать о материалах

+93

161

eov 10 сен 2017 в 22:57

Выходим в интернет за пределами РФ: (MikroTik<->Ubuntu) * GRE / IPsec

8 мин

70K

Системное администрирование*Сетевые технологии*Серверное администрирование*Настройка Linux*

Позволю себе опубликовать свой опыт применения сетевых технологий в меру моей испорченности для выхода в интернет из-за пределов РФ. Не будем рассуждать о том, зачем это нужно. Надеюсь, что все всем и так понятно.

Итак, у нас есть статический публичный IP адрес, который приходит Ethernet шнуром в MikroTik RouterBOARD 750G r3 (hEX). Пробуем собрать вот такую конструкцию.

Настройку L2tp линка в рамках этой статьи я не описываю, а на схеме он нарисован только потому, что в ней упоминается.

Читать дальше →

+27

TatianaAr 6 сен 2017 в 19:57

Наш путь к грин картe

9 мин

18K

IT-эмиграция

В США мы приехали в лихие 90е, но с тех пор тут изменилось немногое, и наш опыт может оказаться ценным для многих. Муж программист и математик, способный писать на всем, насколько я понимаю (а вот я нисколько не программист, так что простите если что не так), от ассемблера до С, С++ и далее везде.

Приехали мы по рабочей визе L1b, мужа перевели в американский филиал восточноевропейской компании, в которой он до этого пару лет проработал. Я до приезда в США была лингвистом, лексикографом, занималась составлением словарей. С нами была 5 летняя дочь, а дочка номер два родилась вскоре после приезда. Это важно, поскольку вопрос об образовании детей встал достаточно скоро, и как только прошёл стресс связанный с рождением второго ребёнка, я начала теребить мужа — а что у нас с оформлением Грин карты? Вопрос был принципиальным — мы со старшей математику учим по русскому учебнику или по американскому? Возвращаемся в Москву или остаёмся в США? Это же две совершенно разные образовательные задачи! В общем, пришлось мужу оторваться от любимых программ и пойти к начальству выяснять, поскольку его попытки отговориться от меня тем, что они нас сюда привезли, они и решат вопрос, успехом не увенчались.

Оказалось, что начальство сильно вопросом оформления Грин карты не интересовалось — у нас есть иммиграционный адвокат, сказали они, мы платим ему за всех работников, и за вашу Грин карту уже полгода назад заплатили, все вопросы туда. Сказано-сделано, звоним туда. А я не ваш адвокат, отвечает адвокат, я адвокат компании, все вопросы туда. Тут мне уже стало реально интересно, что же происходит, и начальству пришлось убедительно попросить адвоката все-таки с нами встретиться и рассказать нам, когда же он все-таки планирует оформить нам грин карту и что ему удалось сделать за истекшие полгода.

Читать дальше →

+44

devpony 4 сен 2017 в 12:02

PyTorch — ваш новый фреймворк глубокого обучения

22 мин

193K

Python*Машинное обучение*Программирование*

Gotta Torch?

PyTorch — современная библиотека глубокого обучения, развивающаяся под крылом Facebook. Она не похожа на другие популярные библиотеки, такие как Caffe, Theano и TensorFlow. Она позволяет исследователям воплощать в жизнь свои самые смелые фантазии, а инженерам с лёгкостью эти фантазии имплементировать.

Данная статья представляет собой лаконичное введение в PyTorch и предназначена для быстрого ознакомления с библиотекой и формирования понимания её основных особенностей и её местоположения среди остальных библиотек глубокого обучения.

Fire walk with me

+62

PatientZero 30 авг 2017 в 14:17

Алгоритм машинного обучения Flappy Bird

4 мин

49K

Алгоритмы*Машинное обучение*Разработка игр*

Перевод

Я познакомлю вас с полным туториалом на HTML5 с демо по алгоритму машинного обучения видеоигре Flappy Bird. Цель этого эксперимента — написать игровой контроллер искусственного интеллекта на основе нейросетей и генетического алгоритма.

То есть мы хотим создать ИИ-робота, который сможет учиться оптимальной игре во Flappy Bird. В результате наша маленькая птица сможет спокойно пролетать через препятствия. В наилучшем сценарии она не умрёт никогда.

Прочитав теорию, лежащую в основе этого проекта, можно скачать исходный код в конце этого туториала. Весь код написан на HTML5 с использованием фреймворка Phaser. Кроме того, мы использовали библиотеку Synaptic Neural Network для реализации нейросети, чтобы не создавать её с нуля.

Демо

Для начала посмотрите демо, чтобы оценить алгоритм в действии:

Запустить в полноэкранном режиме

+56

Mendel 30 авг 2017 в 16:42

Двойная бюстгалтерия* глазами программиста

8 мин

42K

Алгоритмы*Биллинговые системы*Разработка под e-commerce*

Туториал

Большинство из нас сталкивались с бухгалтерами. Многим их терминология кажется китайской грамотой, как для гуманитария обратная польская запись. Однако разобравшись, понимаешь насколько это удобный и мощный инструмент.

Статья не академическая, а отражает сугубо мой упрощенный взгляд, и для тех кто уже осилил академические статьи — будет неинтересной. Тех же кому интересно понять такой простой и мощный инструмент как «двойная запись» — прошу под кат.

Читать дальше →

+35

266

Kaspersky_Lab 17 авг 2017 в 17:23

История развития машинного обучения в ЛК

7 мин

12K

Блог компании «Лаборатория Касперского»Информационная безопасность*Машинное обучение*

Автор статьи — Алексей Маланов, эксперт отдела развития антивирусных технологий «Лаборатории Касперского»

Я пришел в «Лабораторию Касперского» студентом четвертого курса в 2004 году. Тогда мы работали по сменам, ночами, чтобы обеспечить максимальную скорость реакции на новые угрозы в индустрии. Многие конкурирующие компании в то время выпускали обновления антивирусных баз раз в сутки, им круглосуточная работа была не так важна. Мы же гордились тем, что смогли перейти на ежечасные обновления.

К слову, сам Евгений Валентинович Касперский сидел в той же комнате офиса, что и другие вирусные аналитики. Он «долбил» вирусы как и все, просто быстрее. И еще жаловался, что пиар-команда постоянно выдергивает его в командировки и не дает поработать в свое удовольствие. В общем, можно смело утверждать, что в 2004 году машинное обучение при анализе и детектировании вредоносного кода в «Лаборатории Касперского» не использовалось.

Скорость моего анализа вредоносов была в то время на порядок ниже темпа работы других аналитиков, ведь тут огромную роль играет опыт, и только со временем ты начинаешь «узнавать» семейства зловредов, просто заглянув внутрь.

Характерный вид содержимого Backdoor.Win32.Bifrose, популярного бэкдора того времени

Читать дальше →

+27

Leono 6 авг 2017 в 17:18

Лекция Владимира Игловикова на тренировке Яндекса по машинному обучению

18 мин

13K

Блог компании ЯндексМашинное обучение*Ненормальное программирование*Спортивное программирование*

Скорее всего, вы слышали об авторе этой лекции. Владимир ternaus Игловиков занял второе место в британском Data Science Challenge, но организаторы конкурса не стали выплачивать ему денежный приз из-за его российского гражданства. Затем наши коллеги из Mail.Ru Group взяли выплату приза на себя, а Владимир, в свою очередь, попросил перечислить деньги в Российский Научный Фонд. История получила широкий охват в СМИ.

Спустя несколько недель Владимир выступил на одной из тренировок Яндекса по машинному обучению. Он рассказал о своём подходе к участию в конкурсах, о сути Data Science Challenge и о решении, которое позволило ему занять второе место.

+41

m1rko 5 авг 2017 в 23:09

Взлом Wi-Fi

7 мин

330K

Информационная безопасность*Беспроводные технологии*

Перевод

Взлом маршрутизаторов WPA/WPA2 Wi-Fi с помощью Airodump-ng и Aircrack-ng/Hashcat

Это краткое пошаговое руководство, которое демонстрирует способ взлома сетей Wi-Fi, защищённых слабыми паролями. Оно не исчерпывающее, но этой информации должно хватить, чтобы вы протестировали свою собственную сетевую безопасность или взломали кого-нибудь поблизости. Изложенная ниже атака полностью пассивна (только прослушивание, ничего не транслируется с вашего компьютера) и о ней невозможно узнать, если вы только реально не воспользуетесь паролем, который взломали. Необязательную активную атаку с деаутентификацией можно применить для ускорения разведывательного процесса. Она описана в конце статьи.

Читать дальше →

+51

Fondy 1 авг 2017 в 11:53

Как я проник на сервер PayPal через баг в загрузке файлов и получил доступ к удаленному выполнению кода

4 мин

25K

Блог компании FondyИнформационная безопасность*Отладка*

Перевод

Пентестер (тестировщик на проникновение) рассказывает, как ему удалось найти баг в загрузке файлов и проникнуть на сервер платежной системы PayPal.

Привет всем!

Надеюсь, у вас все хорошо. Уверен, что заголовок вас немало удивил, и вы ринулись сюда чтобы глянуть, реально ли я cмог получить удаленный доступ не куда-нибудь, а на сервер PayPal.

На самом деле это был довольно простенький взлом, направленный на проверку уязвимости (так называемый POC). Единственный момент, с которым мне повезло — поиск и успешное определение уязвимого домена.

Читать дальше →

+36

lockywolf 9 дек 2016 в 13:20

Как правильно настроить Wi-Fi

11 мин

453K

Беспроводные технологии*Настройка Linux*Серверная оптимизация*Сетевые технологии*Системное администрирование*

Recovery Mode

Введение

Думаю, не ошибусь сильно, если у большинства из нас подключение к интернету выглядит следующим образом: есть некоторый довольно скоростной проводной канал до квартиры (сейчас уже и гигабит не редкость), а в квартире его встречает роутер, который раздаёт этот интернет клиентам, выдавая им «чёрный» ip и осуществляя трансляцию адресов.

Довольно часто наблюдается странная ситуация: при скоростном проводе, с роутера раздаётся совсем узенький wifi-канал, не загружающий и половины провода. При этом, хотя формально Wi-Fi, особенно в его ac-версии поддерживает какие-то огромные скорости, при проверке оказывается, что либо Wi-Fi подключается на меньшей скорости, либо подключается, но не выдаёт скорости на практике, либо теряет пакеты, либо всё вместе.

В какой-то момент и я столкнулся с похожей проблемой, и решил настроить свой Wi-Fi по-человечески. На удивление, это заняло примерно в 40 раз дольше, чем я ожидал. Вдобавок, как-то так случилось, что все инструкции по настройке Wi-Fi, которые я находил, сходились к одному из двух видов: в первом предлагали поставить роутер повыше и выпрямить антенну, для чтения второго же мне не хватало честного понимания алгоритмов пространственного мультиплексирования.

Собственно, эта заметка — это попытка заполнить пробел в инструкциях. Я сразу скажу, что задача до конца не решена, несмотря на приличный прогресс, стабильность подключения всё ещё могла бы быть лучше, поэтому я был бы рад услышать комментарии коллег по описанной тематике.

Читать дальше →

+54

111

DanAnastasyev 25 июл 2017 в 08:26

Как научить свою нейросеть генерировать стихи

10 мин

54K

Natural Language Processing*Python*Машинное обучение*

Из песочницы

Умоляю перестань мне сниться
Я люблю тебя моя невеста
Белый иней на твоих ресницах
Поцелуй на теле бессловесном

Когда-то в школе мне казалось, что писать стихи просто: нужно всего лишь расставлять слова в нужном порядке и подбирать подходящую рифму. Следы этих галлюцинаций (или иллюзий, я их не различаю) встретили вас в эпиграфе. Только это стихотворение, конечно, не результат моего тогдашнего творчества, а продукт обученной по такому же принципу нейронной сети.

Вернее, нейронная сеть нужна лишь для первого этапа — расстановки слов в правильном порядке. С рифмовкой справляются правила, применяемые поверх предсказаний нейронной сети. Хотите узнать подробнее, как мы это реализовывали? Тогда добро пожаловать под кат.

Читать дальше →

+74

Leono 22 июл 2017 в 16:48

Neural conversational models: как научить нейронную сеть светской беседе. Лекция в Яндексе

20 мин

24K

Блог компании ЯндексМашинное обучение*

Хороший виртуальный ассистент должен не только решать задачи пользователя, но и разумно отвечать на вопрос «Как дела?». Реплик без явной цели очень много, и заготовить ответ на каждую проблематично. Neural Conversational Models — сравнительно новый способ создания диалоговых систем для свободного общения. Его основа — сети, обученные на больших корпусах диалогов из интернета. Борис hr0nix Янгель рассказывает, чем хороши такие модели и как их нужно строить.

Под катом — расшифровка и основная часть слайдов.

+58

alexlash 8 июл 2017 в 10:34

Личный опыт: как ИТ-специалисту переехать на работу в США, надеясь только на себя

7 мин

68K

IT-эмиграция

На Хабре опубликовано достаточно большое количество материалов с рассказами о том, как разработчики переезжают в США и другие страны на работу. Большинство таких статей касается именно программистов, которые рассказывают свои истории о поиске работы, опыте прохождения собеседований, получении оффера и последующем переезде.

Мой опыт не вписывается в эту схему и потому, как мне кажется, может оказаться полезным для других ИТ-специалистов — я переехал в США по визе O1, которая лишена некоторых недостатков традиционной американской рабочей визы.

Сразу оговорюсь, что этот способ миграции предполагает достаточно серьезные денежные траты, месяцы на подготовку документов, а также наличие общей жизненной активности. Но при всем этом, данный способ предполагает, что гораздо больше зависит от самого соискателя, а не от везения.

Читать дальше →

+47

ruslan_z 3 июл 2017 в 10:19

Классификация текста с помощью нейронной сети на Java

12 мин

79K

Java*Open source*Машинное обучение*Программирование*Проектирование и рефакторинг*

Туториал

– Наша Лена уходит в декрет, – сообщил начальник, – поэтому нам надо искать замену на время ее отсутствия. Часть задач мы распределим, а вот как быть с задачей перенаправления обращений пользователей?

Лена – это наш сотрудник технической поддержки. Одна из ее обязанностей – распределение поступающих на электронную почту обращений между специалистами. Она анализирует обращение и определяет ряд характеристик. Например, «Тип обращения»: ошибка системы, пользователю просто нужна консультация, пользователь хочет какую-то новую функциональность. Определяет «Функциональный модуль системы»: модуль бухгалтерии, модуль паспортизации оборудования и т.д. Проставив все эти характеристики, она перенаправляет обращение соответствующему специалисту.

– Давай я напишу программу, которая это будет делать автоматически! – ответил я.

На этом увлекательный роман заканчиваем и переходим к технической части.

Читать дальше →

+29

m1rko 27 июн 2017 в 13:53

Как HBO делала приложение Not Hotdog для сериала «Кремниевая долина»

23 мин

24K

Google Cloud Vision API*Машинное обучение*Обработка изображений*Разработка мобильных приложений*Разработка под iOS*

Перевод

Сериал HBO «Кремниевая долина» выпустил настоящее приложение ИИ, которое распознаёт хотдоги и не-хотдоги, как приложение в четвёртом эпизоде четвёртогого сезона (приложение сейчас доступно для Android, а также для iOS!)

Чтобы добиться этого, мы разработали специальную нейронную архитектуру, которая работает непосредственно на вашем телефоне, и обучили её с помощью TensorFlow, Keras и Nvidia GPU.

+25

iphysic 23 июн 2017 в 14:38

Автоэнкодеры в Keras, Часть 1: Введение

11 мин

95K

Python*Алгоритмы*Машинное обучение*

Туториал

Содержание

Часть 1: Введение
Часть 2: Manifold learning и скрытые (latent) переменные
Часть 3: Вариационные автоэнкодеры (VAE)
Часть 4: Conditional VAE
Часть 5: GAN (Generative Adversarial Networks) и tensorflow
Часть 6: VAE + GAN

Во время погружения в Deep Learning зацепила меня тема автоэнкодеров, особенно с точки зрения генерации новых объектов. Стремясь улучшить качество генерации, читал различные блоги и литературу на тему генеративных подходов. В результате набравшийся опыт решил облечь в небольшую серию статей, в которой постарался кратко и с примерами описать все те проблемные места с которыми сталкивался сам, заодно вводя в синтаксис Keras.

Автоэнкодеры

Автоэнкодеры — это нейронные сети прямого распространения, которые восстанавливают входной сигнал на выходе. Внутри у них имеется скрытый слой, который представляет собой код, описывающий модель. Автоэнкодеры конструируются таким образом, чтобы не иметь возможность точно скопировать вход на выходе. Обычно их ограничивают в размерности кода (он меньше, чем размерность сигнала) или штрафуют за активации в коде. Входной сигнал восстанавливается с ошибками из-за потерь при кодировании, но, чтобы их минимизировать, сеть вынуждена учиться отбирать наиболее важные признаки.

Кому интересно, добро пожаловать под кат

Читать дальше →

+39

victor_k 14 фев 2016 в 19:54

Собираем XGBoost под OS X

3 мин

Машинное обучение*

Из песочницы

XGBoost — С++ библиотека, реализующая методы градиентного бустинга, которую все чаще можно встретить в описаниях алгоритмов-победителей на Kaggle. Для использования из R или Python есть соответствующие обвязки, но саму библиотеку необходимо собрать из исходников. Запустив make, я увидел массу ошибок, сообщающих о ненайденных хидерах и неподдерживаемом OpenMP. Ну, не впервой.

Читать дальше →

+11

1 2

4 5 ...

10 11