Все потоки

Машинное обучение *

Основа искусственного интеллекта

1 122,34

Рейтинг

СтатьиПостыНовостиАвторыКомпании

Tlaskaltek 29 янв 2018 в 14:51

5 инновационных способов использования машинного обучения

5 мин

9.7K

Big Data * Data Mining * Машинное обучение *

Из песочницы

Привет, Хабр! Представляю вашему вниманию перевод статьи «5 Innovative Uses for Machine Learning» автора Aj Agrawal.

Они придут в вашу жизнь, по крайней мере, в вашу деловую жизнь раньше, чем вы думаете. Хотя временной горизонт пришествия не может быть точно предсказан, искусственный интеллект (АI) обещает фундаментально повлиять на современное общество, к лучшему или к худому. Сверх уровень (АI)-машинное обучение получил особое внимание со стороны экспертов по причине потенциально мощнейшего воздействия на наиболее важные, мировые отрасли производства. Из-за возникшего ажиотажа, огромное количество талантов и ресурсов вливаются в это пространство.

Но что же такое, это машинное обучение и почему мы должны заботиться об этом в первую очередь? Ответ в том, что в самом широком смысле, модели машинного обучения приложений ИИ используют алгоритмы самостоятельного прогнозирования исходов. Другими словами, эти модели могут обрабатывать гигантские массивы данных, извлекать выводы и делать точные прогнозы без необходимости значительного вмешательства человека.

Множество значимо-генеративных последствий порождается в результате ускоренного развития этой технологии, и большая их часть готова значительно упростить деловой мир.

А вот пятерка самых новаторских способов использовать машинное обучение. Они придут в вашу жизнь, по крайней мере, в вашу деловую жизнь-раньше, чем вы того ожидаете.

Читать дальше →

+1

bibilov 29 янв 2018 в 12:35

MentorHack: тиндер для поиска ментора, AI Boss и немного HRTech

5 мин

7.9K

Блог компании Проектная школа программирования GoToХакатоныУправление проектами * Программирование * Машинное обучение *

С 13 по 15 февраля в Москве пройдет MentorHack – хакатон по созданию сервисов для наставничества в корпоративной среде, предпринимательстве и образовании. Приглашаем всех с опытом в разработке, машинном обучении, product-менеджменте или HR и желанием получить призы и интересные данные от партнеров.
Общий призовой фонд – 1 300 000 рублей.

Под катом – подробности участия и примеры идей для проектов: от запускающихся сервисов по подбору ментора Facebook и LinkedIn до концепций AI Boss.

Читать дальше →

+9

Leono 28 янв 2018 в 13:17

Применение моделей CatBoost внутри ClickHouse. Лекция Яндекса

8 мин

15K

Блог компании ЯндексOpen source * Машинное обучение * Промышленное программирование *

В каких ситуациях удобно применять предобученные модели машинного обучения внутри ClickHouse? Почему для такой задачи лучше всего подходит метод CatBoost? Не так давно мы провели встречу, посвящённую одновременному использованию этих двух опенсорс-технологий. На встрече выступил разработчик Николай Кочетов — его лекцией мы и решили с вами поделиться. Николай разбирает описанную задачу на примере алгоритма предсказания вероятности покупки.

— Сначала о том, как устроен ClickHouse. ClickHouse — это аналитическая распределенная СУБД. Она столбцовая и с открытым исходным кодом. Самое интересное слово здесь — «столбцовая». Что оно значит?

+21

madrugado 26 янв 2018 в 10:58

Главные достижения в области обработки естественного языка в 2017 году

10 мин

21K

Блог компании Open Data ScienceБлог компании Московский физико-технический институт (МФТИ)Data Mining * Математика * Машинное обучение *

Перевод

Всем привет. Сразу поделим аудиторию на две части — тех, кто любит смотреть видео, и тех, кто, как я, лучше воспринимает тексты. Чтобы не томить первых, запись моего выступления на Дата-Ёлке:

Там есть все основные моменты, но формат выступления не предполагает подробного рассмотрения статей. Любители ссылок и подробных разборов, добро пожаловать под кат.

Читать дальше →

+58

nanton 26 янв 2018 в 09:43

Как я сделал AI для выявления фейковых новостей с точностью в 95% и чуть не рехнулся

6 мин

57K

Блог компании InlyITМашинное обучение * Спам и антиспам

Перевод

Краткий пересказ: мы сделали программу, определяющую надежность новостей с точностью 95% (на валидационной выборке) при помощи машинного обучения и технологий обработки естественного языка. Скачать ее можно здесь. В условиях реальной действительности точность может оказаться несколько ниже, особенно по прошествии некоторого времени, так как каноны написания новостных статей будут меняться.

Глядя, как бурно развиваются машинное обучение и обработка естественного языка, я подумал: чем черт не шутит, может быть, мне удастся создать модель, которая выявляла бы новостной контент с недостоверной информацией, и тем самым хоть чуть-чуть сгладить катастрофические последствия, которые приносит сейчас распространение фейковых новостей.

С этим можно поспорить, но, на мой взгляд, самый сложный этап в создании собственной модели машинного обучения — сбор материалов для обучения. Когда я обучал модель для распознавания лиц, мне пришлось несколько дней собирать фотографии каждого из игроков лиги НБА в сезоне 2017/2018. Теперь же я и не подозревал, что мне придется провести погруженным в этот процесс несколько мучительных месяцев и столкнуться с очень неприятными и жуткими вещами, которые люди пытаются выдать за настоящие новости и надежную информацию.

Читать дальше →

+36

grachikova 26 янв 2018 в 07:57

Открытая научная школа хакатона DeepHack.Babel

3 мин

2.5K

Блог компании Московский физико-технический институт (МФТИ)ХакатоныУчебный процесс в ITНенормальное программирование * Машинное обучение *

Перед новым годом мы рассказывали, зачем нужен хакатон по машинному переводу. Уже на следующей неделе 50 участников, прошедших отбор, приедут в Долгопрудный, чтобы поучаствовать в обучении системы на непараллельных данных. Помимо многочасового брейншторминга в поиске решения поможет научная школа — серия лекций от ведущих мировых специалистов по машинному переводу. Хабр, приглашаем тебя посетить интересующие выступления! Они пройдут на Физтехе с 29 января по 4 февраля, не забудьте зарегистрироваться. Ну, а если в морозный зимний вечер выходить из дома не хочется, то можно посмотреть трансляции на канале DeepHack.

А пока рассказываем о ключевых спикерах

+6

roryorangepants 26 янв 2018 в 07:16

Xception: компактная глубокая нейронная сеть

6 мин

37K

Python * Алгоритмы * Машинное обучение * Обработка изображений *

В последние несколько лет нейронные сети пробрались во все отрасли машинного обучения, но самый большой фурор они бесспорно произвели в области компьютерного зрения. В рамках соревнований ImageNet было представлено множество различных архитектур свёрточных сетей, которые затем разошлись по фреймворкам и библиотекам.

Чтобы улучшить качество распознавания своих сетей, исследователи старались добавлять в сети больше слоёв, однако со временем пришло понимание, что иногда ограничения производительности попросту не позволяют обучать и использовать настолько глубокие сети. Это стало мотивацией для использования depthwise separable convolutions и создания архитектуры Xception.

Если вы хотите узнать, что это такое, и посмотреть, как использовать такую сеть на практике, чтобы научиться отличать котов от собак, добро пожаловать под кат.

Читать дальше →

+23

sahsAGU 25 янв 2018 в 14:26

Azure ML Workbench: Начало работы

3 мин

4K

Блог компании MicrosoftMicrosoft Azure * Python * Visual Studio * Машинное обучение *

Туториал

Совсем недавно мы анонсировали новый инструмент оптимизации рабочего места для Data Scientist. Так как сейчас про него крайне мало написано, особенно на русском языке, мы решили выпустить для вас серию материалов, в которой расскажем о том, как его использовать. В этой части вы узнаете про установку и первый тестовый запуск на локальных ресурсах.

Читать дальше →

+9

ChePeter 25 янв 2018 в 09:41

Некоторые аспекты качества обучающих последовательностей

8 мин

2.2K

Data Mining * Машинное обучение *

На Хабре появился ряд статей о качестве образования и как процесса и как результата (уровень выпускников).

Тема заинтересовала и руки зачесались проверить, а как это устроено у ~~пчелок~~ ~~роботов~~ искусственного интеллекта, влияет ли качество обучающей последовательности на результат.

Была выбрана простая сеть из примеров Keras в которую добавил одну строку. Нас интересует насколько упорядоченность входной обучающей последовательности mnist влияет на результат обучения MLP.

Результат получился неожиданным и странным, пришлось перепроверять многократно, но перейдем к делу и конкретике.

Читать дальше →

+6

aragaer 25 янв 2018 в 07:55

Перевод с человеческого на ботовский

7 мин

6.8K

Ненормальное программирование * Машинное обучение *

Из песочницы

Началось все с того, что я, как и многие другие, захотел написать бота. Предполагалось, что бот мне будет напоминать всякие разные вещи, которые я постоянно забываю — первый сценарий, который предполагалось реализовать, это чтобы бот мне в 10 вечера говорил о том, чтобы я прочитал все то, что в течение дня записал в свой блокнот.

Читать дальше →

+10

zdebskiy 25 янв 2018 в 06:39

Что нового для мобильных разработчиков в Visual Studio 15.6 Preview

4 мин

7.6K

Блог компании MicrosoftiOS * Разработка мобильных приложений * Машинное обучение * Visual Studio *

Хабр, привет! Меня зовут Ромуальд (можно просто Роман) Здебский. Я больше 11 лет работаю в Microsoft. В последние годы помогал ключевым партнерам Microsoft в выпуске популярных игр и приложений для платформы Windows, например клиентов ВКонтакте для Windows Store, таких игр как World Of Tanks Blitz, Cut The Rope 2 и многих других. С технологической точки зрения много занимался XAML-фреймворками и технологиями доступа к данным. Сейчас сферой моих технологических интересов является разработка мобильных приложений с помощью Visual Studio и Xamarin, технологии доступа к данным в Azure, CosmosDB и др.

В прошлом месяце мы выпустили Visual Studio 2017 15.5 с новыми возможностями, включая симулятор iOS Remoted Simulator, доступный всем разработчикам, средство просмотра XAML в режиме реального времени в эмуляторах Android с помощью Xamarin Live Player, новые шаблоны проектов Xamarin.Forms для .NET Standard и усовершенствованный механизм связывания с Mac.

В январе стала доступна предварительная версия Visual Studio 2017 15.6. В этой статье мы обсудим, что было добавлено в эту версию, включая подготовку среды macOS сборки проектов, развертывание на iOS через Wi-Fi, просмотр интерфейса на базе XAML в симуляторе Remoted iOS Simulator в реальном времени и многое другое.

Читать дальше →

+21

DataArt 24 янв 2018 в 17:24

Знакомые лица: алгоритмы создания «типичного» портрета

4 мин

9.4K

Блог компании DataArtC++ * Машинное обучение * Обработка изображений *

Автор: Андрей Сорокин, Senior Developer DataArt

В конце прошлого года мы завершили R&D-проект, посвященный методам машинного зрения в обработке изображений. В результате мы создали ряд усредненных портретов IT-специалистов, работающих с разными технологиями. В этой статье я расскажу об изображениях «типичных» Java и .NET-программистов, подходящих для этого фреймворках и оптимизации процесса.

Тема машинного зрения меня интересует еще с аспирантуры — моя кандидатская была посвящена распознаванию рукописных текстов. За последние несколько лет произошли существенные изменения в методологии и программном обеспечении для машинного зрения, появились новые инструменты и фреймворки, которые хотелось попробовать. В этом проекте мы не претендовали на изобретение уникального решения — главный вклад мы внесли в оптимизацию обработки изображений.

Читать дальше →

+16

bak 24 янв 2018 в 16:09

Исправляем опечатки с учётом контекста

10 мин

31K

Data Mining * Алгоритмы * Машинное обучение * Программирование *

Недавно мне понадобилась библиотека для исправления опечаток. Большинство открытых спелл-чекеров (к примеру hunspell) не учитывают контекст, а без него сложно получить хорошую точность. Я взял за основу спеллчекер Питера Норвига, прикрутил к нему языковую модель (на базе N-грамм), ускорил его (используя подход SymSpell), поборол сильное потребление памяти (через bloom filter и perfect hash) а затем оформил всё это в виде библиотеки на C++ со swig биндингами для других языков.

Читать дальше →

+16

BeloborodovDS 24 янв 2018 в 12:34

Обнаружение лиц на видео с помощью Movidius Neural Compute Stick

6 мин

11K

C++ * Машинное обучение * Обработка изображений *

Из песочницы

Не так давно в свет вышло устройство Movidius Neural Compute Stick (NCS), представляющее собой аппаратный ускоритель для нейронных сетей с USB интерфейсом. Меня заинтересовала потенциальная возможность применения устройства в области робототехники, поэтому я приобрел его и задумал запустить какую-нибудь нейросеть. Однако большинство существующих примеров для NCS решают задачу классификации изображений, а мне хотелось попробовать кое-что другое, а именно обнаружение лиц. В этой публикации я хотел бы поделиться опытом, полученным в ходе такого эксперимента.

Весь код можно найти на GitHub.

Читать дальше →

+20

lewoniewski 23 янв 2018 в 13:05

Автоматическая оценка качества статей Википедии на разных языках

8 мин

8K

Big Data * Data Mining * Алгоритмы * Машинное обучение * Программирование *

Из песочницы

Предлагаю Вашему вниманию обзорную статью научных работ, в которых я являюсь непосредственным участником и автором, на тему оценки качества Википедии на разных языках. Свои научные публикации на эту тему я пишу в основном на английском и польском языках. Я решил поделиться своими знаниями и опытом в этой области для русскоязычной аудитории, и выбрал Хабрахабр для первой такой статьи. Буду рад услышать комментарии и предложения на данную тему, возможно кто-то будет заинтересован в сотрудничестве в этом направлении. В следующих статьях я планирую более подробно остановиться на отдельных методиках и алгоритмах по анализу качества статей на разных языках. Также планирую размещать примеры кода (в основном Python), которые могут пригодиться для извлечения и анализа данных из Википедии.

Читать дальше →

+25

a-pichugin 23 янв 2018 в 11:49

Как мы выстраивали инфраструктуру данных в Wish

13 мин

4.8K

Блог компании New Professions LabМашинное обучение * Python * Data Mining * Big Data *

Перевод

Я пришел в Wish 2,5 года назад, дела в компании шли отлично. Наше приложение было в топе в iOS и Android магазинах и продавало более 2 миллионов товаров в день.

Мало кто верил, что можно построить большой бизнес, продавая дешевые товары. Однако, используя данные, Wish смогли бросить вызов этим сомнениям. Аналитика данных всегда была у нас в крови.

Но когда наш бизнес стал расти огромными темпами, мы не были к этому готовы, обнаружилось множество проблем с аналитикой. Каждая команда внутри компании стала нуждаться в срочной поддержке в работе с данными и многое упускала из виду в своем поле деятельности. В то время наши аналитические возможности еще только зарождались и не могли удовлетворить все растущий спрос.

В данном посте я расскажу о том, какие уроки мы извлекли за это время, а также распишу верный путь для компаний, находящихся в поисках способов масштабирования их аналитических функций.

Читать дальше →

+4

alextheraven 23 янв 2018 в 10:22

Умный поиск: как искусственный интеллект hh.ru подбирает вакансии к резюме

8 мин

45K

Блог компании hh.ruМашинное обучение * Поисковые технологии *

Больше половины соискателей ничего не ищут, а создают резюме и просто ждут, когда их пригласят на собеседование или хотя бы пришлют подходящую вакансию. Когда мы думали, как для них должен выглядеть сайт по поиску работы, то поняли, что им нужна всего одна кнопка.

Делать такую систему мы начали полтора года назад — решили построить на машинном обучении алгоритм, который сам выбирал бы подходящие пользователю вакансии. Но мы очень быстро поняли: вакансии, похожие на резюме, и вакансии, на которые владельцу резюме хочется откликнуться, — далеко не одно и то же.

Читать дальше →

+18

PuzzleEnglish 22 янв 2018 в 13:33

Как нейросети помогают в e-learning

3 мин

7.5K

Блог компании Puzzle EnglishМашинное обучение *

Рассказываем, что такое нейросети, как они работают и помогают учиться в интернете. Бонусом — подборка полезных блогов о нейронных сетях на английском языке.

Читать дальше →

0

saul 22 янв 2018 в 06:08

Далеко ли доедет беспилотный автомобиль? Задай вопрос эксперту Intel

2 мин

4.9K

Блог компании IntelМашинное обучение * Big Data * Программирование * Интернет вещей

Новости последних нескольких лет приучили нас к мысли, что уже следующее поколение людей будет жить при ~~коммунизме~~ наступившей эре автономных авто, и водительские права ему уже не понадобятся. Компания Intel давно и активно принимает участие в этом процессе, ей накоплен огромный опыт, которым сейчас мы готовы с вами поделиться. В рамках рубрики «Задай вопрос эксперту Intel» мы представляем вам эксперта Intel Ивана Кузьмина.

Комментариями к этому посту или через личные сообщения мы предлагаем вам задавать эксперту свои вопросы в области искусственного интеллекта и беспилотных автомобилей. Через некоторое время выйдет пост с ответами. Нажавших кнопку «Читать далее» ждет приятный сюрприз!

Читать дальше →

+9

it_man 21 янв 2018 в 14:00

Kubeflow: новый проект для работы с машинным обучением в Kubernetes

3 мин

11K

Блог компании MWS CloudСистемное администрирование * Программирование * Машинное обучение * Виртуализация *

Разработчики Google объявили о запуске нового проекта Kubeflow. Проект упрощает работу с машинным обучением, предоставляя необходимый инструментарий для масштабирования и настройки системы в среде Kubernetes. В статье расскажем:

о компонентах Kubeflow;
как начать работу с решением;
о перспективах проекта.

Читать дальше →

+12

1 2 ...

488

489 490 ...