Pull to refresh

Быстро, точно, градиентно: как наш подход к градиентному бустингу повышает эффективность моделей

Reading time 11 min
Views 557
Банк «Открытие» corporate blog Python *Machine learning *Artificial Intelligence Finance in IT
Tutorial

Доброго времени суток, уважаемые читатели! Сегодня мы вновь рады приветствовать вас в увлекательном мире дата-сайентистов банка "Открытие". На связи Иван Кондраков, Константин Грушин и Станислав Арешин. Недавно мы поделились с вами нашим пайплайном разработки линейных моделей для решения задач бинарной классификации. Теперь же мы решили поведать о нашем опыте построения моделей градиентного бустинга. За последнее время команда проделала колоссальную работу: мы протестировали различные методы отбора факторов, нашли новые инсайты в данных, провели интересную (а, главное, полезную!) аналитическую работу и решили несколько Ad-hoc задач. Зовите всех к экранам, мы начинаем!

Го к туториалу
Total votes 4: ↑4 and ↓0 +4
Comments 2

О вариативности результатов обучения нейронных сетей

Reading time 2 min
Views 182
Machine learning *Artificial Intelligence

В статье приводятся примеры результатов обучения нейронной сети (FNN с одним скрытом слоем, распознавание MNIST) сериями по 10 запусков на каждой паре (количество нейронов скрытого слоя, размера батча) и соответствующий вывод, связанный с вариативностью результатов.

Читать далее
Total votes 2: ↑2 and ↓0 +2
Comments 0

Baidu опубликовала демо инструмента глубинного обучения PaddlePaddle

Reading time 2 min
Views 7.2K
Python *C++ *Machine learning *


Китайский поисковый гигант Baidu опубликовал демо-версию исходного кода своего инструмента глубинного обучения PaddlePaddle (PArallel Distributed Deep LEarning) на GitHub. Анонс всего кода PaddlePaddle состоится 30 сентября.

Согласно информации на GitHub, сейчас сборка PaddlePaddle сырая и к массовому «употреблению» заинтересованными лицами готова не до конца. Разработчики заранее предупреждают, что еще не все файлы и пакеты готовы к установке, поэтому у желающих опробовать публичную демо-версию могут возникнуть серьезные проблемы при попытке работы с PaddlePaddle.
Читать дальше →
Total votes 15: ↑15 and ↓0 +15
Comments 2

Microsoft представила обновление своего набора инструментов Cognitive Toolkit

Reading time 1 min
Views 6.8K
Programming *Machine learning *Development for Windows *


Вчера компания Microsoft в своем официальном блоге представила публике обновление своего набора инструментов Microsoft Cognitive Toolkit — системы для проектирования и обучения глубинных, сверточных и рекуррентных сетей.

Кроме того, Cognitive Toolkit дает возможность использовать обучение с подкреплением. Cognitive Toolkit предлагается использовать в таких сферах как распознавание объектов, речи и поиска релевантных результатов.
Читать дальше →
Total votes 12: ↑12 and ↓0 +12
Comments 1

«Яндекс» учредил научную премию имени Ильи Сегаловича

Reading time 2 min
Views 4.3K
Machine learning *Popular science IT-companies

Илья Сегалович (iseg)

Компания «Яндекс» объявила об учреждении ежегодной научной премии для поддержки молодых исследователей и научного сообщества в России, Беларуси и Казахстане. Премия им. Сегаловича вручается студентам, аспирантам и научным руководителям за достижения в компьютерных науках:

  • Машинное обучение
  • Компьютерное зрение
  • Информационный поиск и анализ данных
  • Обработка естественного языка и машинный перевод
  • Распознавание и синтез речи
Читать дальше →
Total votes 28: ↑27 and ↓1 +26
Comments 2

ИИ-платформа NVIDIA меняет видовую принадлежность животных

Reading time 2 min
Views 4.4K
Machine learning *Artificial Intelligence The future is here

Компания NVIDIA представила результаты своей работы над новым алгоритмом искусственного интеллекта в виде открытой онлайн-платформы, преобразующей изображения животных. Посетители могут загрузить фотографию домашнего питомца и увидеть, как он превращается в тигра, волка или леопарда, сохраняя при этом узнаваемые черты.
Читать дальше →
Total votes 10: ↑9 and ↓1 +8
Comments 0

Исследователи работают над слуховым аппаратом, который помогает сосредоточиться на одном из голосов

Reading time 2 min
Views 1.2K
Machine learning *Brain The future is here

15 мая инженеры из Колумбийского Института Цукермана опубликовали в журнале Science Advances промежуточные итоги своего экспериментального проекта – слухового аппарата, способного фокусироваться только на тех звуках, которые интересуют его владельца.
Читать дальше →
Total votes 9: ↑8 and ↓1 +7
Comments 2

Госкомпаниям РФ придётся внедрять машинное обучение и «цифровых двойников»

Reading time 3 min
Views 5.6K
Machine learning *Legislation in IT The future is here
В ближайшие годы крупнейшие государственные компании России должны пройти цифровую трансформацию и внедрить новейшие компьютерные технологии. Как стало известно РБК, Минкомсвязь разослала в ряд госкомпаний проект методических рекомендаций по разработке стратегий цифровой трансформации госкорпораций и компаний с госучастием. Документ должны обсудить на совещании 27 мая, а окончательную версию министерство обязано утвердить до 31 мая (согласно программе «Цифровая экономика»).

Каждая госкомпания обязана назначить специалиста на должность CDO (директор по цифровым трансформациям) с широкими полномочиями по изменению бизнес-процессов в компании.

Информированные источники приводят список требований, которые выдвигаются к государственным компаниям.
Читать дальше →
Total votes 9: ↑8 and ↓1 +7
Comments 3

Искусственный интеллект оценил авторство песен The Beatles

Reading time 2 min
Views 11K
Machine learning *Artificial Intelligence


Большое количество хитов группы The Beatles были написаны Джоном Ленноном и Полом Маккартни в соавторстве. Это подтверждали как участники группы, так и все, кто был к ним близок. Кроме того, есть и композиции, которые музыканты писали отдельно друг от друга, о чем они также рассказывали.

Тем не менее, есть музыка, авторство которой вызывает сомнение. В том смысле, что неизвестно точно, кто создавал эти произведения — Леннон или Маккартни. Для того, чтобы узнать истину, группа ученых из Гарвардского университета привлекла искусственный интеллект.
Читать дальше →
Total votes 11: ↑9 and ↓2 +7
Comments 16

Сбербанк с помощью ИИ предскажет выручку любой компании в России

Reading time 4 min
Views 6.2K
Machine learning *Artificial Intelligence
Специалисты Сбербанка разработали техническое решение для прогнозирования выручки компаний малого, среднего и крупного бизнеса. Модель построена для всех 8 млн компаний (ИП и юрлиц), присутствующих на российском рынке.

«Разработанная модель позволяет получать прогнозы выручки текущего года по всем активным ИНН на девять месяцев раньше, чем данные результаты публикуются официально. Это даёт возможность заранее планировать работу с компаниями. К тому же с помощью новой модели можно получать прогнозы в том числе и по ИП, информации о которых пока нет ни в одном открытом источнике, — сказано в пресс-релизе. — В данном случае была использована модель класса black box, основанная на деревьях решений — Random Forest Regression».
Читать дальше →
Total votes 5: ↑4 and ↓1 +3
Comments 15

«Чувство числа» возникает из распознавания визуальных объектов

Reading time 2 min
Views 7.2K
Mathematics *Machine learning *Popular science Artificial Intelligence Brain

Результаты нового исследования искусственного интеллекта указывают на то, что зрительная система спонтанно создает чувство числа без предварительного опыта подсчета.



У людей и животных есть «чувство числа», врожденная способность подсчитывать количество объектов в сцене. Считается, что нейронной основой этой способности являются так называемые нейроны числа, которые реагируют на определенные числа и были обнаружены в мозге человека и животных. Исследователи долго задавались вопросом, формируются ли эти нейроны числа в мозге только благодаря способности видеть — и если да, то как? Теперь группа исследователей во главе с профессором Андреасом Нидером из Института нейробиологии Университета Тюбингена изучила происхождение чувства числа, используя искусственную нейронную сеть. Результаты показывают, что чувство числа возникает спонтанно в визуальной системе без какого-либо опыта в подсчете. Исследование было опубликовано в издании Science Advances.
Читать дальше →
Total votes 12: ↑11 and ↓1 +10
Comments 21

Тренировка по машинному обучению 10 августа

Reading time 1 min
Views 3.9K
VK corporate blog Machine learning *Studying in IT Artificial Intelligence


Приглашаем 10 августа в московский офис Mail.ru Group на тренировку по машинному обучению.

Тренировка по машинному обучению — это открытый митап, на который мы приглашаем участников соревнований по анализу данных, чтобы познакомиться, рассказать про задачи, обменяться опытом участия и пообщаться. С докладами выступают опытные участники последних соревнований на Kaggle и других платформах, рассказывают о своих решениях: какие техники и методы использовали они сами, а какие помогли их конкурентам.
Программа встречи
Total votes 17: ↑17 and ↓0 +17
Comments 0

DeepCode — система анализа кода на базе глубинного обучения

Reading time 2 min
Views 7K
ITSumma corporate blog Programming *Big Data *GitHub *Machine learning *
Швейцарский стартап DeepCode разрабатывает систему автоматического код-ревью на базе глубинного обучения, сообщает venturebeat. На днях компания закрыла первый инвестиционный раунд и получила на свое развитие $4 млн.

В основе технологии, предлагаемой командой DeepCode, лежит семантический анализ кода вкупе с обучением нейросети с помощью Big Data. Самое интересное в этой разработке то, что в качестве базы данных для обучения сети будет использоваться код публичных репозиториев GitHub.


Кликабельно

Весь процесс разработчики разделяют на несколько этапов. Первый — разметка базы, то есть парсинг самого GitHub и сортировка данных. В качестве главного параметра будет выступать язык программирования, на котором написан проект. Далее идет разметка данных и подготовка спаршенного кода к потреблению нейросетью. Ну и последний, третий этап — это обучение самого DeepCode.
Читать дальше →
Total votes 17: ↑16 and ↓1 +15
Comments 11

Искусственный интеллект Google DeepMind попытается играть в футбол

Reading time 2 min
Views 4.7K
Algorithms *Machine learning *Artificial Intelligence


DeepMind, дочерняя компания Google, создала футбольный симулятор для тестирования алгоритмов машинного обучения. Видеоигра под названием Google Research Football Environment позволяет исследователям тестировать алгоритмы в основанном на физике и простом в использовании мире.

Футбольный симулятор в качестве обучающей платформы для ИИ был выбран неслучайно. Как сообщает статья на сайте Массачусетского технологического института, одна из задач для исследователей ИИ заключается в том, чтобы найти новые проблемы для алгоритмов машинного обучения, которые они могли бы решать и таким образом обучаться. Простые видеоигры, такие как Pong или Breakout, иногда слишком примитивны и предсказуемы для этих алгоритмов. Другие игры, такие как Starcraft, слишком сложны. Starcraft — стратегия в реальном времени, которая разворачивается в большой онлайн-вселенной, — настолько обширна и запутанна, что требует огромных вычислительных ресурсов для сбора соответствующих данных и обучения.
Читать дальше →
Total votes 8: ↑8 and ↓0 +8
Comments 0

Орегонский университет предлагает бороться с deepfake с помощью мышей

Reading time 2 min
Views 4.2K
Working with video *Image processing *Machine learning *Artificial Intelligence


В рамках борьбы с deepfake — видео и аудио, созданных с помощью искусственного интеллекта — исследователи Орегонского университета тестируют одну из самых необычных идей. Группа учёных пытается научить мышей распознавать незаметные для человеческого слуха различия в речи, чтобы затем обучить машину этому механизму распознавания.

Исследователи обучили мышей понимать небольшой набор фонем, которые отличают одно слово от другого. Мышки получали награду каждый раз, когда они правильно идентифицировали звуки, что составило до 80% случаев.

«Мы научили мышей определять разницу между звуками, окруженными разными гласными, в разных контекстах. Мы считаем, что есть возможность обучить мышей распознавать ложную и реальную речь», — рассказал Джонатан Сондерс, один из исследователей проекта, изданию BBC.
Читать дальше →
Total votes 13: ↑11 and ↓2 +9
Comments 3

Wall Street Journal: ИИ-стартап оказался подделкой, вместо машины код пишут люди

Reading time 2 min
Views 9.7K
Machine learning *Artificial Intelligence Finance in IT IT-companies


Wall Street Journal опубликовал отчёт, в котором утверждается, что стартап под названием Engineer.ai, который якобы использует ИИ для создания приложений, на самом деле представляет собой группу разработчиков-людей.

Стартап Engineer.ai стал известен в прошлом году после того, как представил революционный способ создания приложении с помощью «нескольких щелчков мышью». Руководство компании заявляло, что для этого используется искусственный интеллект. На мероприятии в Нью-Дели генеральный директор компании Сачин Дуггал рассказал, что он создал ИИ под названием «Наташа», который позволяет любому создать пользовательское приложение, и что это так же просто, как заказать пиццу.
Читать дальше →
Total votes 9: ↑9 and ↓0 +9
Comments 9

Исследователи Google DeepMind запустили бенчмарк SuperGLUE

Reading time 1 min
Views 2.6K
Machine learning *Artificial Intelligence


Исследователи Facebook совместно с Google DeepMind, Вашингтонским университетом и Нью-Йоркским университетом представили SuperGLUE — серию тестовых задач для измерения производительности искусственного интеллекта, распознающего речь.

SuperGLUE была создана на основе нейронной сети Google BERT. Производительность BERT, как сообщает VentureBeat, превзошла такие модели, как MT-DNN от Microsoft, XLNet от Google и RoBERTa от Facebook, которые обеспечивают высокую производительность — выше среднего базового уровня человека.
Читать дальше →
Total votes 5: ↑5 and ↓0 +5
Comments 0

Открытый проект Google помогает распознавать язык жестов с помощью смартфона

Reading time 2 min
Views 2.5K
Machine learning *Smartphones Artificial Intelligence The future is here


Миллионы людей общаются с помощью языка жестов, но до сих пор проекты по захвату сложных жестов и переводу их в устную речь не имели особого успеха. Новая методика отслеживания движений рук в реальном времени, разработанная лабораторией искусственного интеллекта Google и использующая фреймворк MediaPipe, может стать прорывом в этой сфере.

Методика использует машинное обучение для создания в реальном времени высокоточной карты руки и всех ее пальцев при помощи только смартфона и камеры.
Читать дальше →
Total votes 5: ↑4 and ↓1 +3
Comments 0

Moscow Data Science Major August 2019: программа и регистрация

Reading time 10 min
Views 6.2K
VK corporate blog Big Data *Machine learning *Conferences Artificial Intelligence
image
UPD: Присоединяйтесь к онлайн-трансляции:


31 августа 2019г. Mail.ru Group и сообщество Open Data Science приглашают на Moscow Data Science Major. Это как Data Fest, только мини. Событие состоит из 8 тематических блоков докладов, 1 ML-тренировки и 8 часов ударной порции нетворкинга и знакомств. Знакомьтесь с программой и регистрируйтесь! Вход на событие бесплатный, по одобренной регистрации. Регистрация закрывается в 28 августа в 17:00.
Смотреть программу
Total votes 33: ↑32 and ↓1 +31
Comments 9

ИИ для распознавания лиц используют для подсчёта шимпанзе

Reading time 2 min
Views 1.5K
Working with video *Machine learning *Artificial Intelligence The future is here


Исследователи из Оксфорда опубликовали работу в журнале Science Advances, в которой рассказывается, что учёные используют искусственный интеллект для того, чтобы лучше понять поведение животных — в данном случае шимпанзе.

Используя примерно 50 часов видеоматериалов, снятых за 14 лет, исследователи извлекли 10 миллионов изображений морд двадцати трёх шимпанзе. После этого изображения были обработаны нейронной сетью.

«Алгоритм оказался в состоянии идентифицировать животных с точностью до 93% и правильно определять их пол в 96% случаев», — пишут авторы исследования.
Читать дальше →
Total votes 9: ↑9 and ↓0 +9
Comments 0