Pull to refresh

Первая публикация с участием ВТБ на главной конференции по Data Science — NeurIPS 2021

Reading time 1 min
Views 417
ВТБ corporate blog

NeurlPS — самая большая в мире и авторитетная среди data scientists конференция по машинному обучению и развитию искусственного интеллекта.

Алексей Пустынников (DS VTB Bank) и Дмитрий Еремеев (DS РОСГОССТРАХ) заняли 2 место в конкурсе Shifts Challenge в рамках NeurIPS 2021 и представили результаты своего исследования в рамках Bayesian Deep Learning workshop.

Конкурс, организованный коллаборацией Oxford Applied and Theoretical Machine Learning Group, Yandex Research и University of Cambridge, был посвящен применению и анализу техник байесовского глубокого обучения в промышленных задачах в условиях изменения распределения данных (distributional shift). Команда приняла участие в треке «Предсказание траекторий движения». Разработанное решение предсказывает наиболее вероятные будущие траектории участников дорожного движения, а также может оценить степень неуверенности модели в своих предсказаниях, что является ключевым элементом для безопасности беcпилотных автомобилей.

Команда заняла 2 место, опираясь на последние достижения в областях Bayesian Deep Learning и Vehicle Motion Prediction, при этом достигла наилучшей точности непосредственно в предсказании траекторий среди конкурентов. Для построения модели организаторы предоставили самый большой на текущий момент набор данных для задачи Motion Prediction, включающий в себя более 1600 часов движения, записанных во время поездок по городам России, Израиля и США в различных погодных условиях.

С результатами исследования можно ознакомиться в статье «Estimating Uncertainty For Vehicle Motion Prediction on Yandex Shifts Dataset» по ссылке arxiv.org/abs/2112.08355.

Читать далее
Total votes 11: ↑6 and ↓5 +1
Comments 0

Автоматический перевод текста, HTML, файлов без ограничений на 100 языков для ваших проектов. Офлайн. API, сервер, SDK

Reading time 5 min
Views 4.7K
Self Promo

Я занимаюсь переводчиками с 2012 года, и эта тема выбрана не случайно. Еще тогда было замечено, насколько сильно переводы могут влиять на показатели бизнеса. В нашем случае поддержка всего 15 языков вместо одного позволила увеличить количество скачиваний мобильных приложений до 35 миллионов без затрат на рекламу. Никакие другие действия не давали такой пользы с учетом потраченного времени и денег. И это стало основной причиной того, почему я выбрал это направление.

Несмотря на глобализацию, проблема языкового барьера до сих пор актуальна. В мире насчитывается более 7 тысяч языков, на которых общаются более 7 миллиардов жителей. По статистике, каждый год более 1 миллиарда человек ищут в интернете решения, связанные с переводами.

Каждый день увеличивается количество данных на разных языках. Доля английского языка в интернете сократилась до 25% в последние годы.

· Согласно недавнему опросу в восьми странах, более 72% потребителей заявили, что у них больше шансов совершить покупку на веб-сайте, если он будет на их родном языке.

· 42% потребителей Европейского Союза не покупают товары или услуги, представленные на иностранном языке, даже если они свободно говорят на этом языке.

· Компании, которые локализовали свой контент, в 2,5 раза чаще испытывают рост прибыли в годовом исчислении и в 1,8 раза чаще испытывают рост доходов.

· Для предприятий, локализовавших информацию, предназначенную для коммуникации с клиентами и партнерами, увеличение выручки было в 2,67 раза более вероятным, а рост прибыли — в 2,6 раза более вероятным.

Читать далее
Total votes 4: ↑3 and ↓1 +2
Comments 9

ВТБ запускает онлайн-соревнование для data scientists – Data Fusion Contest 2022

Reading time 2 min
Views 658
ВТБ corporate blog

Соревнование пройдет с 3 февраля по 3 апреля. Участников ждет призовой фонд в размере 2 000 000 рублей.

С помощью инструментов Platforma, а также технологии безопасного метчинга data exchange был сформирован синтетический датасет на обезличенных данных от ВТБ и «Ростелекома». При этом данные генерировались таким образом, чтобы сохранить необходимую для решения задачи информацию о пользовательском поведении.

Участникам необходимо построить решение, способное по последовательности транзакций пользователей ВТБ соотнести их с цифровым следом кликстрима пользователей «Ростелекома». Можно поучаствовать в любой из 3 задач и 2 специальных номинаций:

Задача 1: Matching. По данным транзакций и кликстримов построить обезличенные вектора, чтобы сопоставить и отранжировать пользователей. Контейнерный формат с 1 450 000 рублей призовых.

Задача 2: Puzzle. Разминка с соотнесением пользователей ВТБ и «Ростелекома» в ситуации, когда известны только кандидаты для сопоставления, но не сами пары. Формат разметки тестового файла с 300 000 рублей призовых.

Задача 3: Education. Образовательная задача с предсказанием уровня образования клиента по данным транзакций и кликстрима. Формат разметки тестового файла, с брендированным мерчом в качестве призов. 

Номинация 1: Companion. Номинация за лучшие публичные решения и материалы участников соревнований. Призовой фонд номинации 150 000 рублей.

Номинация 2: Insight. Номинация за интересные и нестандартные решения задач соревнования. Оценивается исследовательская новизна, инженерная эффективность, уникальность подхода. Победителей номинации определяет жюри, призовой фонд номинации: 100 000 рублей.

Читать далее
Total votes 2: ↑2 and ↓0 +2
Comments 0

Акция на билеты на Pycon Weekend 2022

Reading time 1 min
Views 367
IT-People corporate blog Python *Conferences

До Pycon Weekend осталось меньше двух недель! Ждем вас на душевной объединяющей конференции по python в горах.

Давайте вместе отвлечемся от всего, что происходит вокруг. Вас ждут 12 крутых докладов, нетворкинг, свежий воздух и красивые пейзажи.

Мы хотим вас поддержать и увидеться, поэтому ПРИХОДИТЕ ВТРОЕМ, А ПЛАТИТЕ ЗА ДВОИХ! Билеты можно купить тут. Для участия в акции просто оплатите два билета или запросите счет на участие двух сотрудников.

P.S. Самолеты в Сочи летают, гостиницы и курорт работают, qr-коды нигде не нужны.

Читать далее
Total votes 6: ↑6 and ↓0 +6
Comments 0

Видеокурс по «Machine Learning»

Reading time 2 min
Views 1.3K
Southbridge corporate blog

Наш новый курс «Machine Learning» для программистов, которые хотят переквалифицироваться. Во время обучения вы будете решать задачи, приближённые к реальным.

Вас ждёт много практики и понятная теория. Знаний и навыков, которые вы получите, будет достаточно, чтобы самостоятельно решать задачи классического ML и начать карьеру.

Читать далее
Total votes 10: ↑10 and ↓0 +10
Comments 1

Устроиться ВКонтакте за два дня: Weekend Offer для ML- и RecSys-разработчиков

Reading time 1 min
Views 851
VK corporate blog Machine learning *IT career IT-companies Remote work

2 и 3 июля приглашаем ML- и RecSys-разработчиков на Weekend Offer. За одни выходные вы познакомитесь с тимлидами, узнаете о работе ВКонтакте, побываете на всех собеседованиях и, возможно, присоединитесь к нашей команде. Регистрируйтесь.

Узнать подробности
Total votes 5: ↑4 and ↓1 +3
Comments 0

Приходите познакомиться с MTS AI на Machines Can See

Reading time 1 min
Views 264
MTS AI corporate blog IT career

Какие у вас планы на первый день второго летнего месяца? 

Со своими мы уже определились. MTS AI примет участие в саммите Machines can see, который пройдет 1 июля. В деловой части форума наши коллеги представят платформу VSaaS – инструмент для разработки сервисов облачного видеонаблюдения и аналитики для бизнеса. Тимлид MTS AI Сурен Хоренян расскажет захватывающую историю о том, как развивался этот проект. Спойлер: на самом деле, этот должен был быть сервис видеоаналитики, но потребности клиентов и необходимость обходить технические барьеры превратили его во многофункциональную платформу. 

А еще вы узнаете топ самых важных причин, почему вам не нужно создавать собственную систему облачного видеонаблюдения. Именно так и называется презентация Сурена на форуме Machines can see 1 июля.

На форуме также будет работать стенд MTS AI. Здесь вы можете встретиться с нашими HR-менеджерами, которые с удовольствием расскажут, как построить карьеру в  MTS AI. У нас много открытых вакансиях и возможностей для тех, кто на ты с Python, имеет опыт в разработке, CV, ML и NLP. Всем гостям форума мы предложим непростую задачку, за решение которой подарим фирменный и очень необходимый летом мерч. 

Приходите познакомиться с MTS AI и послушать доклад о VSaaS на Machines can see. 

MCS пройдет 1 июля в Центральном доме предпринимателя в Москве по адресу Покровка, 47. Регистрируйтесь на сайте саммита, чтобы не пропустить одно из интереснейших событий лета.

Читать далее
Total votes 1: ↑1 and ↓0 +1
Comments 0

Вебинар «Встраиваем процесс разработки компонентов с ИИ в модельно-ориентированную инженерию»

Reading time 1 min
Views 111
ЦИТМ Экспонента corporate blog Machine learning *Artificial Intelligence Systems engineering *

15 сентября, 10:00, Онлайн

Регистрируйтесь на бесплатный вебинар, и узнайте, как облегчить проектирование сложных систем с ИИ, разрабатываемых в модельно-ориентированном процессе, как протестировать систему в модельном окружении через симуляцию, как сгенерировать код для прототипов на промежуточных аппаратных платформах (CPU/GPU). 

Читать далее
Rating 0
Comments 0

Factory5 представила бесплатный сервис по анализу данных для решения задач бизнеса с помощью ИИ

Reading time 2 min
Views 669
Factory5 corporate blog Data Mining *Big Data *Machine learning *

Российский разработчик программного обеспечения для промышленности Factory5 выпустил F5 Future — облачный сервис no-code приложений с использованием машинного обучения. Сервис призван решать бизнес-задачи, связанные с выявлением закономерностей, прогнозированием целевых показателей, а также проверять гипотезы.

Читать далее
Total votes 3: ↑3 and ↓0 +3
Comments 0

Митап Data People by GlowByte: Решение есть! Платформа управления рисками, цифровой советник в IoT

Reading time 1 min
Views 158
GlowByte corporate blog Big Data *Conferences

Друзья, мы определили новую дату проведения митапа Data People by GlowByte и приглашаем присоединиться к нам 22 ноября в 18:00!

Как и планировали, расскажем про актуальные архитектурные решения: как создаётся модульная финтех-платформа для управления рисками и как на продуктовую разработку влияют особенности “нишевого” сегмента рынка, как кастомное решение “цифровой советник” позволяет встроить предиктивную аналитику в технологический процесс на производстве, какие компоненты используются в системах оптимизации, какие типовые проблемы возникают при их интеграции и как можно их преодолеть во время внедрения.

Узнать, что в программе
Total votes 3: ↑3 and ↓0 +3
Comments 0

Java & Machine Learning Engineer (work in Tokyo)

Reading time 2 min
Views 403
Programming *Java *Scala *Machine learning *

Software Engineer with Java/Scala is needed!

🪙 45 000 - 60 000 USD net per year

🔥 B2B long-term permanent contract 

📌 Direct employment by the client

📣 Professional equipment provided

🌏 Move to Japan and work in the heart of Tokyo!

Do you want to do impactful work that will be deployed to millions of citizens weekly? Do you want your input to be heard and taken into consideration? Apply and create a digital future with us!

We are looking for a Junior/Mid Software Engineer for a Silicon Valley-based startup focused on full-cycle Machine Learning and Data Science automation. Their platform automates the entire process of building predictive models starting from raw business data through data and feature engineering to machine learning all the way to production. 

Contact us here: recruitment@devsdata.com or check our website: https://devsdata.com/careers/job/software-engineer-with-java-scala/

Read more
Total votes 5: ↑0 and ↓5 -5
Comments 0

Делимся опытом создания ML-платформы на базе Open Source

Reading time 1 min
Views 370
Selectel corporate blog Machine learning *

Привет, Хабр!

1 декабря наши специалисты по машинному обучению расскажут, как создавали и запускали ML-платформу на базе Open Source компонентов. Встречу проведем онлайн. Будет интересно ML-разработчикам, MLOps- и DevOps-инженерам, руководителям команд R&D ML-разработки. 

Читать далее
Total votes 10: ↑10 and ↓0 +10
Comments 0

Вебинар «Цифровой двойник трансформатора: на пути к интеллектуальному мониторингу»

Reading time 1 min
Views 229
ЦИТМ Экспонента corporate blog Machine learning *Matlab *Energy and batteries Artificial Intelligence

9 февраля, 10:00, Онлайн

Вебинар будет состоять из двух частей. В первой части будет обсуждаться роль цифровых двойников в предсказательном обслуживании. Далее будет построен цифровой двойник настоящего трансформатора малой мощности, используя MATLAB/Simulink, усилитель и КПМ РИТМ.

Во второй части вебинара будет рассказано о существующих подходах к организации предсказательного обслуживания. Будут разобраны этапы разработки алгоритма предсказательного обслуживания на основе данных, полученных с цифрового двойника трансформатора. Будет показана разработка алгоритма предиктивной аналитики с помощью инструментов Predictive Maintenance Toolbox в MATLAB: путь от извлечения характеристик из сигналов до получения модели машинного обучения.

Читать далее
Total votes 3: ↑3 and ↓0 +3
Comments 0

Мультифакторный анализатор деятельности произвольного предприятия на IEM-платформе

Reading time 3 min
Views 3.9K
Ultima corporate blog Big Data *Mathematics *Development for e-commerce *Machine learning *
Recovery mode

WANTED: талантливые математики на интересный и денежный контракт
Целевая специализация — матстатистика, матмоделирование, нейросети.
Описание задачи — ниже.


Вторая попытка по человечески сформулировать задачу из предыдущего постинга.

Читать дальше →
Total votes 15: ↑11 and ↓4 +7
Comments 14

Машинное обучение на Python-е с интерактивными Jupyter демонстрациями

Reading time 3 min
Views 33K
Python *Machine learning *Artificial Intelligence

image


Здравствуйте, Читатели!


Недавно я запустил репозиторий Homemade Machine Learning, который содержит примеры популярных алгоритмов и подходов машинного обучения, таких как линейная регрессия, логистическая регрессия, метод K-средних и нейронная сеть (многослойный перцептрон). Каждый алгоритм содержит интерактивные демо-странички, запускаемые в Jupyter NBViewer-e или Binder-e. Таким образом у каждого желающего есть возможность изменить тренировочные данные, параметры обучения и сразу же увидеть результат обучения, визуализации и прогнозирования модели у себя в браузере без установки Jupyter-а локально.

Читать дальше →
Total votes 20: ↑19 and ↓1 +18
Comments 5

Сезон чемпионатов 2019 открыт! Стартует SNA Hackathon аля ML Boot Camp 8

Reading time 5 min
Views 5K
VK corporate blog Abnormal programming *Data Mining *Big Data *Machine learning *

Привет!

Многие из читателей уже знают, что мы стараемся постоянно проводить различные IT-чемпионаты по самым разным тематикам. Только в прошлом году провели более 10 разных крупных соревнований (Russian AI Cup, ML Boot Camp, Технокубок и другие). В них приняло участие не менее 25 000 человек, а с 2011 года — более 150 000.

Если вы только сейчас узнали об этом, то поздравляем: именно с этой минуты вы стали частью большого сообщества людей, участвующих в наших соревнованиях и обменивающихся опытом друг с другом. Уже сейчас вы можете присоединиться к Telegram-группам сообществ по искусственному интеллекту, спортивному программированию, высоконагруженным проектам и администрированию, машинному обучению и анализу данных. Это поможет вам быстрее втянуться в серьёзную тусовку!



Итак, перейдём к делу. Сегодня, 7 февраля, мы рады открыть новый сезон чемпионатов 2019 года. И начнём с уже восьмого соревнования по машинному обучению и анализу данных, проводимого на специализированной платформе ML Boot Camp (наш аналог Kaggle) — SNA Hackathon, или ML Boot Camp 8 (как вам удобнее).
Читать дальше →
Total votes 40: ↑35 and ↓5 +30
Comments 2

NeurIPS 2019: тренды ML, которые будут с нами следующее десятилетие

Reading time 11 min
Views 6.9K
Сбер corporate blog Machine learning *Research and forecasts in IT *Artificial Intelligence Natural Language Processing *
NeurIPS (Neural Information Processing Systems) – самая большая конференция в мире по машинному обучению и искусственному интеллекту и главное событие в мире deep learning.

Будем ли мы, DS-инженеры, в новом десятилетии осваивать еще и биологию, лингвистику, психологию? Расскажем в нашем обзоре.


Total votes 14: ↑14 and ↓0 +14
Comments 0

Python Gateway в InterSystems IRIS

Reading time 18 min
Views 1.8K
InterSystems corporate blog Python *Database Administration *Big Data *Data Engineering *
Tutorial
Translation

Эта статья посвящена Python Gateway — комьюнити-проекту с открытым исходным кодом для платформы данных InterSystems IRIS. Этот проект позволяет оркестрировать любые алгоритмы машинного обучения, созданные на языке Python (основная среда для многих Data Scientists), использовать многочисленные готовые библиотеки для быстрого создания адаптивных, роботизированных аналитических AI/ML-решений на платформе InterSystems IRIS. В этой статье я покажу как InterSystems IRIS может оркестровать процессы на языке Python, эффективно осуществлять двустороннюю передачу данных и создавать интеллектуальные бизнес-процессы.

Читать дальше →
Total votes 8: ↑8 and ↓0 +8
Comments 0

Machine learning in browser: ways to cook up a model

Reading time 12 min
Views 1.6K
Python *Node.JS *Machine learning *

With ML projects still on the rise we are yet to see integrated solutions in almost every device around us. The need for processing power, memory and experimentation has led to machine learning and DL frameworks targeting desktop computers first. However once trained, a model may be executed in a more constrained environment on a smartphone or on an IoT device. A particularly interesting environment to run the model on is browser. Browser-based solutions may be used on a wide range of devices, desktop and mobile, online and offline. The topic of this post is how to prepare a model for the in-browser usage.

This post presents an end-to-end implementations of a model creation in Python and Node.js. The end goal is to create a model and to use it in a browser. I'll use TensorFlow and TensorFlow.js as main frameworks. One could train a model in Python and convert it to JS. Alternative is to train a model directly in javascript, hence omitting the conversion step.

I have more experience in Python and use it in my everyday work. I occasionally use javascript, but have very little experience in the contemporary front-end development. My hope from this post that python developers with little JS experience could use it to kick start their JS usage.

Read more
Total votes 3: ↑3 and ↓0 +3
Comments 0

Роль математики в машинном обучении

Reading time 7 min
Views 7.8K
OTUS corporate blog Big Data *Mathematics *Machine learning *
Translation

Прямо сейчас OTUS открывает набор на новый поток продвинутого курса "Математика для Data Science", в связи с этим хотим пригласить вас на бесплатный вебинар, в рамках которого наш эксперт - Петр Лукьянченко, подробно расскажет о программе курса, а также ответит на интересующие вас вопросы.

«Так ли необходимо разбираться в математике, лежащей в основе алгоритмов машинного обучения? В Python ведь уже есть масса широко доступных библиотек, которые можно без труда использовать для построения моделей!»

Я слышал это от дата-сайентистов любителей не один раз. Это заблуждение распространено куда больше, чем хотелось бы, и продолжает порождать наивные фантазии среди начинающих профессионалов в области обработки данных.

Давайте проясним это раз и навсегда - чтобы стать дата-сайентистом, вам нужно понимать математику, стоящую за алгоритмами машинного обучения. Это неотъемлемая часть роли специалиста по работе с данными, и каждый рекрутер и эксперт в области машинного обучения подтвердит это.

Читать далее
Total votes 8: ↑6 and ↓2 +4
Comments 0