Обновить
76.01

Data Engineering *

Обсуждаем вопросы сбора и подготовки данных

Сначала показывать
Порог рейтинга

MLOps, часть II: погружаемся в специфику работы с данными

Время на прочтение2 мин
Количество просмотров1.2K

Друзья, продолжая наш подкаст-проект «Деньги любят техно», мы рады представить вам вторую часть большой темы про MLOps, которую мы разбили на несколько эпизодов. Сегодня мы ещё глубже погружаемся в тему машинного обучения и работы с данными, лежащей в основе ML. Рассматриваем вопросы обогащения данных, разбираемся с разметкой, говорим о специфических аспектах управления данными.

Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, подошли к теме с двух сторон: теоретической и практической. Помогли ведущей подкаста разобраться с терминологией. А также поговорили про специфику подходов к образованию для специалистов в Data Science, DataOps и MLOps.

В этом выпуске вы услышите...

Yandex Cloud расширила программу обучения по хранению и обработке данных в облаке

Время на прочтение2 мин
Количество просмотров2K

Облачная платформа Yandex Cloud заявила о расширении программы обучения по хранению и обработке данных в облаке. В программе появились несколько курсов, включая курс для дата‑инженеров и дата‑аналитиков по работе с базой данных ClickHouse, представленной на платформе в виде управляемого сервиса. Обучение доступно на платформе «Яндекс Практикум», самостоятельно нужно оплатить только ресурсы облачной платформы для выполнения практических заданий

Читать далее

Вебинар «Облако vs on-premise: честное сравнение подходов к обработке данных»

Время на прочтение1 мин
Количество просмотров282

Растущий объем корпоративных данных и сложность обслуживания собственной инфраструктуры — проблемы насущные. Обсудим их — и не только — на вебинаре 29 августа «Облако vs on-premise: честное сравнение подходов к обработке данных».

Максим Еремин, руководитель по развитию PaaS-сервисов в beeline cloud, и Алексей Струченко, технический эксперт Arenadata, расскажут об особенностях обработки данных и облачного подхода, а также посчитают TCO хранения и управления данными в облаке и on-premise.

Читать далее

Узнайте, как дизайн-система помогает создавать эффективную отчетность

Время на прочтение1 мин
Количество просмотров473

Приглашаем на вебинар "Практика использования дизайн-системы при внедрении Business Intelligence"

29 августа в 15:00 поговорим о том, когда дизайн-система необходима и каким образом она помогает в создании отчетности. Мы рассмотрим принципы создания дизайн-систем и их составляющие и расскажем о результатах их применения на реальных примерах.

Спикером мероприятия станет Екатерина Благирева, архитектор по визуализации данных GlowByte, а также Михаил Греков, директор по развитию BI-системы Analytic Workspace.

Не упустите возможность узнать все тонкости использования дизайн-систем при внедрении BI и задать свои вопросы экспертам.

Регистрация по ссылке.

Узнать больше и зарегистрироваться

Новый сезон «Деньги любят техно»

Время на прочтение2 мин
Количество просмотров833

Друзья! Мы запустили новый сезон подкаста «Деньги любят техно» – он для тех, кто интересуется Data Science. Технологический обозреватель Марина Эфендиева вместе с экспертами ВТБ и гостями – известными учеными и лидерами DS команд крупных компаний  обсуждают горячие темы в области ИИ и работы с данными. Подкаст будет полезен дата-сайентистам и тем, кто только стремится им стать. 

Читать и слушать далее

Online dbt meetup — нас всё больше, а доклады всё интереснее

Время на прочтение1 мин
Количество просмотров925

Привет. Рады сообщить, что наконец мы набрались сил и докладов и готовы поделиться ими с вами :)

Митапы пройдут 20 июля в 19:00 (GMT+3) и 27 июля в 19:00 (GMT+3).

Программа 20 июля, 19:00:

Читать далее

SIBUR CHALLENGE 2023 с призовым фондом в 1 млн рублей

Время на прочтение1 мин
Количество просмотров763

Привет! Хотим пригласить вас на наше онлайн-соревнование для специалистов в области анализа данных и машинного обучения.

В чём суть — у нас есть две задачи на выбор. За лучшие решения каждой из предусмотрены денежные призы:

Первое место — 250 000 рублей.
Второе место — 150 000 рублей.
Третье место — 100 000 рублей.

В первой задаче, «Видеоаналитике», надо будет построить модель для...

Читать далее

Новый запуск курса My First Data Project: от идеи к продукту

Время на прочтение2 мин
Количество просмотров739

10 апреля сообщество AI Talent Hub и Передовая Инженерная Школа ИТМО запускают второй поток онлайн-курса My First Data Project по созданию реального продукта на данных с менторской поддержкой и возможностью поступить в магистратуру ИТМО без экзаменов.
Рассказываем, что нужно сделать!

Читать далее

Подкаст Данные Люди

Время на прочтение1 мин
Количество просмотров520

Привет, Хабр!

Новый выпуск уже доступен к прослушиванию!

Новые тенденции, истории про "тазы" в Бауманке и советы по Work-life balance в новом выпуске с Виталием Щербаковым - директором по большим данным и развитию дата-продуктов МегаФона ???

Присоединяйся к нашему сообществу @bigdatapeople В группе мы общаемся с интересными людьми из сферы анализа данных и искусственного интеллекта.

Приятного прослушивания!

Читать далее

Магистратура «Машинный интеллект в финансах» от МФТИ и Альфа-Банка

Время на прочтение3 мин
Количество просмотров1.5K

Открываем набор на совместную с Московским физико-техническим институтом (МФТИ) учебную программу — магистратуру «Машинный интеллект в финансах». Это бесплатное обучение ML, анализу данных, математике и разработке, стипендия и возможность попасть в IT-команду Альфа-Банка. Подробнее под катом.

Читать далее

Осталось 12 дней до конца регистрации на Data Fusion Contest. Призовой фонд — 2 млн рублей

Время на прочтение1 мин
Количество просмотров492

Уважаемые друзья! Соревнование ВТБ по машинному обучению Data Fusion Contest 2023 в самом разгаре. Уже определены победители первого турнира, которые разделят 600 тыс. рублей. А это значит, что в призовом фонде остались еще 1,4 млн рублей, за которые вы можете побороться до 2 апреля. Попробуйте свои силы в организации атак на модели машинного обучения и защиты от них (Adversarial Machine Learning). Соревнование проходит в турнирном формате и состоит из двух противоположных задач: «Атака» и «Защита».

И еще немного хороших новостей:

One Day Offer – для Data Engineer в Sportmaster Lab

Время на прочтение2 мин
Количество просмотров1.2K

Всем привет!

25 марта (суббота) мы приглашаем вас принять участие в One Day Offer для дата-инженеров. За один день вы можете пройти все этапы отбора и получить оффер от SM Lab.

One day offer пройдет 25 марта и будет состоять из нескольких этапов:

Вводная часть. Расскажем о работе в компании и ответим на вопросы участников. На всё про всё 30 минут.

Техническое интервью. Заранее назначим время технического интервью и отправим ссылку на комнату MS Teams, в которую подключится интервьювер. Длительность — 1,5 часа.

Оффер. Сообщим предварительные результаты в день интервью. А в понедельник направим оффер.

Чтобы принять участие, просто заполните заявку.

Читать далее

Бесплатное занятие по статистике: как анализировать данные и принимать решения на их основе

Время на прочтение1 мин
Количество просмотров1.2K

Приглашаем на бесплатный вебинар по аналитике от Нетологии. Директор по Data Science в «Работа.ру» расскажет, как правильно собирать и анализировать статистику на благо компании.

Читать далее

Ближайшие события

Новый сезон про Data Science уже в подкасте ВТБ

Время на прочтение3 мин
Количество просмотров1.3K

ВТБ запустил новый сезон про Data Science в подкасте Деньги любят техно. Шесть выпусков уже доступны для прослушивания:

Выпуск 1. А/В-тестирование и Data Science: как и для чего совместить

Александр Сахнов, руководитель отдела мультивариативного анализа X5 Group и Артём Летин, руководитель подразделения разработки моделей для корпоративного сегмента клиентов ВТБ обсудили метод А/В-тестирования для оценки изменений в бизнесе. Где, кроме маркетинга, применяются A/B-тесты, на какие этапы делится этот процесс и когда начинается работа датасайентистов?

Выпуск 2. Сколько датасайентистов может заменить AutoML

О практической и философской стороне AutoML, изменениях в роли специалиста в Data Science, прошлом и будущем построения моделей и возможностях Искусственного интеллекта рассуждают профи — Денис Суржко, начальник управления перспективных алгоритмов машинного обучения ВТБ и Алексей Натёкин, основатель ODS.

Выпуск 3. MLOps: зачем вам всё это надо

Для чего сегодня применяется MLOps и в каких задачах без него не обойтись завтра? Помогает ли MLOps бизнесу развивать Data Science или, может быть, мешает? В чём заключается роль специалиста по ML, и как специализации будут дробиться в будущем? В конце-концов, кто всем этим должен заниматься, и где этому учат, обсуждаем с Юрием Каревым, руководителем управления процессов и стандартов моделирования и машинного обучения ВТБ, и Петром Ермаковым, ML Brand Director Яндекса.

Выпуск 4. Дата-сайентисты — современные предсказатели?

Экспериментальный выпуск, который поможет эффективнее бороться с категоричностью и с крайностями в суждениях. Такого ещё никто не делал, а мы попробовали. В новом выпуске постарались выяснить, является ли профессия дата-сайентиста одной из древнейших. 
В дискуссии приняли участие специалисты из самых разных областей: 
Бронислав Виногродский, китаевед, писатель, переводчик основополагающих китайских текстов; Константин Воронцов, доктор физико-математических наук, профессор РАН, МГУ и МФТИ; Дмитрий Доронин, социальный антрополог, этнограф, научный сотрудник РГГУ и РАНХиГС; Наталия Пузырникова, заместитель председателя правления, руководитель службы управления рисками Газпромбанка; Денис Суржко, начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования ВТБ. Ведёт дискуссию Вадим Кулик, заместитель президента-председателя правления ВТБ.

Выпуск 5. Концепция Data Fusion: настоящее и будущее работы с данными

В России каждая четвертая компания использует технологии сбора и обработки больших данных, а в финансовой отрасли — почти каждая вторая компания. Обсуждаем тренды развития рынка данных: почему все чаще звучат идеи объединения данных из разных источников — естественно, безопасного и обезличенного. Нужно ли такое объединение данных бизнесу, и решения каких технологических задач оно потребует от дата-сайентистов. 
В новом выпуске подкаста «Деньги любят техно» серии Data Science на эти темы потеоретизировали вице-президент, заместитель руководителя департамента анализа данных и моделирования ВТБ Сергей Голицын и директор по разработке RnD центра Big Data МТС Никита Зелинский.

Выпуск 6. Злонамеренные атаки и ошибки обучения

Чем больше мы доверяем ИИ, тем чаще слышим о его ошибках и уязвимостях. Пробуем разобраться, какие с этим связаны риски сейчас и какие появятся в будущем. Почему многое зависит от входных данных на этапе обучения нейросети. И как часто в жизни встречаются адверсальные атаки. 
Дмитрий Берестнев, лидер стрима разработки моделей для партнеров и Платформы больших данных ВТБ, поговорил об этом с Григорием Кабатянским, д. ф.-м.н., вице-президентом по академическому сотрудничеству Сколтеха, и Иваном Фурсовым, специалистом в области разговорного искусственного интеллекта. Получилась одна из самых жарких дискуссий в специальной DS-серии нашего подкаста.

Слушайте новый сезон «Деньги любят техно» про Data Science на любой удобной для вас подкастерской площадке: Деньги любят техно – Podcast.ru.

Читать далее

Подкаст Данные Люди

Время на прочтение1 мин
Количество просмотров714

Привет, Хабра Пипл!

Наши тимлиды из команды BigData в новом выпуске подкаста "Данные люди" встретились с Александром Гусевым, к.т.н., директором по развитию бизнеса Webiomed, ст. научным сотрудником ЦНИИОИЗ Минздрава РФ.

Получился очень интересный и актуальный выпуск в сезон простуд.

Обменялись опытом, поговорили про применение DS в медицине, современные девайсы и этику работы с большими данными.

 Приятного прослушивания!

Подробнее

Онлайн-митап о Big Data и Data-анализе «Просто: данные»

Время на прочтение1 мин
Количество просмотров582

РТЛабс устраивает открытый митап! На этот раз поговорим о data-аналитике в контуре электронного правительства

Участие бесплатно, ждем всех!

6 декабря в 16:00 состоится митап «Просто: данные». Эксперты команды Госуслуг обсудят перспективы развития Data-аналитики, анализ данных в режиме реал-тайм, а также оптимизацию задач в Data-анализе

Читать далее

Снижаем убытки и автоматизируем аналитику с лайфхаками DevOps meetup от Evrone

Время на прочтение2 мин
Количество просмотров392

На прошедшем DevOps meetup мы вместе со спикерами из Lenvendo и Учи.ру познавали Zabbix и разбирались, какую практическую пользу может принести DataOps. Даже если вы не были на эфире, узнать много полезного можно с помощью видео докладов.

Читать далее

Quadcode Meetup: B-Tree индекс в PostgreSQL

Время на прочтение1 мин
Количество просмотров1.1K

На третьем митапе по PostgreSQL начнём разбирать тему индексов. Data Architect Азат Якупов расскажет о B-Tree индексе и его производных. 

Читать далее

Митап по машинному обучению. Обсудим новые инструменты для обучения ML-систем и состояние рынка в России

Время на прочтение1 мин
Количество просмотров788

Привет, Хабр!

15 сентября приглашаем на митап «Проблемы ML-команд в 2022». Поговорим о сложностях, трендах и инструментах построения production ML-систем.

Начнем в 18:30 и послушаем специалистов из Polymatica, Smart Consulting, Mediascope и Selectel. Ждем инженеров и разработчиков из сфер ML, AI, DevOps и Data science — онлайн или у нас в офисе.
Читать дальше →

Data Science Meet Up #2: LTV, Uplift, совершенство и Reject/Inference

Время на прочтение3 мин
Количество просмотров1.4K

Собираем митап в московском офисе. Доставайте винтажные олимпийки, неон и яркие очки — это Data Science Meet Up #2 в стиле кибер футуризма с фотозоной, электронным диджей-сетом и космическим световым оформлением. 

Читать далее