Обновить
76.01

Data Engineering *

Обсуждаем вопросы сбора и подготовки данных

Сначала показывать
Порог рейтинга

DataTalks 3.0 — программа третьей конференции по управлению данными Ростелекома

Время на прочтение2 мин
Количество просмотров711

24 и 25 ноября 2021 года Ростелеком в третий раз проведет конференцию по управлению данными DataTalks 3.0, где ведущие эксперты крупных компаний поделятся практическим опытом управления данными. В мероприятии примут участие представители Gartner, Сбера, Яндекс.Go, Билайна, Tele2, консалтинговой компании BSSG, SAS Россия/СНГ, Accenture и другие.

Встреча будет интересна студентам, специалистам в области управления данными, аналитикам данных и дата-инженерам, Chief Digital Officer (CDO), а также представителям бизнеса и ИТ-специалистам смежных направлений.

Читать далее

Хакатон для специалистов по DataScience

Время на прочтение1 мин
Количество просмотров2.3K

Московский кредитный банк (МКБ) проводит онлайн хакатон для молодых специалистов по Data Science. Если вы студент последних курсов или начинающий специалист МКБ предлагает проявить свои таланты в области DS и выиграть отличные призы.

Хочу принять участие

Arenadata выпустила новый продукт на базе Elasticsearch

Время на прочтение2 мин
Количество просмотров1.8K

Компания Arenadata завершила финальное тестирование нового продукта на базе технологии Elasticsearch — Arenadata LogSearch 1.0. (ADLS). Это один из первых продуктов на российском рынке, который обеспечивает быстрый доступ к технологии Elasticsearch и возможность работать с ней в гетерогенной ИТ-инфраструктуре (bare-metal, clouds, multi-clouds). 

Arenadata LogSearch — это масштабируемая отказоустойчивая система, предназначенная для анализа и полнотекстового поиска. Технология Elasticsearch была разработана для полнотекстового поиска на базе библиотеки Apache Lucene. Основной функциональной особенностью библиотеки является обеспечение масштабируемой и высокоскоростной индексации данных (создание объектов внутри базы данных, соответствующих определённым критериям поиска). Подобные системы особенно актуальны, когда необходим поиск по сложным запросам: поиск фраз, включающих разные части речи или поиск по географическим координатам.

Читать далее

Citymobil Data Meetup №3

Время на прочтение2 мин
Количество просмотров796

Ситимобил каждый месяц проводит митапы о применении Data science в городских и геосервисах, логистике и технологиях умных городов.

На митапе мы рассмотрим разные особенности применения современных технологий в геосервисах. Поговорим и о классическом data science в задачах прогнозирования времени прибытия, о проектирование data warehouse (DWH), чтобы можно было эффективно применять методы машинного обучения и строить дэшборды. А также продолжим говорить о Switchback-экспериментах (у нас уже был доклад об этом не первом митапе), которые часто просто незаменимы в геосервисах.
В этот раз в гости к Ситимобил придут коллеги из Самоката.

Ждём вас 28 октября в 18:00.  Регистрация

Читать далее

Вебинар «Как построить озеро данных и не слить бюджет»?

Время на прочтение1 мин
Количество просмотров439

На вебинаре 21 Октября в 11:00 МСК руководитель направления по развитию решений (DataLake) Atos и инженер по решениям Cloudera расскажут об особенностях, ключевых отличиях озер от обычных баз данных и о сферах, в которых они будут наиболее полезны.

Читать далее

Бесплатный курс-симулятор: введение в SQL

Время на прочтение1 мин
Количество просмотров6.9K

С 15 октября начнётся курс Нетологии «Введение в SQL и работу с базой данных». На пяти занятиях студенты изучат реальный кейс магазина, которому нужно собрать данные, настроить быстрый поиск информации и сформировать отчёты. После каждого урока обязательна практика и домашнее задание для закрепления навыков.

Что будет на курсе →

Citymobil Data Meetup #2

Время на прочтение2 мин
Количество просмотров446

На митапе мы рассмотрим задачи оптимального планирования маршрутов, диспетчеризации и прогнозирования времени в пути с разных сторон. Поговорим о том, как применяются модели машинного обучения и динамическое программирование для решения этих задач, обсудим влияние внешних факторов. Таких, например, как пробки. А также поймём, как строить жизненный цикл подобных Data Science-решений, чтобы можно было эффективно их масштабировать и развивать под нагрузкой. В гости к Ситимобил придут коллеги из Optimate AI и Яндекс.Маршрутизации.

Ждём вас 12 августа в 18:00.  Регистрация

Читать далее

28-29 августа прошел Data Science хакатон Digtial League AI Challenge

Время на прочтение1 мин
Количество просмотров1.2K

28-29 августа в подмосковном парке "Патриот" в рамках форума Армия 2021 прошел хакатон на тему искусственного интеллекта. Главным организатором хакатона выступило Новое Общественное Движение Цифровая Лига.

В хакатоне приняли участие молодые Data Science инженеры из Москвы, Московской области и Санкт-Петербурга. На хакатон пришло 10 команд в составе от 2 до 5 чел., всего 33 участника.

На протяжении 2-х дней участники решали задачу от ГосНИИАС, суть которой была в создании алгоритма на основе нейронной сети для обнаружения и классификации мишеней для стрельб.

Читать далее

Citymobil Data Meetup

Время на прочтение2 мин
Количество просмотров674

Ситимобил запускает митапы о применении Data science в городских и геосервисах, логистике и технологиях умных городов.

Вместе с коллегами из Циан и Яндекс GO обсудим обработку геоданных, проведение экспериментов в продуктах, где пользователи могут быть объединены сетевым эффектом и многое другое.

Читать далее

Прямые эфиры со спикерами из Data Science

Время на прочтение1 мин
Количество просмотров989

Привет!

На связи Team Leads МегаФона Big Data Ваня Горбань и Артём Глазунов. Мы решили провести серию voice chats со спикерами из DS-сообщества, а потом эти записи смонтировать в выпуски подкаста «Данные люди».

Это будут эфиры про данные и людей, которые с ними работают. Их истории и деятельность, как они к этому пришли и куда идут. В каждом выпуске приглашаем известных в сообществе Data Science и за его пределами и просто очень интересных людей поговорить об анализе данных.

Все voice chats будут проходить в тг-канале @bigdatapeople.

​Ближайшее расписание эфиров:

18 августа — Алексей Драль (Founder & CEO BigData Team)

24 августа — Рубен Ениколопов, (PhD, Ректор Российской Экономической Школы)

2 сентября — Юрий Кашницкий (Senior ML Scientist @ Elsevier, к.т.н., лидер открытого курса по машинному обучению mlcourse.ai)

Подслушать

Arenadata выпустила новый продукт для обмена данными между Greenplum и Spark

Время на прочтение2 мин
Количество просмотров1.3K
image

Компания Arenadata выпустила инструмент для обмена данными между Arenadata DB (аналитической MPP-СУБД на базе Greenplum) и Apache Spark (фреймворком для распределенной обработки данных, входящим в экосистему Hadoop) — ADB-Spark Connector. Продукт предназначен для высокоскоростной и параллельной передачи информации между Spark и Arenadata DB.
Читать дальше →

Курс «Анализ данных и машинное обучение в MATLAB»

Время на прочтение1 мин
Количество просмотров2.6K
Всем привет!

Стартовал короткий бесплатный курс по анализу данных и машинному обучению в MATLAB.

В ходе курса покажем:

  • Импорт данных в MATLAB
  • Процесс подготовки данных для машинного обучения
  • Метод быстрого обучения моделей и выбора лучшего алгоритма
  • Способ создания независимого от MATLAB приложения
Читать дальше →

Ближайшие события

Оффер за 2 дня в X5: для Data Analyst/Data Scientist

Время на прочтение2 мин
Количество просмотров4.2K

Если ваш конёк — работа с большими данными, приглашаем на Weekend Offer в X5 Group. 

Мы сокращаем дистанцию до двух дней: 6-го июня интервью, 7-го июня оффер.

Откликнуться можно тут https://your.gms.tech/v/v6xoYc1w?tg=apply&s=tg

Читать далее

Как победить букмекеров с помощью ИИ: опыт студентов магистратуры «Наука о данных»

Время на прочтение5 мин
Количество просмотров15K

Привет, Хабр! Сегодня хотим представить вам проект студентов магистратуры «Наука о данных» НИТУ МИСиС и Zavtra.Online (подразделении SkillFactory по работе с университетами) созданный на учебном "Межгалактическом Хакатоне 2021", который прошел в марте. Команда поделится решением выбранной задачи — предсказание победителя-бойца турнира UFC. Задача отличалась от прочих тем, что после написания модели из неё можно сделать целый продукт, оформив модель в приложение, готовое к использованию конечными пользователями, например теми, кто захочет обыграть букмекеров.

Читать далее

Соревнования по Data Science от OTUS и КРОК

Время на прочтение2 мин
Количество просмотров1.9K

14-16 мая в OTUS пройдут соревнования для Дата инженеров и специалистов по машинному обучению. Участникам предстоит за 2 дня решить задачи в категориях Machine Learning и Data Warehouse.

Задания рассчитаны на специалистов с опытом в профессии около года. Но испытать свои силы может любой желающий — участие бесплатное.

Читать далее

Cloudera митап про интерактивные SQL запросы к потоковым данным пройдет 27.04 в 16:00 МСК

Время на прочтение1 мин
Количество просмотров416


Cloudera Streaming Analytics предлагает SQL Stream Builder как сервис для создания непрерывных запросов к вашему потоку данных, используя SQL.

Конструктор SQL Stream Builder (SSB) — это комплексный интерфейс для создания заданий по обработке потоковых данных с контролем состояния данных с помощью SQL. Используя SQL, вы можете легко и просто создавать запросы, которые фильтруют, агрегируют, маршрутизируют и иным образом модифицируют потоки данных. SSB представляет собой интерфейс управления заданиями для компоновки и выполнения непрерывного SQL на потоках, а также для создания надежных API-интерфейсов для получения результатов.
Читать дальше →

Пилотный Cloudera митап про новую платформу CDP пройдет 25.03 в 16:00

Время на прочтение1 мин
Количество просмотров241


В рамках пилотного митапа мы расскажем о прогрессе адаптации клиентами новой платформы Cloudera Data Platform (CDP), которая объединила в себе лучшее из двух миров Hortonworks & Cloudera, обсудим дальнейшую судьбу дистрибутива CDP, архитектуру частного облака и последние новинки в мире больших данных и планы на развитие и усовершенствование нашей платформы.

Также в конце встречи выберем наиболее интересные темы для следующих митапов и ответим на вопросы!

Кому будет полезен митап

Всем пользователям и разработчикам, работающим на дистрибутивах HDP/CDH/CDP, которые хотят узнать больше о новой платформе и планах на развитие дистрибутива.

Зарегистрироваться на митап

Data-driven митап

Время на прочтение1 мин
Количество просмотров1.3K

X5 выходит на тропу митапов. 2 апреля приходите на онлайн #meetupХ5 по data-driven подходу в наших проектах. Обещаем – все только самое интересное и эксклюзивное от самых главных спецов Big Data X5. С соблюдением дистанции, но с широким виртуальным охватом спикеры Х5 не только поговорят о последних разработках Х5, но и ответят на ваши вопросы.

Читать далее

16 марта состоится крупнейший в EMEA вебинар от Cloudera

Время на прочтение1 мин
Количество просмотров442


Уже в ближайший вторник, 16 марта, в 15:00 МСК состоится крупнейшее в EMEA онлайн-событие Cloudera Now 21: Data That Moves You… Fast. Secure. Hybrid. Now.

В рамках этого вебинара технические эксперты Клаудеры покажут, как построить современную гибридную платформу больших данных, реализуя потенциал Cloudera Data Platform (CDP).
Читать дальше →