Pull to refresh

Глава InfoWatch Наталья Касперская: большие данные россиян должны принадлежать государству

Information Security *


Глава компании InfoWatch Наталья Касперская в своей беседе с ТАСС заявила, что по ее мнению большие данные россиян должны быть признаны собственностью государства.

«Мое мнение, что эти данные должны являться собственностью государства, потому что пользователи этими данными не обладают. Пользователь отпустил их в информационное пространство, и утекло все, что он там написал. Значит, это не их принадлежность», — приводит слова Касперской информационное агентство.
Читать дальше →
Total votes 35: ↑31 and ↓4 +27
Views 24K
Comments 140

Вебинар «Современные базы данных для аналитики: почему DWH лучше строить в облаке?» 18 июня от Mail.ru Group

VK corporate blog PostgreSQL *Cloud computing *Database Administration *Big Data *


Привет, друзья.

Хайп вокруг Big Data давно прошёл. Но потребность компаний в отказоустойчивой инфраструктуре для хранения и обработки больших данных стала даже острее. 18 июня мы приглашаем вас принять участие в вебинаре, на котором расскажем про аналитическую СУБД Arenadata DB на основе Greenplum.

Вы узнаете:

  • Как устроен Greenplum и для каких задач лучше использовать эту современную массивно-параллельную, изначально кластерную СУБД
  • Преимущества Greenplum в облаке по сравнению с BareMetal
  • Какие бизнес-задачи можно решать с помощью DWH, в основе которого лежит Greenplum
  • Как настроить и запустить Arenadata DB Cloud на базе Greenplum в облаке Mail.ru Group за пару минут

На вебинаре мы ответим на эти вопросы и расскажем про возможности Arenadata DB, которая теперь доступна в облаке Mail.ru Cloud Solutions

Вебинар пройдет 18 июня (четверг) в 17:00.

Регистрация обязательна, ссылка для подключения будет отправлена сразу после ее прохождения.
Подробнее о вебинаре
Total votes 11: ↑10 and ↓1 +9
Views 1.8K
Comments 1

«Большие данные: не хайп, а индустрия». Митап 1 марта

Southbridge corporate blog IT Infrastructure *Data Mining *Big Data *Data Engineering *


Приглашаем на митап «Большие данные: не хайп, а индустрия» в понедельник 1 марта. Спикеры из ITSumma и Слёрма представят доклады о Big Data, ответят на вопросы участников. Будем говорить о том, как получать и обрабатывать большие данные, какие выгоды и инсайты сможет получить бизнес при правильной работе с данными и какая обработка данных принесёт вред компании.

Читать дальше →
Total votes 8: ↑8 and ↓0 +8
Views 988
Comments 0

Data-driven митап

X5 Tech corporate blog Data Mining *Big Data *Development for e-commerce *Data Engineering *

X5 выходит на тропу митапов. 2 апреля приходите на онлайн #meetupХ5 по data-driven подходу в наших проектах. Обещаем – все только самое интересное и эксклюзивное от самых главных спецов Big Data X5. С соблюдением дистанции, но с широким виртуальным охватом спикеры Х5 не только поговорят о последних разработках Х5, но и ответят на ваши вопросы.

Читать далее
Total votes 4: ↑3 and ↓1 +2
Views 1K
Comments 0

Mail.ru Group открыла новый набор на бесплатное обучение в Академию больших данных MADE

VK corporate blog Big Data *Studying in IT

За полтора года студенты Академии MADE смогут бесплатно освоить одну из востребованных специальностей – дата-аналитика, дата-инженера или специалиста по машинному обучению. Заявки принимаются по 31 июля на сайте Академии больших данных MADE.

Программа Академии больших данных MADE рассчитана на ИТ-специалистов с опытом от одного до трех лет, которые хотят построить карьеру в области работы с большими данными. Студенты Академии будут не только изучать теорию, но и решать реальные задачи из практики Mail.ru Group. Они научатся создавать модели машинного обучения для высоконагруженных сервисов, осуществлять прикладной анализ данных, обработку больших данных и естественного языка, работать с компьютерным зрением и распознаванием речи — и многому другому. 

Читать далее
Total votes 5: ↑5 and ↓0 +5
Views 1.5K
Comments 1

Оффер за 2 дня в X5: для Data Analyst/Data Scientist

X5 Tech corporate blog Python *Data Mining *Big Data *Data Engineering *

Если ваш конёк — работа с большими данными, приглашаем на Weekend Offer в X5 Group. 

Мы сокращаем дистанцию до двух дней: 6-го июня интервью, 7-го июня оффер.

Откликнуться можно тут https://your.gms.tech/v/v6xoYc1w?tg=apply&s=tg

Читать далее
Total votes 9: ↑4 and ↓5 -1
Views 3.4K
Comments 0

X5 Технологии заплатят 1.000.000 руб. «джавистам»

Java *Personnel Management *
Recovery mode

Компания «X5 Group» проведет собственный ИТ-чемпионата среди профессионалов по Java-разработке. Финалистов ждет призовой фонд в 1.000.000 рублей, а также возможность получить предложение о работе от крупнейшего ретейлера России. ИТ-чемпионат пройдет 14 августа на технологической платформе All Cups.

Чемпионат для Java-разработчиков станет первым этапом турнира из серии DevMasters. Принять участие в нем смогут специалисты, знакомые с Java, Big Data и программным обеспечением логистики и ретейла. Команда «X5 Технологии» активно применяет продуктовый подход к разработке, практики CI/CD и DevOps, облачную инфраструктуру, модульное и интеграционное тестирование, поэтому участников ждут интересные прикладные задачи.  

Для участия в отборочном раунде разработчикам необходимо зарегистрироваться на платформе All Cups. Программа сформирует уникальный набор задач под каждого участника, а результаты заданий проверит независимая система оценки и в режиме онлайн сформирует личный рейтинг. 

По итогам чемпионата победители разделят призовой фонд 1.000.000 рублей и получат персональные предложения о работе в ИТ-команде «X5 Group». Компания планирует реализовать первый в истории массовый проект ИТ-рекрутинга и создать самое масштабное коммьюнити программистов в России.

Подробнее
Total votes 18: ↑5 and ↓13 -8
Views 7.4K
Comments 13

Прямые эфиры со спикерами из Data Science

МегаФон corporate blog Big Data *Machine learning *History of IT Data Engineering *

Привет!

На связи Team Leads МегаФона Big Data Ваня Горбань и Артём Глазунов. Мы решили провести серию voice chats со спикерами из DS-сообщества, а потом эти записи смонтировать в выпуски подкаста «Данные люди».

Это будут эфиры про данные и людей, которые с ними работают. Их истории и деятельность, как они к этому пришли и куда идут. В каждом выпуске приглашаем известных в сообществе Data Science и за его пределами и просто очень интересных людей поговорить об анализе данных.

Все voice chats будут проходить в тг-канале @bigdatapeople.

​Ближайшее расписание эфиров:

18 августа — Алексей Драль (Founder & CEO BigData Team)

24 августа — Рубен Ениколопов, (PhD, Ректор Российской Экономической Школы)

2 сентября — Юрий Кашницкий (Senior ML Scientist @ Elsevier, к.т.н., лидер открытого курса по машинному обучению mlcourse.ai)

Подслушать
Total votes 4: ↑3 and ↓1 +2
Views 689
Comments 0

Проект Mozilla Common Voice добавил 16 языков и 4,6 тыс. часов речи

Open source *Big Data *

В результате сбора данных база проекта была пополнена 16 новыми языками, в том числе казахским, баса, армянским, белорусским, урду и гуарани. Большее количество часов было отдано английскому (2600), руанде (2260) и немецкому (1040).

Проект Common Voice нацелен на накопление базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи можно использовать без ограничений в системах машинного обучения и в исследовательских проектах.

Читать далее
Total votes 12: ↑12 and ↓0 +12
Views 1.5K
Comments 1

В EPAM стартует Java Hiring Week

EPAM corporate blog IT career

Компания EPAM приглашает Java-разработчиков Middle+ принять участие в Java Hiring Week. Одна из причин принять участие в мероприятии — вам не нужно долго ждать решения. В течение 48 часов после интервью вам будет сделан оффер. Если вы примете его в течение суток, то получите бонус в размере одного оклада.

Кроме того, 27 сентября в 11:00 пройдёт Projects Webinar. Приглашение придёт вам после регистрации.

Читать далее
Total votes 6: ↑3 and ↓3 0
Views 2.2K
Comments 0

Онлайн-митап EXPF x Delivery Club про аналитику и статистику

Delivery Club Tech corporate blog Research and forecasts in IT *Mobile App Analytics *Conferences Statistics in IT

Всем привет!

25 ноября проведём совместный онлайн-митап Delivery Club и EXPF, посвященный аналитике. На митапе вы узнаете на примерах разных компаний, как проводятся эксперименты и почему возникают сложности с выбором критерия, как реализуются switchback-эксперименты, как искать точки роста и чем хороши непараметрические критерии.

Читать далее
Total votes 1: ↑1 and ↓0 +1
Views 603
Comments 0

Вебинар «Работаем с большими данными в облаке» 2 декабря

DataLine corporate blog IT Infrastructure *Cloud computing *Big Data *Cloud services *

На пути к datadriven-подходу важно правильно подобрать инструмент для построения системы полного цикла работы с данными: от сбора и хранения до анализа и визуализации.

На вебинаре поговорим о том, из каких этапов и инструментов складывается грамотная работа с данными и какие преимущества дает облачная реализация.

Подробности и регистрация
Total votes 12: ↑11 and ↓1 +10
Views 273
Comments 0

Citymobil Data Meetup

Ситимобил corporate blog Big Data *

Серия митапов про Data Science в гео-данных, гео-сервисах, логистике, приложениях Smart City продолжается!

21 декабря в 19:00 МСК ждем всех на завершающей в этот год онлайн-встрече Citymobil Data Meetup

РЕГИСТРАЦИЯ

Читать далее
Total votes 7: ↑7 and ↓0 +7
Views 399
Comments 3

Подкасты Данные Люди

МегаФон corporate blog Python *Big Data *Artificial Intelligence Interview

Привет, Хабра Пипл!

Тимлиды Data Science Ваня и Артём в формате войс-чата в телеграм-канале @bigdatapeople общаются с интересными людьми из сферы анализа данных и искусственного интеллекта. Послушайте наши эфиры на всех площадках.

- Дата сайентисты — жрецы нового времени? Алексей Драль — основатель и CEO Big Data Team.

- Эмпатия важнее математики? Что нужно дата-сайентисту будущего? Рубен Ениколопов — ректор РЭШ, PhD.

- Альтруизм и любовь к Machine Learning. Многорукий бандит — Юрий Кашницкий.

Читать далее
Total votes 4: ↑2 and ↓2 0
Views 577
Comments 0

Первая публикация с участием ВТБ на главной конференции по Data Science — NeurIPS 2021

ВТБ corporate blog

NeurlPS — самая большая в мире и авторитетная среди data scientists конференция по машинному обучению и развитию искусственного интеллекта.

Алексей Пустынников (DS VTB Bank) и Дмитрий Еремеев (DS РОСГОССТРАХ) заняли 2 место в конкурсе Shifts Challenge в рамках NeurIPS 2021 и представили результаты своего исследования в рамках Bayesian Deep Learning workshop.

Конкурс, организованный коллаборацией Oxford Applied and Theoretical Machine Learning Group, Yandex Research и University of Cambridge, был посвящен применению и анализу техник байесовского глубокого обучения в промышленных задачах в условиях изменения распределения данных (distributional shift). Команда приняла участие в треке «Предсказание траекторий движения». Разработанное решение предсказывает наиболее вероятные будущие траектории участников дорожного движения, а также может оценить степень неуверенности модели в своих предсказаниях, что является ключевым элементом для безопасности беcпилотных автомобилей.

Команда заняла 2 место, опираясь на последние достижения в областях Bayesian Deep Learning и Vehicle Motion Prediction, при этом достигла наилучшей точности непосредственно в предсказании траекторий среди конкурентов. Для построения модели организаторы предоставили самый большой на текущий момент набор данных для задачи Motion Prediction, включающий в себя более 1600 часов движения, записанных во время поездок по городам России, Израиля и США в различных погодных условиях.

С результатами исследования можно ознакомиться в статье «Estimating Uncertainty For Vehicle Motion Prediction on Yandex Shifts Dataset» по ссылке arxiv.org/abs/2112.08355.

Читать далее
Total votes 11: ↑6 and ↓5 +1
Views 379
Comments 0

Citymobil Data Meetup №6

Ситимобил corporate blog Big Data *Data Engineering *

Ситимобил продолжает серию митапов о применении Data Science и современных технологиях анализа данных для геосервисов.

В гости к нам в этот раз придет эксперт из компании МТS BigData.
 

Ждём вас 25 января в 18:30.

Мероприятие пройдет бесплатно в онлайне. Сначала будут доклады, а затем каждый из нас сможет поучаствовать в диалоге со спикерами. Так что советуем запастись интересными вопросами!

РЕГИСТРАЦИЯ 

Читать далее
Total votes 4: ↑3 and ↓1 +2
Views 396
Comments 2

Сбер открыл бесплатный доступ к инструменту подготовки датасетов

Сбер corporate blog Big Data *Machine learning *Artificial Intelligence

Хорошая новость для разработчиков — мы открыли доступ к программной библиотеке PyTorch-LifeStream, которая содержит несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных датасетов.

Событийные данные могут представлять собой самые разные последовательности: истории посещений сайтов, покупок, событий в онлайн-играх и так далее. При этом сгенерированный на основе алгоритмов библиотеки эмбеддинг не будет содержать каких-либо персональных данных.  

Читать далее
Total votes 7: ↑7 and ↓0 +7
Views 2.1K
Comments 2

ВТБ запускает онлайн-соревнование для data scientists – Data Fusion Contest 2022

ВТБ corporate blog

Соревнование пройдет с 3 февраля по 3 апреля. Участников ждет призовой фонд в размере 2 000 000 рублей.

С помощью инструментов Platforma, а также технологии безопасного метчинга data exchange был сформирован синтетический датасет на обезличенных данных от ВТБ и «Ростелекома». При этом данные генерировались таким образом, чтобы сохранить необходимую для решения задачи информацию о пользовательском поведении.

Участникам необходимо построить решение, способное по последовательности транзакций пользователей ВТБ соотнести их с цифровым следом кликстрима пользователей «Ростелекома». Можно поучаствовать в любой из 3 задач и 2 специальных номинаций:

Задача 1: Matching. По данным транзакций и кликстримов построить обезличенные вектора, чтобы сопоставить и отранжировать пользователей. Контейнерный формат с 1 450 000 рублей призовых.

Задача 2: Puzzle. Разминка с соотнесением пользователей ВТБ и «Ростелекома» в ситуации, когда известны только кандидаты для сопоставления, но не сами пары. Формат разметки тестового файла с 300 000 рублей призовых.

Задача 3: Education. Образовательная задача с предсказанием уровня образования клиента по данным транзакций и кликстрима. Формат разметки тестового файла, с брендированным мерчом в качестве призов. 

Номинация 1: Companion. Номинация за лучшие публичные решения и материалы участников соревнований. Призовой фонд номинации 150 000 рублей.

Номинация 2: Insight. Номинация за интересные и нестандартные решения задач соревнования. Оценивается исследовательская новизна, инженерная эффективность, уникальность подхода. Победителей номинации определяет жюри, призовой фонд номинации: 100 000 рублей.

Читать далее
Total votes 2: ↑2 and ↓0 +2
Views 621
Comments 0

Аналитика в металлургии: онлайн-хакатон от «Северстали» и McKinsey

Северсталь corporate blog Python *Big Data *Hackathon

Высокие технологии проникают во все отрасли бизнеса и промышленности, не исключая, конечно же, металлургию. Благодаря разным технологиям металлургические предприятия более эффективно используют ресурсы, мониторят качество продукции, улучшают показатели непрерывности процесса производства.

Но нет предела совершенству! И поэтому мы в ПАО «Северсталь» совместно с McKinsey и при поддержке Russian Hackers решили провести онлайн-хакатон для аналитиков и разработчиков в сфере поиска и анализа данных. Может быть, это как раз вы или ваши друзья?

Конечно, мы!
Total votes 8: ↑7 and ↓1 +6
Views 2.2K
Comments 1