Как стать автором
Обновить

Глава InfoWatch Наталья Касперская: большие данные россиян должны принадлежать государству

Информационная безопасность *


Глава компании InfoWatch Наталья Касперская в своей беседе с ТАСС заявила, что по ее мнению большие данные россиян должны быть признаны собственностью государства.

«Мое мнение, что эти данные должны являться собственностью государства, потому что пользователи этими данными не обладают. Пользователь отпустил их в информационное пространство, и утекло все, что он там написал. Значит, это не их принадлежность», — приводит слова Касперской информационное агентство.
Читать дальше →
Всего голосов 35: ↑31 и ↓4 +27
Просмотры 24K
Комментарии 140

Вебинар «Современные базы данных для аналитики: почему DWH лучше строить в облаке?» 18 июня от Mail.ru Group

Блог компании VK PostgreSQL *Облачные вычисления *Администрирование баз данных *Big Data *


Привет, друзья.

Хайп вокруг Big Data давно прошёл. Но потребность компаний в отказоустойчивой инфраструктуре для хранения и обработки больших данных стала даже острее. 18 июня мы приглашаем вас принять участие в вебинаре, на котором расскажем про аналитическую СУБД Arenadata DB на основе Greenplum.

Вы узнаете:

  • Как устроен Greenplum и для каких задач лучше использовать эту современную массивно-параллельную, изначально кластерную СУБД
  • Преимущества Greenplum в облаке по сравнению с BareMetal
  • Какие бизнес-задачи можно решать с помощью DWH, в основе которого лежит Greenplum
  • Как настроить и запустить Arenadata DB Cloud на базе Greenplum в облаке Mail.ru Group за пару минут

На вебинаре мы ответим на эти вопросы и расскажем про возможности Arenadata DB, которая теперь доступна в облаке Mail.ru Cloud Solutions

Вебинар пройдет 18 июня (четверг) в 17:00.

Регистрация обязательна, ссылка для подключения будет отправлена сразу после ее прохождения.
Подробнее о вебинаре
Всего голосов 11: ↑10 и ↓1 +9
Просмотры 1.7K
Комментарии 1

«Большие данные: не хайп, а индустрия». Митап 1 марта

Блог компании Southbridge IT-инфраструктура *Data Mining *Big Data *Data Engineering *


Приглашаем на митап «Большие данные: не хайп, а индустрия» в понедельник 1 марта. Спикеры из ITSumma и Слёрма представят доклады о Big Data, ответят на вопросы участников. Будем говорить о том, как получать и обрабатывать большие данные, какие выгоды и инсайты сможет получить бизнес при правильной работе с данными и какая обработка данных принесёт вред компании.

Читать дальше →
Всего голосов 8: ↑8 и ↓0 +8
Просмотры 937
Комментарии 0

Data-driven митап

Блог компании X5 Tech Data Mining *Big Data *Разработка под e-commerce *Data Engineering *

X5 выходит на тропу митапов. 2 апреля приходите на онлайн #meetupХ5 по data-driven подходу в наших проектах. Обещаем – все только самое интересное и эксклюзивное от самых главных спецов Big Data X5. С соблюдением дистанции, но с широким виртуальным охватом спикеры Х5 не только поговорят о последних разработках Х5, но и ответят на ваши вопросы.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Просмотры 930
Комментарии 0

Mail.ru Group открыла новый набор на бесплатное обучение в Академию больших данных MADE

Блог компании VK Big Data *Учебный процесс в IT

За полтора года студенты Академии MADE смогут бесплатно освоить одну из востребованных специальностей – дата-аналитика, дата-инженера или специалиста по машинному обучению. Заявки принимаются по 31 июля на сайте Академии больших данных MADE.

Программа Академии больших данных MADE рассчитана на ИТ-специалистов с опытом от одного до трех лет, которые хотят построить карьеру в области работы с большими данными. Студенты Академии будут не только изучать теорию, но и решать реальные задачи из практики Mail.ru Group. Они научатся создавать модели машинного обучения для высоконагруженных сервисов, осуществлять прикладной анализ данных, обработку больших данных и естественного языка, работать с компьютерным зрением и распознаванием речи — и многому другому. 

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 1.4K
Комментарии 1

Оффер за 2 дня в X5: для Data Analyst/Data Scientist

Блог компании X5 Tech Python *Data Mining *Big Data *Data Engineering *

Если ваш конёк — работа с большими данными, приглашаем на Weekend Offer в X5 Group. 

Мы сокращаем дистанцию до двух дней: 6-го июня интервью, 7-го июня оффер.

Откликнуться можно тут https://your.gms.tech/v/v6xoYc1w?tg=apply&s=tg

Читать далее
Всего голосов 9: ↑4 и ↓5 -1
Просмотры 3.2K
Комментарии 0

X5 Технологии заплатят 1.000.000 руб. «джавистам»

Java *Управление персоналом *
Recovery mode

Компания «X5 Group» проведет собственный ИТ-чемпионата среди профессионалов по Java-разработке. Финалистов ждет призовой фонд в 1.000.000 рублей, а также возможность получить предложение о работе от крупнейшего ретейлера России. ИТ-чемпионат пройдет 14 августа на технологической платформе All Cups.

Чемпионат для Java-разработчиков станет первым этапом турнира из серии DevMasters. Принять участие в нем смогут специалисты, знакомые с Java, Big Data и программным обеспечением логистики и ретейла. Команда «X5 Технологии» активно применяет продуктовый подход к разработке, практики CI/CD и DevOps, облачную инфраструктуру, модульное и интеграционное тестирование, поэтому участников ждут интересные прикладные задачи.  

Для участия в отборочном раунде разработчикам необходимо зарегистрироваться на платформе All Cups. Программа сформирует уникальный набор задач под каждого участника, а результаты заданий проверит независимая система оценки и в режиме онлайн сформирует личный рейтинг. 

По итогам чемпионата победители разделят призовой фонд 1.000.000 рублей и получат персональные предложения о работе в ИТ-команде «X5 Group». Компания планирует реализовать первый в истории массовый проект ИТ-рекрутинга и создать самое масштабное коммьюнити программистов в России.

Подробнее
Всего голосов 18: ↑5 и ↓13 -8
Просмотры 7.3K
Комментарии 13

Прямые эфиры со спикерами из Data Science

Блог компании МегаФон Big Data *Машинное обучение *История IT Data Engineering *

Привет!

На связи Team Leads МегаФона Big Data Ваня Горбань и Артём Глазунов. Мы решили провести серию voice chats со спикерами из DS-сообщества, а потом эти записи смонтировать в выпуски подкаста «Данные люди».

Это будут эфиры про данные и людей, которые с ними работают. Их истории и деятельность, как они к этому пришли и куда идут. В каждом выпуске приглашаем известных в сообществе Data Science и за его пределами и просто очень интересных людей поговорить об анализе данных.

Все voice chats будут проходить в тг-канале @bigdatapeople.

​Ближайшее расписание эфиров:

18 августа — Алексей Драль (Founder & CEO BigData Team)

24 августа — Рубен Ениколопов, (PhD, Ректор Российской Экономической Школы)

2 сентября — Юрий Кашницкий (Senior ML Scientist @ Elsevier, к.т.н., лидер открытого курса по машинному обучению mlcourse.ai)

Подслушать
Всего голосов 4: ↑3 и ↓1 +2
Просмотры 592
Комментарии 0

Проект Mozilla Common Voice добавил 16 языков и 4,6 тыс. часов речи

Open source *Big Data *

В результате сбора данных база проекта была пополнена 16 новыми языками, в том числе казахским, баса, армянским, белорусским, урду и гуарани. Большее количество часов было отдано английскому (2600), руанде (2260) и немецкому (1040).

Проект Common Voice нацелен на накопление базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи можно использовать без ограничений в системах машинного обучения и в исследовательских проектах.

Читать далее
Всего голосов 12: ↑12 и ↓0 +12
Просмотры 1.4K
Комментарии 1

В EPAM стартует Java Hiring Week

Блог компании EPAM Карьера в IT-индустрии

Компания EPAM приглашает Java-разработчиков Middle+ принять участие в Java Hiring Week. Одна из причин принять участие в мероприятии — вам не нужно долго ждать решения. В течение 48 часов после интервью вам будет сделан оффер. Если вы примете его в течение суток, то получите бонус в размере одного оклада.

Кроме того, 27 сентября в 11:00 пройдёт Projects Webinar. Приглашение придёт вам после регистрации.

Читать далее
Всего голосов 6: ↑3 и ↓3 0
Просмотры 2.1K
Комментарии 0

Онлайн-митап EXPF x Delivery Club про аналитику и статистику

Блог компании Delivery Club Tech Исследования и прогнозы в IT *Аналитика мобильных приложений *Конференции Статистика в IT

Всем привет!

25 ноября проведём совместный онлайн-митап Delivery Club и EXPF, посвященный аналитике. На митапе вы узнаете на примерах разных компаний, как проводятся эксперименты и почему возникают сложности с выбором критерия, как реализуются switchback-эксперименты, как искать точки роста и чем хороши непараметрические критерии.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 471
Комментарии 0

Вебинар «Работаем с большими данными в облаке» 2 декабря

Блог компании DataLine IT-инфраструктура *Облачные вычисления *Big Data *Облачные сервисы *

На пути к datadriven-подходу важно правильно подобрать инструмент для построения системы полного цикла работы с данными: от сбора и хранения до анализа и визуализации.

На вебинаре поговорим о том, из каких этапов и инструментов складывается грамотная работа с данными и какие преимущества дает облачная реализация.

Подробности и регистрация
Всего голосов 12: ↑11 и ↓1 +10
Просмотры 221
Комментарии 0

«Магнит» внедрит ИИ-системы в работу с покупателями

Big Data *Управление e-commerce *Искусственный интеллект

«Магнит» объявил о внедрении индивидуальных предложений для покупателей, составленных при помощи ИИ-систем.

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Просмотры 2.6K
Комментарии 15

Citymobil Data Meetup

Блог компании Ситимобил Big Data *

Серия митапов про Data Science в гео-данных, гео-сервисах, логистике, приложениях Smart City продолжается!

21 декабря в 19:00 МСК ждем всех на завершающей в этот год онлайн-встрече Citymobil Data Meetup

РЕГИСТРАЦИЯ

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 320
Комментарии 3

Подкасты Данные Люди

Блог компании МегаФон Python *Big Data *Искусственный интеллект Интервью

Привет, Хабра Пипл!

Тимлиды Data Science Ваня и Артём в формате войс-чата в телеграм-канале @bigdatapeople общаются с интересными людьми из сферы анализа данных и искусственного интеллекта. Послушайте наши эфиры на всех площадках.

- Дата сайентисты — жрецы нового времени? Алексей Драль — основатель и CEO Big Data Team.

- Эмпатия важнее математики? Что нужно дата-сайентисту будущего? Рубен Ениколопов — ректор РЭШ, PhD.

- Альтруизм и любовь к Machine Learning. Многорукий бандит — Юрий Кашницкий.

Читать далее
Всего голосов 4: ↑2 и ↓2 0
Просмотры 447
Комментарии 0

Первая публикация с участием ВТБ на главной конференции по Data Science — NeurIPS 2021

Блог компании ВТБ

NeurlPS — самая большая в мире и авторитетная среди data scientists конференция по машинному обучению и развитию искусственного интеллекта.

Алексей Пустынников (DS VTB Bank) и Дмитрий Еремеев (DS РОСГОССТРАХ) заняли 2 место в конкурсе Shifts Challenge в рамках NeurIPS 2021 и представили результаты своего исследования в рамках Bayesian Deep Learning workshop.

Конкурс, организованный коллаборацией Oxford Applied and Theoretical Machine Learning Group, Yandex Research и University of Cambridge, был посвящен применению и анализу техник байесовского глубокого обучения в промышленных задачах в условиях изменения распределения данных (distributional shift). Команда приняла участие в треке «Предсказание траекторий движения». Разработанное решение предсказывает наиболее вероятные будущие траектории участников дорожного движения, а также может оценить степень неуверенности модели в своих предсказаниях, что является ключевым элементом для безопасности беcпилотных автомобилей.

Команда заняла 2 место, опираясь на последние достижения в областях Bayesian Deep Learning и Vehicle Motion Prediction, при этом достигла наилучшей точности непосредственно в предсказании траекторий среди конкурентов. Для построения модели организаторы предоставили самый большой на текущий момент набор данных для задачи Motion Prediction, включающий в себя более 1600 часов движения, записанных во время поездок по городам России, Израиля и США в различных погодных условиях.

С результатами исследования можно ознакомиться в статье «Estimating Uncertainty For Vehicle Motion Prediction on Yandex Shifts Dataset» по ссылке arxiv.org/abs/2112.08355.

Читать далее
Всего голосов 11: ↑6 и ↓5 +1
Просмотры 310
Комментарии 0

Citymobil Data Meetup №6

Блог компании Ситимобил Big Data *Data Engineering *

Ситимобил продолжает серию митапов о применении Data Science и современных технологиях анализа данных для геосервисов.

В гости к нам в этот раз придет эксперт из компании МТS BigData.
 

Ждём вас 25 января в 18:30.

Мероприятие пройдет бесплатно в онлайне. Сначала будут доклады, а затем каждый из нас сможет поучаствовать в диалоге со спикерами. Так что советуем запастись интересными вопросами!

РЕГИСТРАЦИЯ 

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Просмотры 277
Комментарии 2

Сбер открыл бесплатный доступ к инструменту подготовки датасетов

Блог компании Сбер Big Data *Машинное обучение *Искусственный интеллект

Хорошая новость для разработчиков — мы открыли доступ к программной библиотеке PyTorch-LifeStream, которая содержит несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных датасетов.

Событийные данные могут представлять собой самые разные последовательности: истории посещений сайтов, покупок, событий в онлайн-играх и так далее. При этом сгенерированный на основе алгоритмов библиотеки эмбеддинг не будет содержать каких-либо персональных данных.  

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 2K
Комментарии 2

ВТБ запускает онлайн-соревнование для data scientists – Data Fusion Contest 2022

Блог компании ВТБ

Соревнование пройдет с 3 февраля по 3 апреля. Участников ждет призовой фонд в размере 2 000 000 рублей.

С помощью инструментов Platforma, а также технологии безопасного метчинга data exchange был сформирован синтетический датасет на обезличенных данных от ВТБ и «Ростелекома». При этом данные генерировались таким образом, чтобы сохранить необходимую для решения задачи информацию о пользовательском поведении.

Участникам необходимо построить решение, способное по последовательности транзакций пользователей ВТБ соотнести их с цифровым следом кликстрима пользователей «Ростелекома». Можно поучаствовать в любой из 3 задач и 2 специальных номинаций:

Задача 1: Matching. По данным транзакций и кликстримов построить обезличенные вектора, чтобы сопоставить и отранжировать пользователей. Контейнерный формат с 1 450 000 рублей призовых.

Задача 2: Puzzle. Разминка с соотнесением пользователей ВТБ и «Ростелекома» в ситуации, когда известны только кандидаты для сопоставления, но не сами пары. Формат разметки тестового файла с 300 000 рублей призовых.

Задача 3: Education. Образовательная задача с предсказанием уровня образования клиента по данным транзакций и кликстрима. Формат разметки тестового файла, с брендированным мерчом в качестве призов. 

Номинация 1: Companion. Номинация за лучшие публичные решения и материалы участников соревнований. Призовой фонд номинации 150 000 рублей.

Номинация 2: Insight. Номинация за интересные и нестандартные решения задач соревнования. Оценивается исследовательская новизна, инженерная эффективность, уникальность подхода. Победителей номинации определяет жюри, призовой фонд номинации: 100 000 рублей.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Просмотры 526
Комментарии 0

Аналитика в металлургии: онлайн-хакатон от «Северстали» и McKinsey

Блог компании Северсталь Python *Big Data *Хакатоны

Высокие технологии проникают во все отрасли бизнеса и промышленности, не исключая, конечно же, металлургию. Благодаря разным технологиям металлургические предприятия более эффективно используют ресурсы, мониторят качество продукции, улучшают показатели непрерывности процесса производства.

Но нет предела совершенству! И поэтому мы в ПАО «Северсталь» совместно с McKinsey и при поддержке Russian Hackers решили провести онлайн-хакатон для аналитиков и разработчиков в сфере поиска и анализа данных. Может быть, это как раз вы или ваши друзья?

Конечно, мы!
Всего голосов 8: ↑7 и ↓1 +6
Просмотры 2K
Комментарии 1