Pull to refresh

Наблюдаем за пользователем – два типа timestamp

Reading time2 min
Views10K
Давным-давно, один специалист по базам данных (из тех, бородатых и уже седых) сказал мне, что метки времени (timestamp) — это самая сложная тема в базах данных. Я ему, правда, не поверил, но приколы со временем реально встречаются.

Есть стандартная проблема, которую часто вижу в чужих данных. Положим собрались вы отслеживать события/действия пользователя. Обычно у вас будет это делать некий код (JS в вебе или SDK для аппов), который будет слать данные серверу.

Каждому событию нужна метка времени. И есть выбор из двух: локальное время на клиенте или время получения события сервером. Один хороший совет что делать и загадка без ответа под катом
Читать дальше →
Total votes 15: ↑12 and ↓3+9
Comments33

Второй блин: анонс SmartData 2018

Reading time6 min
Views3K


Чем первое проведение конференции отличается от второго? При подготовке первой нет ни возможности «сделать как раньше», ни зрительского фидбэка, и организаторам приходится делать смелые предположения. Это не значит, что получится плохо. Но это значит, что после первого раза непременно появятся новые соображения, которые помогут во второй.

В прошлом году мы впервые провели конференцию SmartData, а теперь пришло время «второго раза»: анонсируем SmartData 2018, которая состоится 15 октября в Санкт-Петербурге.

Чего ждать от конференции? Кому стоит на неё идти? Что изменилось по сравнению с прошлым годом? Рассказываем обо всём под катом.
Читать дальше →
Total votes 28: ↑27 and ↓1+26
Comments2

Личный опыт: Data Engineering на Upwork

Reading time8 min
Views42K
Я много лет работал Data Engineer'ом и Data Scientist'ом, решал сложные бизнес-кейсы, строил большие системы, выводил это все в продакшен. В начале 2017го я бросил пить, курить и работать в офисе и ушел фрилансить, экспериментировать с альтернативными формами занятости. Довольно много времени я провел на Upwork. Судя по многочисленным комментариям, уважаемая аудитория не до конца представляет себе, что это такое. Вещаю.

Upwork это крупнейшая в мире биржа фриланса. Дата сатанисты и дата инженеры мало кому в этом мире нужны (по сравнению с переводчиками, веб-мастерами и переписывателями текстов), так что задач для нас относительно мало, так что они тяготеют к крупнейшей бирже в мире. Других фриланс-бирж с постоянным потоком задач для дата саентистов в мире нет — ни Guru, ни Toptal, ни отечественный fl.ru спросом похвастаться не могут. Что важно — для специалистов более массовых специальностей опыт фриланса может сильно отличаться.
Читать дальше →
Total votes 94: ↑89 and ↓5+84
Comments120

Совершеннолетняя журналистика: от России до Кремля

Reading time5 min
Views9.3K

Анализ публикаций Lenta.ru за 18 лет (с сентября 1999 по декабрь 2017 гг.) средствами python, sklearn, scipy, XGBoost, pymorphy2, nltk, gensim, MongoDB, Keras и TensorFlow.



В исследовании использованы данные из поста «Анализируй это — Lenta.ru» пользователя ildarchegg. Автор любезно предоставил 3 гигабайта статей в удобном формате, и я решил, что это прекрасная возможность протестировать некоторые методы текстовой обработки. Заодно, если повезёт, узнать что-то новое о российской журналистике, обществе и вообще.

Читать дальше →
Total votes 26: ↑25 and ↓1+24
Comments11

GeekUniversity открывает набор на факультет Data Engineering

Reading time2 min
Views1.6K


Онлайн-университет GeekUniversity запускает факультет Data Engineering. За 12 месяцев вы познакомитесь с лучшими практиками и инструментами дата-инжиниринга, научитесь решать реальные бизнес-задачи самостоятельно и в команде. На курсе будет четыре проектные задачи, вы сможете добавить их в портфолио и начать карьеру инженера данных, ETL- или BI-разработчика.
Читать дальше →
Total votes 11: ↑10 and ↓1+9
Comments0

Хакатон для специалистов по DataScience

Reading time1 min
Views2.2K

Московский кредитный банк (МКБ) проводит онлайн хакатон для молодых специалистов по Data Science. Если вы студент последних курсов или начинающий специалист МКБ предлагает проявить свои таланты в области DS и выиграть отличные призы.

Хочу принять участие
Total votes 4: ↑4 and ↓0+4
Comments12

Создаём нейросеть: бесплатный двухнедельный курс Нетологии для Data Science

Reading time1 min
Views5.3K

15 ноября Нетология запускает бесплатный курс «Искусственный интеллект: создайте нейросеть». В рамках курса вы самостоятельно обучите нейросети, которые смогут распознавать собак на фото, классифицировать изображения и определять эмоциональную окраску сообщения.

Читать далее
Total votes 8: ↑6 and ↓2+4
Comments1

Ищем Java-разработчиков и Data-инженеров в команду Сбера

Reading time2 min
Views3K

Получите интересную работу без многоэтапных собеседований и тестовых заданий! 16 июля мы проведём One Day Offer для Java-разработчиков, а 17 июля – для Data-инженеров. Вы познакомитесь с командами, пройдёте техническое интервью, получите обратную связь и оффер при взаимном мэтче в тот же день. И всё это онлайн.

Читать далее
Total votes 20: ↑10 and ↓100
Comments5

МКБ подвел итоги первого хакатона для специалистов по Data Science

Reading time2 min
Views1.2K

Московский кредитный банк (МКБ) подвел итоги первого открытого хакатона для молодых специалистов по Data Science.

Топ-20 участников хакатона, которые предложили самые интересные работы, получили приглашение присоединиться к команде МКБ.

Узнать все результаты
Total votes 5: ↑5 and ↓0+5
Comments0

Вырастили салат в Нидерландах, не выходя из дома: российская команда вице-чемпион международного агротех-турнира

Reading time2 min
Views1K

Российская объединенная команда Россельхозбанка, МФТИ и РГАУ-МСХА заняла второе место в финале международного сельскохозяйственного конкурса Autonomous Greenhouse Challenge, организованного Нидерландским Университетом WUR (Wageningen University & Research), опередив участников из Китая, Южной Кореи и стран Европы.

Читать далее
Total votes 6: ↑6 and ↓0+6
Comments0

16 марта состоится крупнейший в EMEA вебинар от Cloudera

Reading time1 min
Views421


Уже в ближайший вторник, 16 марта, в 15:00 МСК состоится крупнейшее в EMEA онлайн-событие Cloudera Now 21: Data That Moves You… Fast. Secure. Hybrid. Now.

В рамках этого вебинара технические эксперты Клаудеры покажут, как построить современную гибридную платформу больших данных, реализуя потенциал Cloudera Data Platform (CDP).
Читать дальше →
Total votes 4: ↑4 and ↓0+4
Comments0

СИБУР вывел на рынок решения для ИИ и управления данными

Reading time2 min
Views1.1K

Линейка IT-решений СИБУРа, доступных на рынке, расширилась за счёт продуктов «Каталог данных» и «SIBUR ML Framework». То есть, таких решений у нас уже 5!

Помимо упомянутых новинок мы продаём программно-аппаратные комплексы дополненной реальности и промышленного интернета вещей, а ещё систему интеллектуального видеонаблюдения «Чёрный экран». В 2022 году экономический эффект от их внедрения превысил 300 млн рублей.

Но здесь мы расскажем про новинки.

Читать далее
Total votes 2: ↑2 and ↓0+2
Comments0

Решайте интересные задачи и выигрывайте призы на IT’s Tinkoff Solution Cup

Reading time1 min
Views1.8K

Привет! Совсем скоро пройдет соревнование IT’s Tinkoff Solution Cup для опытных разработчиков и аналитиков. Шесть треков, нестандартные задачи и призы — рассказываем, что ждет участников и как подать заявку

Подробнее
Total votes 12: ↑11 and ↓1+10
Comments2

Снижаем убытки и автоматизируем аналитику с лайфхаками DevOps meetup от Evrone

Reading time2 min
Views343

На прошедшем DevOps meetup мы вместе со спикерами из Lenvendo и Учи.ру познавали Zabbix и разбирались, какую практическую пользу может принести DataOps. Даже если вы не были на эфире, узнать много полезного можно с помощью видео докладов.

Читать далее
Total votes 4: ↑4 and ↓0+4
Comments0

MLOps, часть III: критерии выбора инструментов и возможности Open Source

Reading time2 min
Views459

Машинное обучение так или иначе уже применяется в компаниях самых разных масштабов и направлений деятельности. Однако для выстраивания зрелой ML-инфраструктуры и перехода к эффективным MLOps-практикам требуется понимание: с чего начать, на какие платформы обратить внимание, к каким инструментам присмотреться внимательнее, а какие подойдут лишь для разовых экспериментов. 

К инструментам MLOps для больших исследовательских и бизнес-задач предъявляются три базовых требования: интерпретируемость, воспроизводимость, надёжность. Как среди десятков Open-Source-инструментов выбрать правильные, что могут или не могут использовать компании, к которым предъявляются высокие требования стандартизации, на чем должен основываться выбор между облаками и InHouse для ML, — в третьем выпуске серии MLOps подкаста «Деньги любят техно» обсудили Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ.

Полезные материалы к эпизоду:
Rating0
Comments0

Дайджест конференций по проектированию программ и архитектуре на апрель и май 2024

Reading time1 min
Views1.1K

Лондонская международная конференция по разработке программного обеспечения QCon.

Принимайте правильные решения, изучая, как старшие разработчики программного обеспечения в прогрессивных компаниях перенимают новые тенденции.

Дата: 8-10 апреля
Формат: оффлайн и онлайн
Язык: английский

Читать далее
Total votes 1: ↑1 and ↓0+1
Comments0

Профессия Data Engineer и с чем её едят — вебинар 25 июля

Reading time1 min
Views440

Работа с данными — это не только аналитика. В этой сфере есть инженерные роли. Инженеры разрабатывают и эксплуатируют системы, благодаря которым данные доступны, лежат в правильном формате в нужном хранилище, с заданными владельцами и описанной структурой. 

Современный Data Governance — это командная работа. Из каких супергероев она состоит — поговорим на открытом вебинаре 25 июля в 19:00 МСК.

Читать далее
Total votes 12: ↑12 and ↓0+12
Comments0

Мы запустили новый курс — Base Data Engineer

Reading time1 min
Views2.6K

Он подходит для новичков в сфере данных и IT, знакомит с тонкостями управления данными: от подходов к хранению до визуализации. 

• Вы научитесь работать с данными.

• Освоите инструменты для их управления.

• Погрузитесь в мир баз данных и изучите методы очистки данных.

• Разберетесь с вопросами проектирования хранилищ, изучите примеры их построения.

Записаться можно здесь.

Читать далее
Total votes 16: ↑15 and ↓1+14
Comments0

BIG one day offer — Sportmaster Lab в поиске Data Engineer и DWH developer

Reading time1 min
Views1.1K

10 февраля, в субботу, мы проведем онлайн One Day Offer в Sportmaster Lab, в рамках которого будем искать Data Engineer и DWH developer в нашу команду.

Как всё будет проходить

- Сбор заявок до 6 февраля.
- Предварительный этап — с вами свяжется hr для уточнений.
- Подготовка к собеседованию — попробуйте свои силы в тестирование по DE или DWH. Тестирование не является обязательным, но темы, которые вы встретите в процессе прохождения, будут также затронуты на собеседовании.
- Техническое интервью. Заранее назначим время технического интервью и отправим ссылку на комнату MS Teams, в которую подключится интервьюер. Длительность собеседования — полтора часа.
- Оффер. Презентация оффера 10 февраля.

Как принять участие

Просто отправьте заявку. Важно — сделать это надо до 6 февраля.

Читать далее
Total votes 2: ↑2 and ↓0+2
Comments2

Приглашаем на образовательную программу ВТБ и Финтех Хаба Банка России

Reading time1 min
Views1.7K

Хорошие новости для всех, кто интересуется машинным обучением и генеративными нейросетями! Банк ВТБ и Финтех Хаб Банка России объявляют набор на вторую совместную образовательную программу «Машинное обучение PRO: обработка документов и генеративные нейросети».

Программа предназначена для тех, кто уже знаком с основами ML, хочет углубить свои знания и получить практические навыки по обработке естественного языка, деплою, тестированию моделей и созданию ML-сервисов.

Читать далее
Total votes 5: ↑4 and ↓1+3
Comments0
1
23 ...