Все потоки

Big Data *

Большие данные и всё о них

СтатьиПостыНовостиАвторыКомпании

Alisteir 13 ноя 2014 в 07:53

Современное состояние М2М (machine-to-machine) систем

3 мин

9.1K

Из песочницы

В настоящее время имеют широкое распространение беспроводные технологии, с помощью которых работают уже большинство устройств. Новые системы разрабатываются таким образом, чтобы как можно меньше зависеть от действий человека.

В данном обзоре дано общее понятие М2М системы, из чего состоит и где применяется эта система, обозначить преимущества и недостатки данной системы, а так же выявить ее дальнейшее развитие.

М2М — расшифровывается как machine-to-machine — дословно означает «от машины к машине», т.е. передача данных осуществляется непосредственно между устройствами. К примеру, передача данных с датчиков на сервер обработки.

Читать дальше →

+1

moat 9 ноя 2014 в 15:29

Обзор наиболее интересных материалов по анализу данных и машинному обучению №21 (3 — 9 ноября 2014)

5 мин

12K

Big Data * Data Mining * Высоконагруженные системы *

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Читать дальше →

+20

uaoleg 7 ноя 2014 в 15:02

Проектирование новостной ленты в социальных сетях

9 мин

40K

Блог компании DataArtNoSQL * MongoDB * Big Data *

Так сложилось, что за последние пару лет я успел поучаствовать в разработке нескольких социальных сетей. Главная задача, которую приходилось решать в каждом из этих проектов, заключалась в формировании новостной ленты пользователя. При чём важным условием была возможность масштабирования этой ленты в условиях роста числа пользователей (точнее, числа связей между ними) и, как следствие, — количества контента, который они деливерят друг другу.

Мой рассказ будет о том, как я, превозмогая трудности, решал задачу формирования новостной ленты. А также я расскажу о подходах, которые наработали ребята из проекта Socialite, и которыми они поделились на MongoDB World.

Читать дальше →

+29

codezombie 5 ноя 2014 в 23:02

Microsoft Azure ❤ Big Data

6 мин

11K

Big Data * Microsoft Azure *

Около полугода назад я публиковал ретроспективу того, что интересного для исследователей происходит в облаке Microsoft Azure.

Продолжу эту тему, немного сместив акцент в области, которые для меня последние пару лет неизменно остаются наиболее интересными в ИТ: Big Data, машинное обучение и их симбиозом с облачными технологиями.

Ниже обсудим преимущественно октябрьские анонсы сервисов Microsoft Azure, предоставляющих возможность пакетной и real-time обработки больших массивов данных, высокопроизводительный кластер по требованию, широкую поддержку алгоритмов машинного обучения.

Читать дальше →

+5

moat 3 ноя 2014 в 13:31

Обзор наиболее интересных материалов по анализу данных и машинному обучению №20 (27 октября — 2 ноября 2014)

4 мин

13K

Высоконагруженные системы * Data Mining * Big Data *

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Читать дальше →

+22

jinxu 28 окт 2014 в 11:15

Парные товары. Размещения товаров в торговом зале

2 мин

24K

Блог компании datawiz.ioМатематика * Big Data * Алгоритмы *

В этом небольшом и простом кейсе мы расскажем, что такое парные товары, и как с помощью ассоциативных взаимосвязей увеличить доходность бизнеса.

Итак, Пары — это товары, часто покупаемые вместе. В паре один товар является ключевым (якорным), а второй — сопутствующим. On-line сервис Datawiz.io выявляет парные взаимосвязи товаров при помощи алгоритма APRIORI.

Читать дальше →

+11

ahriman 28 окт 2014 в 08:57

Московский Big Data-хакатон 15-16 ноября

1 мин

6.6K

Блог компании MicrosoftMicrosoft Azure * Hadoop * Big Data *

Big Data продвигается как тренд нового века. Были СУБД для хранения данных, инструменты обработки; со временем же стало понятно, что «не справляемся», и сейчас мы имеем в руках целый веер средств для обработки и анализа данных. И мы решили сделать хакатон. Hadoop? Мы вам рады. Другое? Не проблема. Хотите узнать, что у нас есть интересного? Регистрируйтесь и приходите 15-16 ноября в Коворкинг 2.0 «Свободное плавание» (Москва), только не забудьте принести нужное.

Мы же позвали знатных докладчиков рассказать про:

* Azure/Server HDInsight. Совместимо с Hadoop.
* PowerBI (Excel)
* SQL Server и др.

Так что, пока будет пилиться код (в т.ч. по спецноминации от партнеров), можно послушать доклады и пообщаться со специалистами. Приходите — будет хорошо.

+15

moat 26 окт 2014 в 15:43

Обзор наиболее интересных материалов по анализу данных и машинному обучению №19 (20 — 26 октября 2014)

5 мин

14K

Высоконагруженные системы * Data Mining * Big Data *

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Читать дальше →

+18

jinxu 24 окт 2014 в 09:03

Как колебания в продажах влияют на оборот?

3 мин

14K

Блог компании datawiz.ioАлгоритмы * Big Data * Математика *

Данная публикация — это реальный кейс от Datawiz.io, в котором мы расскажем, как найти товары и категории с большими колебаниями продаж, и как колебания продаж влияют на поведение клиентов.

Производя анализ данных для торговой сети, мы столкнулись с проблемой: при почти равных количествах продаж в день в двух магазинах сети, оборот в одном магазине «Shop1» увеличивался, а в магазине «Shop2» — снижался.

Читать дальше →

+12

marks 23 окт 2014 в 13:25

IBM анонсирует новые проекты внедрения технологий Watson и открытие штаб-квартиры Watson Group в Нью-Йорке

8 мин

9.2K

Блог компании IBMBig Data *

Компания IBM анонсировала новые проекты по использованию возможностей IBM Watson и когнитивных вычислительных технологий. IBM Watson – инновационная платформа, которая лежит в основе новой эры вычислений благодаря способности понимать естественные языки, а также обрабатывать огромные массивы больших данных с целью извлечения ценной информации и дальнейшего самообучения.

Читать дальше →

+11

yanagurskaya3 23 окт 2014 в 11:37

Конференция HDConf: фото-видео-слайд отчет

2 мин

3.7K

.NET * Big Data * Java *

Из песочницы

4 октября в Минске прошла конференция Highload Dev Conf. На HDConf собралось около 380 разработчиков, а рассказать как справляются с нагрузками приехали докладчики из компаний Одноклассники, Amazon, Altoros, Wargaming, Coub, Aviasales, Badoo и др.

Чтобы не грузить деталями, выкладываем сразу несколько фотографий с конференции и афтепати, видео одного из лучших докладов и слайды презентаций, которые участники конференции выделили как наиболее интересные.

Читать дальше →

+3

DellTechTeam 20 окт 2014 в 12:43

Dell Solutions Forum 2014: регистрация открыта

2 мин

2.7K

Блог компании Dell TechnologiesBig Data *

Уважаемые коллеги!
Мы рады сообщить вам, что уже совсем скоро состоится наш Форум решений Dell 2014! Это мероприятие пройдет в Москве уже в третий раз и мы можем, пусть пока и осторожно, назвать его традиционным. Как и в прошлом году, местом нашей встречи выбрана гостиница «Рэдиссон САС Славянская», датой — 14 ноября (это пятница), и мы приглашаем всех желающих принять в нем участие.

Что ждет участников Форума в этом году и как на него попасть

+6

shapa 19 окт 2014 в 21:45

О Nutanix, Web-Scale, конвергентных платформах и смене парадигм построения IT инфраструктур

7 мин

21K

Блог компании NutanixBig Data *

Возможно, вы уже слышали достаточно новый для рынка не_онлайн проектов термин — Web-Scale IT, который по мнению Gartner в 2017 году займет не менее 50% рынка корпоративного IT.

В этом году — это один из основных модных терминов.

Ситуация на корпоративных рынках сейчас активно напоминает фразу про подростковый секс — все говорят что имели (= умеют), но реально — дела обстоят невесело.

Буквально каждый вендор рассказывает про BigData, конвергентные решения, перспективы и прочее.

Мы в свою очередь смеем надеяться, что у нас с этим реально все весьма неплохо, но тут всегда виднее со стороны и ваше мнение может не совпадать с нашим.

Все же попробуем рассказать о том, как мы пытаемся изменить рынок, который в ближайшее время будет составлять десятки миллиардов долларов ежегодно и почему мы считаем что время традиционных решений для хранения и обработки данных подходит к своему закату.

Читать дальше →

+10

paunch 19 окт 2014 в 15:06

Закон Бенфорда и распределения под него попадающие

6 мин

54K

Big Data * Математика *

В теории вероятностей и статистике правило первой цифры, или закон Бенфорда, показывает любопытное проявления частот первой цифры данных из реальной жизни. Для школьников и домохозяек этот закон можно вольно сформулировать так: есть наборы данных, у которых первая цифра будет единицей примерно в 6 раз чаще, чем девятка и это соотношение не изменится при масштабировании исходного набора. Более строго можно сформулировать так: набор чисел удовлетворяет закону Бенфорда, если первая цифра d появляется с вероятностью

Здесь N – основание системы счисления, должно быть больше 2, далее будем рассматривать 10.
Для строгих математиков это правило формулируется так: существуют такие случайные величины, для которых распределение вероятностей дробной части логарифма по любому основанию большему 1 сходится к равномерному на отрезке [0; 1] распределению. Далее я постараюсь писать как можно популярнее и подробнее, укажу примеры, ограничения, применение и случайные величины, для которых закон применим.

Подробности

+52

moat 19 окт 2014 в 13:01

Обзор наиболее интересных материалов по анализу данных и машинному обучению №18 (13 — 19 октября 2014)

5 мин

16K

Высоконагруженные системы * Data Mining * Big Data *

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Читать дальше →

+26

ffriend 16 окт 2014 в 10:15

Hadoop: что, где и зачем

14 мин

503K

Big Data * Hadoop *

Развеиваем страхи, ликвидируем безграмотность и уничтожаем мифы про железнорождённого слона. Под катом обзор экосистемы Hadoop-а, тенденции развития и немного личного мнения.

Читать дальше →

+54

int19h 16 окт 2014 в 07:02

Вышел Python Tools 2.1 для Visual Studio

3 мин

31K

Python * Visual Studio * Big Data *

Перевод

Окончательная версия Python Tools 2.1 для Visual Studio (PTVS) доступна для загрузки! PTVS работает с Visual Studio 2010, 2012 и 2013. Помимо перечисленных ниже новых возможностей, в PTVS 2.1 также добавлена поддержка бесплатных версий Visual Studio Express for Web и Express for Windows Desktop. Разумеется, по-прежнему поддерживаются все полные версии Visual Studio, от Professional и выше.

Веб-разработка на Python в Visual Studio

Веб-разработка является основной темой данного релиза. Теперь в PTVS можно удобно создавать сайты на Django, Bottle и Flask, как с нуля, так и с использованием стартовых шаблонов проектов. Все созданные таким образом сайты можно в один клик опубликовать на веб-сайт Azure.

Читать дальше →

+32

jinxu 15 окт 2014 в 14:35

Как выявить потери в продажах

3 мин

16K

Блог компании datawiz.ioАлгоритмы * Big Data * Математика *

Пример анализа данных на основе продуктового магазина от Datawiz.io.

Эта статья о том, как выявить потери в продажах. Потери в продажах — это дни, когда товар не продавался, или было продано аномально низкое количество единиц товара.

Зачастую потери в продажах случаются из-за недостаточного количества заказанного товара. Также часто товар, имеющийся на складе, не выставляется на полки. Ежедневный анализ данных помогает своевременно обнаружить такой «провал» в продажах. Далее, устраняем проблему — контролируем работу отдела закупок, оптимизируем поставки, контролируем работу торгового персонала.

Читать дальше →

+2

moat 13 окт 2014 в 10:00

Обзор наиболее интересных материалов по анализу данных и машинному обучению №17 (6 — 12 октября 2014)

5 мин

12K

Высоконагруженные системы * Data Mining * Big Data *

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Читать дальше →

+18

Wargaming 8 окт 2014 в 09:24

DataTalks: Анализ данных для решения бизнес-задач

2 мин

9.5K

Блог компании ex-WargamingData Mining * Big Data *

25 октября в Минске пройдет первая встреча DataTalks.

DataTalks – это:
• Неформальные встречи бизнес-аналитиков и специалистов в области анализа данных
• Профессиональное общение и нетворкинг с экспертами Беларуси и СНГ
• Возможность узнать о новейшем опыте применения аналитики данных для решения бизнес-задач в компаниях, работающих на мировом и местном рынках
• Хороший повод задать вопросы экспертам и поделиться собственным опытом.

Для кого? Бизнес-аналитиков, исследователей, менеджеров проектов, информационных архитекторов и системных аналитиков. DataTalks – для всех, кто использует или собирается использовать в своей работе анализ данных или сложные математические алгоритмы, как для отчетности и принятия решений, так и для создания информационных систем.

Первая встреча, по сути, знакомство, будет посвящена выявлению интересных тем в области практического применения анализа данных. Они лягут в основу последующих встреч сообщества аналитиков

Читать дальше →

+19

1 2 ...

195

196 197 ...