Pull to refresh
6
0
Дмитрий Чекрыгин @dmt_chkg

System analyst

Send message

Рекомендательные системы: идеи, подходы, задачи

Reading time11 min
Views48K


Многие привыкли ставить оценку фильму на КиноПоиске или imdb после просмотра, а разделы «С этим товаром также покупали» и «Популярные товары» есть в любом интернет- магазине. Но существуют и менее привычные виды рекомендаций. В этой статье я расскажу о том, какие задачи решают рекомендательные системы, куда бежать и что гуглить.
Читать дальше →
Total votes 34: ↑33 and ↓1+32
Comments7

Ввоз и монтаж оборудования в дата-центре

Reading time2 min
Views25K
Как мы и обещали, переходим от повествования о строительстве дата-центра к более предметным областям. Сегодня мы расскажем и покажем, как происходит ввоз, регистрация и монтаж клиентского оборудования в дата-центр. В принципе, здесь нет ничего удивительного, или захватывающего, но тем, кто интересуется вопросами типа «как же там все устроено», наверняка будет интересно.

image

Читать дальше →
Total votes 145: ↑132 and ↓13+119
Comments154

Что особенного в Cloudera и как ее готовить

Reading time6 min
Views12K
Рынок распределенных вычислений и больших данных, если верить статистике, растет на 18-19% в год. Значит, вопрос выбора софта для этих целей остается актуальным. В этом посте мы начнем с того, зачем нужны распределенные вычисления, подробней остановимся на выборе ПО, расскажем о применении Hadoop с помощью Cloudera, а напоследок поговорим о выборе железа и о том, как оно разными способами влияет на производительность.

Читать дальше →
Total votes 18: ↑15 and ↓3+12
Comments3

Архитектура, сертифицированная по SQL Server Data Warehouse Fast Track (DWFT): что это значит и как устроено

Reading time10 min
Views4.3K
Крупные производители популярного софта заботятся о своих заказчиках по-разному. Один из способов — создать программу сертификации. Чтобы, когда заказчики в раздумьях блуждают между аппаратными конфигами для конкретного софта, производитель этого софта мог подойти и с уверенностью показать пальцем: «Бери вот это и все будет хорошо».

Такую программу для своего SQL Server разработал Microsoft — SQL Server Fast Track (DWFT). По ней сертифицируются конфигурации хранилищ данных — те, которые соответствуют требованиям рабочей нагрузки и могут быть внедрены с меньшим риском, стоимостью и сложностью. Звучит прекрасно, но интересно все-таки оценить эти критерии на практике. Для этого мы подробно разберем одну из конфигураций, имеющих сертификацию SQL Server Data Warehouse Fast Track.


Читать дальше →
Total votes 10: ↑10 and ↓0+10
Comments0

Тестирование и отладка MapReduce

Reading time5 min
Views6K
В «Ростелекоме» мы используем Hadoop для хранения и обработки данных, загруженных из многочисленных источников с помощью java-приложений. Сейчас мы переехали на новую версию hadoop с Kerberos Authentication. При переезде столкнулись с рядом проблем, в том числе и с использованием YARN API. Работа Hadoop с Kerberos Authentication заслуживает отдельной статьи, а в этой мы поговорим об отладке Hadoop MapReduce.


Читать дальше →
Total votes 25: ↑23 and ↓2+21
Comments6

Как «склеить» Intel-based сервер и преодолеть scale-up потолок в 8 процессоров

Reading time3 min
Views5.4K
Если вы занимаетесь выращиванием больших баз данных и вдруг упираетесь в потолок производительности — пришло время расширяться. Со scale-out расширением понятно: серверы добавляете и горя не знаете. Со scale-up все не так весело. Согласно стандартной glueless-архитектуре, мы берем два процессора, потом добавляем к ним еще два… так доходим до восьми и все. Больше Intel не предусмотрел, копите на новый сервер.



Но есть и альтернатива — glued-архитектура. В ней двухпроцессорные вычислительные блоки соединяются между собой через нод-контроллеры. С их помощью верхний порог на один сервер поднимается до 16 и более процессоров. В этом посте подробней расскажем о glued-архитектуре вообще и о том, как она реализована в наших серверах.
Читать дальше →
Total votes 28: ↑28 and ↓0+28
Comments5

Information

Rating
Does not participate
Location
Воронеж, Воронежская обл., Россия
Date of birth
Registered
Activity