Обновить
22.05

Разработка под e-commerce *

Разработка систем электронной коммерции

Сначала показывать
Порог рейтинга
Уровень сложности

Каким стартапам нужен IaaS: Сервисы распознавания речи

Время на прочтение2 мин
Количество просмотров6.5K
Это одна из наших практических рубрик, в рамках которой мы делимся примерами многолетнего сотрудничества с российскими и зарубежными компаниями. Например, ранее мы рассказывали о кейсах Hotels.ru и PickPoint.

Сегодня мы хотели бы познакомить вас с Центром речевых технологий (ЦРТ), который вы уже должны были встречать на Хабре — они ведут отличный блог.

Читать дальше →

Пример модуля для Magento 2

Время на прочтение6 мин
Количество просмотров22K


Данная статья устарела. Вот новая.



На неделе пощупал пример создания модуля для Magento 2. В ходе прощупывания пытался сформировать рабочее окружение по аналогии с выработавшимся у нас на данный момент окружением для разработки модулей под Magento 1.

  • размещение кода модуля в репозитории Github'а;
  • подключение модуля к Magento-приложению при помощи Composer'а;
  • автоматизация процесса развертывания девелоперской/тестовой версии Magento;

Под катом ссылка на github-проект с примером модуля под Magento 2 с (полу)автоматическим развертыванием среды для его разработки.
Читать дальше →

Как писать высокодоступный код

Время на прочтение3 мин
Количество просмотров29K
Инженер фотосервиса Imgur Джейкоб Гринлиф (Jacob Greenleaf) опубликовал в блоге на Medium материал, в котором изложил несколько советов по созданию высокодоступного кода для отказоустойчивых систем. Мы решили взглянуть на экспертное мнение.

Читать дальше →

Файловая система и Hadoop: Опыт Twitter (Часть 2)

Время на прочтение2 мин
Количество просмотров9.7K
Наш основной принцип работы заключается в том, что IaaS должен быть простым и понятным даже для тех, кто не сталкивался с ИТ-сферой. Поэтому мы проводим постоянную оптимизацию всех систем и рассказываем о том, что нам удалось сделать, в нашем блоге на Хабре.

Пара примеров:


Сегодня мы решили продолжить краткий разбор заметки команды инженеров Twitter о создании файловой системы для работы с кластерами Hadoop.

Читать дальше →

Файловая система и Hadoop: Опыт Twitter (Часть 1)

Время на прочтение2 мин
Количество просмотров12K
Наш основной принцип работы заключается в том, что IaaS должен быть простым и понятным даже для тех, кто не сталкивался с ИТ-сферой. Поэтому мы проводим постоянную оптимизацию всех систем и рассказываем о том, что нам удалось сделать, в нашем блоге на Хабре.

Пара примеров:


Сегодня мы решили взглянуть на западный опыт и кратко проанализировать заметку команды инженеров Twitter, в которой они рассказали о своем подходе к работе с файловой системой для кластеров Hadoop.

Читать дальше →

DaData.ru превращает гуиды в адреса и знает всех пацанов на раёне

Время на прочтение2 мин
Количество просмотров56K


DaData.ru — сервис автоматической проверки и исправления контактных данных (ФИО, адресов, телефонов, email, паспортов). Плюс javascript-виджет и API подсказок при вводе адреса, ФИО, организации и банковских реквизитов.

В предыдущем выпуске Дадата прошлась по паспортам и банкам, а за лето взялась помочь интернет-магазинам с доставкой:
  • определять район города;
  • писать районы и города по правилам Почты России;
  • откладывать в сторонку абонентские ящики и адреса «до востребования»;
  • находить адрес до улицы по коду ФИАС.

Читать дальше →

Алгоритмы в реальном мире

Время на прочтение2 мин
Количество просмотров8.7K
В нашем блоге мы уделяем внимание теме алгоритмов и ранее публиковали материал о возможности алгоритмизации интеллекта. Есть и более приземленные применения алгоритмов — сегодня мы решили поговорить именно об этом.

Читать дальше →

Как Netflix находит неисправные серверы

Время на прочтение3 мин
Количество просмотров10K
Посмотрим, как инженеры сервиса Netflix занимаются выявлением неисправных серверов.

Netflix – американская компания, поставщик фильмов и сериалов на основе потокового мультимедиа. Основана в 1997 году и на январь 2016 года у компании свыше 69 миллионов клиентов по всему миру. Только в Северной Америке а долю этого сервиса приходится 34% пикового трафика, направляемого конечным пользователям.

Читать дальше →

Чему можно поучиться у WhatsApp

Время на прочтение2 мин
Количество просмотров14K
Мы делимся не только собственным опытом автоматизации различных служб нашего провайдера виртуальной инфраструктуры, но и анализируем западный опыт.

Сегодня мы кратко рассмотрим кейс WhatsApp, который обслуживает аудиторию практически в миллиард пользователей силами 50 инженеров.

Читать дальше →

Говорит Gartner: «Перегретые» IoT и практичные облака

Время на прочтение2 мин
Количество просмотров8.2K
Пара слов о том, что мы публиковали совсем недавно:


Сегодня мы решили порассуждать на общие темы и затронуть область IoT.

Читать дальше →

Чем хороши новые процессоры Intel Skylake

Время на прочтение1 мин
Количество просмотров39K
Что сама компания рассказывает о своих чипах, какие сравнения здесь корректны, а какие не совсем — попробуем кратко проанализировать ситуацию.

Читать дальше →

Лемматизация в Excel, или «Робот-распознаватель 3.0»

Время на прочтение10 мин
Количество просмотров21K
Кто работал с онлайн-рекламой, тот в цирке не смеётся знает, что поисковики порой выдают неожиданные ответы на запросы или подкидывают совершенно не те объявления, которые могут быть интересны. В последнем случае корень проблемы зачастую кроется в наборе ключевых слов, которые использует рекламодатель в своих кампаниях. Бездумная автоматизация подбора ключевиков приводит к печальным последствиям, среди которых самое удручающее — пустые показы и клики. Excel-изобретатель и рационализатор Realweb Дмитрий Тумайкин озадачился этой проблемой и создал очередной файл-робот, который рад раздать миру и Хабру. Вновь передаём слово автору.


Читать дальше →

Анализ больших семантических ядер, или «Робот-распознаватель»

Время на прочтение6 мин
Количество просмотров24K
Говорят, метатеги для целей SEO мертвы и больше нет смысла прописывать заветную строку meta keywords. Действительно, в современных многофакторных алгоритмах этот тег потерял свой вес. Но это вовсе не значит, что нужно отказываться от работы с семантическим ядром сайта — оно по-прежнему бесценно для структурирования сайта, формирования тематики (которой и интересуются поисковики) и даже для контекстной рекламы. Собрать ядро — задача не из лёгких, собрать его с умом и не превратить в «накидайте мне синонимов» — ещё сложнее. Так вот, в статье пойдет речь о макросах и формулах MS Excel, которые упростят обработку больших семантических ядер. Представляем вам небольшого Excel-робота от нашего изобретательного и не жадного специалиста отдела контекстной рекламы RealWeb Дмитрия Тумайкина. Ему и слово.
image
Читать дальше →

Ближайшие события

Как Spotify масштабирует Apache Storm

Время на прочтение4 мин
Количество просмотров11K
Spotify — шведский сервис потокового воспроизведения музыки с которым сотрудничают такие компании как Sony, EMI, Warner, и Universal. Сервис Spotify был запущен в октябре 2008 года, сейчас он предоставляет более 30 млн композиций. Многие считают его попыткой повторить успех Napster и легализовать его модель. Шведам все это удалось едва ли не лучше всех в мире.

Сам сервис работает следующим образом (общее описание): алгоритм анализирует плейлисты пользователей с учетом точечной классификации по жанрам и сравнивает полученные «профили предпочтений» с миллионами других плейлистов. В результате — вы получаете песни, которые подходят вашим вкусам и не воспроизводились ранее.


/ фото Sunil Soundarapandian CC
Читать дальше →

Как разработчики сайтов создают будущее ТВ

Время на прочтение3 мин
Количество просмотров9.3K
Мы постоянно рассказываем о самых различных новшествах в сфере виртуальной инфраструктуры и реальных кейсах применения IaaS-технологий российским бизнесом. Для этого мы организовали специальный блог о корпоративном IaaS.

Сегодня мы решили посмотреть на опыт западных коллег на примере истории компании BAM, которая проделала путь от ИТ-отдела до крупнейшего разработчика технологий в области интернет-трансляций.


Читать дальше →

Text Analytics as Commodity: обзор приложений текстовой аналитики

Время на прочтение11 мин
Количество просмотров18K
text analytics landscapeЕсли бы мне дали миллиард долларов на научные исследования, я бы создал большую программу в масштабе NASA по обработке естественного языка (NLP).[из Reddit AMA Майкла Джордана, 2015]. Из данной публикации вы узнаете, есть ли рынок для приложений текстовой аналитики. И не слишком ли оптимистичен заслуженный профессор М. Джордан по поводу потенциала NLP, а лучше потратить миллиард долларов на что-то другое.

Введение


Вначале определимся с терминами. Интеллектуальный анализ текста (англ., text mining) — это технологии получения структурированной информации из коллекций текстовых документов. Обычно в это понятие включают такие крупные задачи, как
  • категоризация текста
  • извлечение информации
  • информационный поиск.

Часто, когда говорят о применении интеллектуального анализа текста в бизнесе — текстовой аналитики (англ., text analytics) — имеют в виду не просто структурированную информацию, а т.н. углубленное понимание предмета анализа (insights), которое помогает в принятии бизнес-решений. Известный эксперт Сэт Граймс определяет текстовую аналитику как технологические и бизнес процессы применения алгоритмических подходов к обработке и извлечению информации из текста и получению глубокого понимания.

Принято считать, что формируется новый рынок когнитивно-вычислительных (cognitive computing) продуктов. По оценкам MarketsandMarkets глобальный рынок продуктов на основе обработки естественного языка должен составить $13.4 млрд. к 2020 году при росте в 18.4% по CAGR. Таким образом, сейчас этот рынок оценивается примерно в $5.8 млрд. В последние годы этот растущий рынок ознаменовался целым рядом громких сделок, вроде покупки Alchemy API компанией IBM. По другим оценкам, аналогичный рынок в Европе уже сейчас превосходит пол-миллиарда долларов и удвоится к 2019 году. Рынок Северной Америки составляет почти 40% глобального рынка текстовой аналитики и имеет оптимистичные оценки роста.
Читать дальше →

7 простых советов по оптимизации писем под мобильные устройства

Время на прочтение3 мин
Количество просмотров7.4K
Более половины всех почтовых рассылок подписчики просматривают на мобильных устройствах. Поэтому верстать эти сообщения так, чтобы их было удобно читать на маленьком экране, просто необходимо. Сегодня мы рассмотрим несколько простых советов создания mobile-friendly почтовых писем.

Почему это вообще важно?


В период с 2010 по 2015 год число email-писем, открываемых на мобильных устройствах, выросло на 30%:



Если письма, которые компании отправляют подписчикам, не оптимизированы для просмотра на маленьких экранах, то значительная часть аудитории просто не станет их читать и будет потеряна. И вот как можно этого избежать.
Читать дальше →

Система сбора отзывов Cackle Reviews с полнотекстовым поиском

Время на прочтение5 мин
Количество просмотров12K
Всем привет! Не так давно мы реализовали полнотекстовый поиск для системы сбора отзывов Cackle Reviews. Получилось здорово, теперь любой модератор за несколько миллисекунд может найти интересующие его отзывы по слову или предложению с поддержкой стемминга (нечёткого поиска по части слова или его словоформам). Всё это работает на Sphinx — системе полнотекстового поиска.

В интернете есть много статей о Sphinx, но, к сожалению, часть из них устарела, некоторые другие не претендуют на полный и точный how to. Так что в данном посте мы постарались изложить все шаги — установки, настройки, индексации и поддержке дельта индекса.

система отзывов Cackle Reviews с полнотекстовым поиском

Читать дальше →

Оптимизация производительности MySQL

Время на прочтение2 мин
Количество просмотров19K
В нашем блоге мы много пишем о построении облачного сервиса 1cloud, но немало интересного можно почерпнуть и из опыта по работе с инфраструктурой других компаний.

Мы уже рассказывали о дата-центре фотосервиса imgix, а сегодня затронем тему повышения производительности MySQL и взглянем на советы инженеров соцсети Pinterest.

Читать дальше →

Большие данные и большие вопросы

Время на прочтение3 мин
Количество просмотров11K
С каждым годом популярность Big Data продолжает увеличиваться. Аналитические отчеты показывают рост процентного соотношения компаний, которые активно применяют «большие данные» в тех или иных бизнес-процессах.

Сегодня мы поговорим о том, как этот новомодный термин зачастую вводит в заблуждение и не позволяет в полной мере оценить положительные стороны того, что под ним подразумевается в действительности.

Читать дальше →

Вклад авторов