Как стать автором
Поиск
Написать публикацию
Обновить
145
10.4
Александр Рябиков @rsashka

Системный архитектор

Отправить сообщение

Правда про парсинг сайтов, или «все интернет-магазины делают это»

Время на прочтение11 мин
Количество просмотров121K
В этой статье я постараюсь наиболее просто рассказать о парсинге сайтов и его основных нюансах. Моя компания занимается парсингом сайтов уже более трёх лет и ежедневно мы парсим около 300 сайтов. Я обычно открыто пишу об этом в соц.сетях (плюс мы много чего из итогов парсинга крупнейших магазинов России выкладываем бесплатно — публично), что вызывает бурные обсуждения и неодобрение со стороны пользователей. Забавно после прочтения комментариев заглядывать к себе в личку и читать сообщения с предложениями о сотрудничестве от тех же людей, кто только что осуждал нас в комментариях под постом :) Вся статья будет в формате наиболее часто задаваемых вопросов и честных ответов (материал маркетинговый, не технический).
Читать дальше →

Руководство по написанию JS скриптов для front-end разработчиков под Drupal 7

Время на прочтение5 мин
Количество просмотров33K
Существуют разные способы создания верстки под Drupal. Кто-то верстает уже затемленные страницы, кто-то пытается обойтись стандартными темами, но как правило, сначала верстальщик верстает страницы по дизайну, и на выходе получается набор html файлов — слайсов. Затем девелоперы интегрируют эти файлы по кусочкам при теминге.
Причем в процессе интеграции находятся ошибки, какие-то модификации, поэтому верстка и скрипты к ней относящиеся, должны быть доступными для правок и тестирования.
Именно о последнем способе в основном будет идти речь, я опишу типичные ошибки и бест-практики по их решению при написании JS-скриптов для D7. Думаю это будет интересно как верстальщикам под Drupal, так и разработчикам модулей. В случае верстальщиков основным принципом, которым нужно руководствоваться будет факт, что ваш скрипт будет работать в окружении Drupal, и это накладывает ряд ограничений, в идеале скрипт должен подключаться к Drupal и работать без каких-либо дополнительных модификаций, при этом работать на слайсах вне Drupal.
Читать дальше →

Маркетинг для стартапа: как привлечь тысячи пользователей со всего мира не потратив и $200

Время на прочтение5 мин
Количество просмотров5.3K


Сегодня я расскажу, как подготовить стартап к выходу на Product Hunt, какие шаги стоит предпринять до этого, и как подогревать интерес к проекту в день и после публикации.
Читать дальше →

Лицензия для вашего open-source проекта

Время на прочтение98 мин
Количество просмотров191K
В этой статье я хочу немного поговорить об авторском праве и свободных лицензиях на ПО. Текст является результатом самостоятельного выбора лицензий и их применения к своим проектам.

Статья будет полезна тем, кто хочет:

— в общих чертах понять, что такое авторское право (но лучше обратиться к юристу);
— подобрать свободную лицензию для своего проекта;
— разобраться, что нужно писать в шапке файла исходного кода.
Читать дальше →

Импортозамещение на практике. Часть 3. Операционные системы

Время на прочтение17 мин
Количество просмотров70K
image

Продолжаем наш цикл статей про импортозамещение. В предыдущих публикациях были рассмотрены варианты замещения развернутых систем на «отечественные», и конкретно гипервизоры «отечественного производства».

Теперь настала очередь поговорить об «отечественных» операционных системах, входящих в реестр Минкомсвязи на настоящий момент.
Читать дальше →

Бесплатные ссылки, или чем заняться на досуге владельцу сайта

Время на прочтение10 мин
Количество просмотров5.3K
Эта статья будет полезна владельцам бизнеса, которые занимаются продвижением своего сайта самостоятельно, но в “пассивном режиме”: в свободное время понемногу изучают вопрос, пытаются вникнуть в разные аспекты, пробуют разные способы и сервисы. Иными словами, не ставят жестких сроков и не проводят по бухгалтерии бюджеты и статьи расходов на SEO.

Если вы маркетолог, и вам, как это часто бывает, поручили заодно продвигать сайт (естественно, своими силами, без бюджета и на добровольных началах), то рекомендую пробежаться по пунктам в этой статье, не исключено, что некоторые из них хоть немного скрасят эту ситуацию.

Я предлагаю список мест, где можно размещать ссылки в свободное от основной работы время. Сразу скажу, что никакого взлета в результатах поиска можно не ждать (хотя, как редкое исключение, и такое тоже случается), речь идет о постепенном развитии и накоплении ссылочной массы с попутным улучшением других факторов и получением живых посещений.
Читать дальше →

Торфон – мобильное приложение для анонимной телефонии

Время на прочтение11 мин
Количество просмотров40K
image


Сегодня я хотел бы рассказать о результатах моих семилетних исследований в области передачи голоса через сеть Tor. Общепринятым является мнение, что голосовая связь через Tor почти невозможна:

  • существующие транспортные протоколы для телефонии работают поверх UDP, а Tor обеспечивает лишь TCP соединения;
  • Tor маршрутизирует пакеты через множество узлов, шифруя данные, что является причиной значительной латентности и делает дуплексную телефонную связь невозможной или крайне некомфортной.

Но так ли это на самом деле?
Читать дальше →

Фриланс и финансы: 5 способов расчета между заказчиком и фрилансером

Время на прочтение7 мин
Количество просмотров22K


Оплата. Вопрос взаиморасчетов для фриланса стоит остро, каждая из сторон хочет себя обезопасить, ведь риски велики. Заказчик рискует потерять деньги, фрилансер рискует потерять время на работу и по сути тоже потерять деньги.

Как там вообще в этих ваших фрилансах обстоят дела с оплатой работы, как это работает?
Читать дальше →

Почему не нужно тратить свое время на создание нишевых тематических сайтов

Время на прочтение6 мин
Количество просмотров73K


К настоящему моменту я владею несколькими тематическими порталами, которые успешно загибаются. И в этой статье я расскажу о том, как я их сделал, сколько получил, и почему им приходит конец, и я не могу ничего с этим сделать.

Буду рассказывать на примере сайта по мужской психологии, который я открыл в 2011 году (год очень важен!) Информация о которой я рассказываю уже не особо актуальна, зато поможет вам сэкономить время и отказаться от идеи открыть свой тематический портал.

Итак, 2011 год, я глупый и наивный парнишка, мой первый тематический сайт!
Читать дальше →

Где и как открыть центр разработки?

Время на прочтение5 мин
Количество просмотров5.9K


В этой статье я не буду затрагивать вопросы организационно-хозяйственные, такие как сравнение стоимостей аренды и выбор подходящих площадей, их ремонт, покупку мебели и оборудования, потому что на дальней дистанции эти расходы становятся каплей в море выплаченной зарплаты.


Первый вопрос, который стоит решить — это город, в котором имеет смысл открывать центр разработки. Основной «перерабатываемый ресурс» центра — это толковые разработчики и тестировщики, если в городе их мало, смысла открываться нет. Никакими пирогами не заманишь из других городов достаточное количество светлых голов.

Читать дальше →

Что я понял о построении бизнеса, семь лет проработав в Airbnb

Время на прочтение12 мин
Количество просмотров18K


В 2012 году, вскоре после того, как Airbnb купили наш стартап, я услышал, как один из основателей компании (Джо Геббиа) давал указания дизайнеру, которому нужно было изменить оформление главной страницы: «Сделай то, чего в Интернете никогда раньше не было». Хорошо помню, как подумал: «Что это вообще значит? Это такая здесь планка для всего, что делается?» Оглядываясь назад, я могу сказать, что главным двигателем роста в Airbnb было именно такое мышление — в сочетании с шестью другими ключевыми компонентами, о которых я расскажу ниже.

Я пришел в Airbnb в качестве разработчика, а затем подключился к еще формировавшейся команде, отвечавшей за функцию личных сообщений. На тот момент в компании было пару десятков разработчиков, несколько дизайнеров и две очень милые собаки. В течение следующих семи лет компания разрослась до тысяч сотрудников по всему миру, бесчисленного множества милых собачек и стала оцениваться в более чем 30 млрд долларов, а я успел поработать вместе с прекрасными людьми над многими интересными задачами. Покинув компанию несколько недель назад, я записал самые важные извлеченные мной за это время уроки, и только после этого с головой погрузился в собственное начинание. Вскоре я понял, что нужно поделиться этими уроками со всеми, кто пытается начать собственное дело. Не обещаю, что всё это будет применимо к вашей ситуации, но могу утверждать, что описываемое мной лежало в основе успеха Airbnb на протяжении многих лет.

Переведено в Alconost
Читать дальше →

Не долго музыка играла… или как ОС Эльбрус так и не стала свободной

Время на прочтение7 мин
Количество просмотров114K
Несколько дней назад некоторые СМИ сообщили о возможности свободного скачивания операционной системы Эльбрус. Ссылки на дистрибутив предоставлялся только для x86 архитектур, но даже в таком виде, это могло бы стать очень важной вехой в развитии данной операционной системы.

Один из заголовков СМИ: ОС «Эльбрус» стала свободной. Ссылки на скачивание
Разработчик линейки отечественных процессоров «Эльбрус» обновил на своем сайте раздел, касающийся специализированного ПО. В свободном доступе для скачивания оказалась ОС «Эльбрус» для стандартных процессоров архитектуры x86. В скором времени разработчики планируют открыть ее исходные коды.
Другой заголовок этой же новости: Операционную систему «Эльбрус» уже можно скачать!

Да, это действительно могло бы стать очень важной вехой в развитии ОС Эльбрус. Могло стать, но к сожалению, пока не стало (надеюсь, что ключевым словом будет слово пока)

image
Читать дальше →

Кодирование речи на 1600 бит/с нейронным вокодером LPCNet

Время на прочтение10 мин
Количество просмотров23K


Это продолжение первой статьи о LPCNet. В первом демо мы представили архитектуру, которая сочетает обработку сигналов и глубокое обучение для повышения эффективности нейронного синтеза речи. На этот раз превратим LPCNet в нейронный речевой кодек с очень низким битрейтом (см. научную статью). Его можно использовать на текущем оборудовании и даже на телефонах.

Впервые нейронный вокодер работает в реальном времени на одном процессорном ядре телефона, а не на высокоскоростном GPU. Итоговый битрейт 1600 бит/с примерно в десять раз меньше, чем выдают обычные широкополосные кодеки. Качество намного лучше, чем у существующих вокодеров с очень низким битрейтом и сопоставимо с более традиционными кодеками, использующими более высокий битрейт.
Читать дальше →

Word2vec в картинках

Время на прочтение14 мин
Количество просмотров157K


«Во всякой вещи скрыт узор, который есть часть Вселенной. В нём есть симметрия, элегантность и красота — качества, которые прежде всего схватывает всякий истинный художник, запечатлевающий мир. Этот узор можно уловить в смене сезонов, в том, как струится по склону песок, в перепутанных ветвях креозотового кустарника, в узоре его листа.

Мы пытаемся скопировать этот узор в нашей жизни и нашем обществе и потому любим ритм, песню, танец, различные радующие и утешающие нас формы. Однако можно разглядеть и опасность, таящуюся в поиске абсолютного совершенства, ибо очевидно, что совершенный узор — неизменен. И, приближаясь к совершенству, всё сущее идёт к смерти» — Дюна (1965)

Я считаю, что концепция вложений (embeddings) — одна из самых замечательных идей в машинном обучении. Если вы когда-нибудь использовали Siri, Google Assistant, Alexa, Google Translate или даже клавиатуру смартфона с предсказанием следующего слова, то уже работали с моделью обработки естественного языка на основе вложений. За последние десятилетия произошло значительное развитие этой концепции для нейронных моделей (последние разработки включают контекстуализированные вложения слов в передовых моделях, таких как BERT и GPT2).
Читать дальше →

Как мы подняли производительность Tensorflow Serving на 70%

Время на прочтение11 мин
Количество просмотров8.6K
Tensorflow стал стандартной платформой для машинного обучения (ML), популярной как в индустрии, так и в научных исследованиях. Создано множество свободных библиотек, инструментов и фреймворков для обучения и обслуживания моделей ML. Проект Tensorflow Serving помогает обслуживать модели ML в распределённой среде продакшна.

Наш сервис Mux использует Tensorflow Serving в нескольких частях инфраструктуры, мы уже обсуждали использование Tensorflow Serving в кодировании видео по заголовкам. Сегодня сосредоточимся на методах, которые улучшают задержку за счёт оптимизации как на сервере прогнозирования, так и на клиенте. Прогнозы модели обычно являются «онлайновыми» операциями (на критическом пути запроса приложения), поэтому основные цели оптимизации — обрабатывать большие объёмы запросов с максимально низкой задержкой.
Читать дальше →

Универсальный API для получения информации по чекам

Время на прочтение9 мин
Количество просмотров121K
Привет жителям Хабра.

В данной статье хотелось бы рассказать про API для получения чеков, которое нам не предоставила всеми любимая ФНС.

Когда только появились QR-коды на чеках я подумал «Вау, как круто! Ты сканируешь код и видишь если не всю инфу по чеку, то ссылку на него». И какого же было мое разочарование, когда просканировав такой код я увидел что-то вроде

t=20180518T220500&s=975.88&fn=8710000101125654&i=99456&fp=1250448795&n=1

Но расстраиваться я не стал и подумал, что ФНС позаботилась о нас и предоставила API для получения такой информации. Погуглив некоторое время я понял, что ФНС нам предоставила только мобильное приложение для проверки чека и просмотра той информации, что поступила к ним от магазина.
Читать дальше →

Что можешь получить от 54-ФЗ лично ты, username, или DIY-автоматизация учета расходов

Время на прочтение5 мин
Количество просмотров23K
С 1 июля 2017 года на территории Российской Федерации стало обязательным использование контрольно-кассовых машин (ККМ), отправляющих все свои транзакции прямо в Федеральную налоговую службу. Так называемых онлайн-касс. Введение этого новшества уже успели обсудить со всех сторон или по крайней мере со всех серьезных сторон. Могут ли у федерального закона быть не слишком серьезные стороны и какой простор для творчества это нам дает – об этом под катом.

Читать дальше →

Повышение уровня защиты сети путём использования облачного анализатора

Время на прочтение7 мин
Количество просмотров3.5K

В представлении неискушённых людей работа администратора безопасности выглядит как захватывающий поединок антихакера со злыми хакерами, которые то и дело вторгаются в корпоративную сеть. А наш герой в режим реального времени ловким и быстрым введением команд отбивает дерзновенные выпады и в итоге выходит блестящим победителем.
Прямо королевский мушкетёр с клавиатурой вместо шпаги и мушкета.

А на деле всё выглядит обыденно, незатейливо, и даже, можно сказать, скучно.
Читать дальше →

Как это работает: архитектура тайлового бэкенда карт «Спутника»

Время на прочтение4 мин
Количество просмотров30K
Мы, команда карт «Спутника», разрабатываем карты на основе данных «OpenStreetMap». В этой заметке мы расскажем об архитектуре нашего решения для рендеринга тайлов.


Читать дальше →

Работаем с нейросетями: чек-лист для отладки

Время на прочтение6 мин
Количество просмотров6.6K
image

Код программных продуктов для машинного обучения часто бывает сложным и довольно запутанным. Обнаружение и ликвидация багов в нем — ресурсоемкая задача. Даже простейшие нейросети с прямой связью требуют серьезного подхода к сетевой архитектуре, инициализации весов, оптимизации сети. Небольшая ошибка может привести к появлению неприятных проблем.

Эта статья посвящена алгоритму отладки ваших нейронных сетей.
Читать дальше →

Информация

В рейтинге
1 178-й
Откуда
Россия
Дата рождения
Зарегистрирован
Активность

Специализация

Embedded Software Engineer, Software Architect
Lead
C++
OOP
Linux
Programming microcontrollers
Embedded system
C
Qt
Software development