В этой статье я постараюсь наиболее просто рассказать о парсинге сайтов и его основных нюансах. Моя компания занимается парсингом сайтов уже более трёх лет и ежедневно мы парсим около 300 сайтов. Я обычно открыто пишу об этом в соц.сетях (плюс мы много чего из итогов парсинга крупнейших магазинов России выкладываем бесплатно — публично), что вызывает бурные обсуждения и неодобрение со стороны пользователей. Забавно после прочтения комментариев заглядывать к себе в личку и читать сообщения с предложениями о сотрудничестве от тех же людей, кто только что осуждал нас в комментариях под постом :) Вся статья будет в формате наиболее часто задаваемых вопросов и честных ответов (материал маркетинговый, не технический).
Александр Рябиков @rsashka
Системный архитектор
Руководство по написанию JS скриптов для front-end разработчиков под Drupal 7
5 мин
33KRecovery Mode
Существуют разные способы создания верстки под Drupal. Кто-то верстает уже затемленные страницы, кто-то пытается обойтись стандартными темами, но как правило, сначала верстальщик верстает страницы по дизайну, и на выходе получается набор html файлов — слайсов. Затем девелоперы интегрируют эти файлы по кусочкам при теминге.
Причем в процессе интеграции находятся ошибки, какие-то модификации, поэтому верстка и скрипты к ней относящиеся, должны быть доступными для правок и тестирования.
Именно о последнем способе в основном будет идти речь, я опишу типичные ошибки и бест-практики по их решению при написании JS-скриптов для D7. Думаю это будет интересно как верстальщикам под Drupal, так и разработчикам модулей. В случае верстальщиков основным принципом, которым нужно руководствоваться будет факт, что ваш скрипт будет работать в окружении Drupal, и это накладывает ряд ограничений, в идеале скрипт должен подключаться к Drupal и работать без каких-либо дополнительных модификаций, при этом работать на слайсах вне Drupal.
Причем в процессе интеграции находятся ошибки, какие-то модификации, поэтому верстка и скрипты к ней относящиеся, должны быть доступными для правок и тестирования.
Именно о последнем способе в основном будет идти речь, я опишу типичные ошибки и бест-практики по их решению при написании JS-скриптов для D7. Думаю это будет интересно как верстальщикам под Drupal, так и разработчикам модулей. В случае верстальщиков основным принципом, которым нужно руководствоваться будет факт, что ваш скрипт будет работать в окружении Drupal, и это накладывает ряд ограничений, в идеале скрипт должен подключаться к Drupal и работать без каких-либо дополнительных модификаций, при этом работать на слайсах вне Drupal.
+13
Маркетинг для стартапа: как привлечь тысячи пользователей со всего мира не потратив и $200
5 мин
5.3K+22
Лицензия для вашего open-source проекта
98 мин
191KВ этой статье я хочу немного поговорить об авторском праве и свободных лицензиях на ПО. Текст является результатом самостоятельного выбора лицензий и их применения к своим проектам.
Статья будет полезна тем, кто хочет:
— в общих чертах понять, что такое авторское право (но лучше обратиться к юристу);
— подобрать свободную лицензию для своего проекта;
— разобраться, что нужно писать в шапке файла исходного кода.
Статья будет полезна тем, кто хочет:
— в общих чертах понять, что такое авторское право (но лучше обратиться к юристу);
— подобрать свободную лицензию для своего проекта;
— разобраться, что нужно писать в шапке файла исходного кода.
+128
Импортозамещение на практике. Часть 3. Операционные системы
17 мин
70K
Продолжаем наш цикл статей про импортозамещение. В предыдущих публикациях были рассмотрены варианты замещения развернутых систем на «отечественные», и конкретно гипервизоры «отечественного производства».
Теперь настала очередь поговорить об «отечественных» операционных системах, входящих в реестр Минкомсвязи на настоящий момент.
+35
Бесплатные ссылки, или чем заняться на досуге владельцу сайта
10 мин
5.3KRecovery Mode
Эта статья будет полезна владельцам бизнеса, которые занимаются продвижением своего сайта самостоятельно, но в “пассивном режиме”: в свободное время понемногу изучают вопрос, пытаются вникнуть в разные аспекты, пробуют разные способы и сервисы. Иными словами, не ставят жестких сроков и не проводят по бухгалтерии бюджеты и статьи расходов на SEO.
Если вы маркетолог, и вам, как это часто бывает, поручили заодно продвигать сайт (естественно, своими силами, без бюджета и на добровольных началах), то рекомендую пробежаться по пунктам в этой статье, не исключено, что некоторые из них хоть немного скрасят эту ситуацию.
Я предлагаю список мест, где можно размещать ссылки в свободное от основной работы время. Сразу скажу, что никакого взлета в результатах поиска можно не ждать (хотя, как редкое исключение, и такое тоже случается), речь идет о постепенном развитии и накоплении ссылочной массы с попутным улучшением других факторов и получением живых посещений.
Если вы маркетолог, и вам, как это часто бывает, поручили заодно продвигать сайт (естественно, своими силами, без бюджета и на добровольных началах), то рекомендую пробежаться по пунктам в этой статье, не исключено, что некоторые из них хоть немного скрасят эту ситуацию.
Я предлагаю список мест, где можно размещать ссылки в свободное от основной работы время. Сразу скажу, что никакого взлета в результатах поиска можно не ждать (хотя, как редкое исключение, и такое тоже случается), речь идет о постепенном развитии и накоплении ссылочной массы с попутным улучшением других факторов и получением живых посещений.
+5
Торфон – мобильное приложение для анонимной телефонии
11 мин
40K
Сегодня я хотел бы рассказать о результатах моих семилетних исследований в области передачи голоса через сеть Tor. Общепринятым является мнение, что голосовая связь через Tor почти невозможна:
- существующие транспортные протоколы для телефонии работают поверх UDP, а Tor обеспечивает лишь TCP соединения;
- Tor маршрутизирует пакеты через множество узлов, шифруя данные, что является причиной значительной латентности и делает дуплексную телефонную связь невозможной или крайне некомфортной.
Но так ли это на самом деле?
+88
Фриланс и финансы: 5 способов расчета между заказчиком и фрилансером
7 мин
22K
Оплата. Вопрос взаиморасчетов для фриланса стоит остро, каждая из сторон хочет себя обезопасить, ведь риски велики. Заказчик рискует потерять деньги, фрилансер рискует потерять время на работу и по сути тоже потерять деньги.
Как там вообще в этих ваших фрилансах обстоят дела с оплатой работы, как это работает?
+8
Почему не нужно тратить свое время на создание нишевых тематических сайтов
6 мин
73KRecovery Mode

К настоящему моменту я владею несколькими тематическими порталами, которые успешно загибаются. И в этой статье я расскажу о том, как я их сделал, сколько получил, и почему им приходит конец, и я не могу ничего с этим сделать.
Буду рассказывать на примере сайта по мужской психологии, который я открыл в 2011 году (год очень важен!) Информация о которой я рассказываю уже не особо актуальна, зато поможет вам сэкономить время и отказаться от идеи открыть свой тематический портал.
Итак, 2011 год, я глупый и наивный парнишка, мой первый тематический сайт!
+166
Где и как открыть центр разработки?
5 мин
5.9K
В этой статье я не буду затрагивать вопросы организационно-хозяйственные, такие как сравнение стоимостей аренды и выбор подходящих площадей, их ремонт, покупку мебели и оборудования, потому что на дальней дистанции эти расходы становятся каплей в море выплаченной зарплаты.
Первый вопрос, который стоит решить — это город, в котором имеет смысл открывать центр разработки. Основной «перерабатываемый ресурс» центра — это толковые разработчики и тестировщики, если в городе их мало, смысла открываться нет. Никакими пирогами не заманишь из других городов достаточное количество светлых голов.
+15
Что я понял о построении бизнеса, семь лет проработав в Airbnb
12 мин
18KПеревод

В 2012 году, вскоре после того, как Airbnb купили наш стартап, я услышал, как один из основателей компании (Джо Геббиа) давал указания дизайнеру, которому нужно было изменить оформление главной страницы: «Сделай то, чего в Интернете никогда раньше не было». Хорошо помню, как подумал: «Что это вообще значит? Это такая здесь планка для всего, что делается?» Оглядываясь назад, я могу сказать, что главным двигателем роста в Airbnb было именно такое мышление — в сочетании с шестью другими ключевыми компонентами, о которых я расскажу ниже.
Я пришел в Airbnb в качестве разработчика, а затем подключился к еще формировавшейся команде, отвечавшей за функцию личных сообщений. На тот момент в компании было пару десятков разработчиков, несколько дизайнеров и две очень милые собаки. В течение следующих семи лет компания разрослась до тысяч сотрудников по всему миру, бесчисленного множества милых собачек и стала оцениваться в более чем 30 млрд долларов, а я успел поработать вместе с прекрасными людьми над многими интересными задачами. Покинув компанию несколько недель назад, я записал самые важные извлеченные мной за это время уроки, и только после этого с головой погрузился в собственное начинание. Вскоре я понял, что нужно поделиться этими уроками со всеми, кто пытается начать собственное дело. Не обещаю, что всё это будет применимо к вашей ситуации, но могу утверждать, что описываемое мной лежало в основе успеха Airbnb на протяжении многих лет.
Переведено в Alconost
+21
Не долго музыка играла… или как ОС Эльбрус так и не стала свободной
7 мин
114KНесколько дней назад некоторые СМИ сообщили о возможности свободного скачивания операционной системы Эльбрус. Ссылки на дистрибутив предоставлялся только для x86 архитектур, но даже в таком виде, это могло бы стать очень важной вехой в развитии данной операционной системы.
Один из заголовков СМИ: ОС «Эльбрус» стала свободной. Ссылки на скачивание
Да, это действительно могло бы стать очень важной вехой в развитии ОС Эльбрус. Могло стать, но к сожалению, пока не стало (надеюсь, что ключевым словом будет слово пока)

Один из заголовков СМИ: ОС «Эльбрус» стала свободной. Ссылки на скачивание
Разработчик линейки отечественных процессоров «Эльбрус» обновил на своем сайте раздел, касающийся специализированного ПО. В свободном доступе для скачивания оказалась ОС «Эльбрус» для стандартных процессоров архитектуры x86. В скором времени разработчики планируют открыть ее исходные коды.Другой заголовок этой же новости: Операционную систему «Эльбрус» уже можно скачать!
Да, это действительно могло бы стать очень важной вехой в развитии ОС Эльбрус. Могло стать, но к сожалению, пока не стало (надеюсь, что ключевым словом будет слово пока)

+139
Кодирование речи на 1600 бит/с нейронным вокодером LPCNet
10 мин
23KПеревод

Это продолжение первой статьи о LPCNet. В первом демо мы представили архитектуру, которая сочетает обработку сигналов и глубокое обучение для повышения эффективности нейронного синтеза речи. На этот раз превратим LPCNet в нейронный речевой кодек с очень низким битрейтом (см. научную статью). Его можно использовать на текущем оборудовании и даже на телефонах.
Впервые нейронный вокодер работает в реальном времени на одном процессорном ядре телефона, а не на высокоскоростном GPU. Итоговый битрейт 1600 бит/с примерно в десять раз меньше, чем выдают обычные широкополосные кодеки. Качество намного лучше, чем у существующих вокодеров с очень низким битрейтом и сопоставимо с более традиционными кодеками, использующими более высокий битрейт.
+55
Word2vec в картинках
14 мин
157KПеревод

«Во всякой вещи скрыт узор, который есть часть Вселенной. В нём есть симметрия, элегантность и красота — качества, которые прежде всего схватывает всякий истинный художник, запечатлевающий мир. Этот узор можно уловить в смене сезонов, в том, как струится по склону песок, в перепутанных ветвях креозотового кустарника, в узоре его листа.
Мы пытаемся скопировать этот узор в нашей жизни и нашем обществе и потому любим ритм, песню, танец, различные радующие и утешающие нас формы. Однако можно разглядеть и опасность, таящуюся в поиске абсолютного совершенства, ибо очевидно, что совершенный узор — неизменен. И, приближаясь к совершенству, всё сущее идёт к смерти» — Дюна (1965)
Я считаю, что концепция вложений (embeddings) — одна из самых замечательных идей в машинном обучении. Если вы когда-нибудь использовали Siri, Google Assistant, Alexa, Google Translate или даже клавиатуру смартфона с предсказанием следующего слова, то уже работали с моделью обработки естественного языка на основе вложений. За последние десятилетия произошло значительное развитие этой концепции для нейронных моделей (последние разработки включают контекстуализированные вложения слов в передовых моделях, таких как BERT и GPT2).
+43
Как мы подняли производительность Tensorflow Serving на 70%
11 мин
8.6KТуториал
Перевод
Tensorflow стал стандартной платформой для машинного обучения (ML), популярной как в индустрии, так и в научных исследованиях. Создано множество свободных библиотек, инструментов и фреймворков для обучения и обслуживания моделей ML. Проект Tensorflow Serving помогает обслуживать модели ML в распределённой среде продакшна.
Наш сервис Mux использует Tensorflow Serving в нескольких частях инфраструктуры, мы уже обсуждали использование Tensorflow Serving в кодировании видео по заголовкам. Сегодня сосредоточимся на методах, которые улучшают задержку за счёт оптимизации как на сервере прогнозирования, так и на клиенте. Прогнозы модели обычно являются «онлайновыми» операциями (на критическом пути запроса приложения), поэтому основные цели оптимизации — обрабатывать большие объёмы запросов с максимально низкой задержкой.
Наш сервис Mux использует Tensorflow Serving в нескольких частях инфраструктуры, мы уже обсуждали использование Tensorflow Serving в кодировании видео по заголовкам. Сегодня сосредоточимся на методах, которые улучшают задержку за счёт оптимизации как на сервере прогнозирования, так и на клиенте. Прогнозы модели обычно являются «онлайновыми» операциями (на критическом пути запроса приложения), поэтому основные цели оптимизации — обрабатывать большие объёмы запросов с максимально низкой задержкой.
+6
Универсальный API для получения информации по чекам
9 мин
121KПривет жителям Хабра.
В данной статье хотелось бы рассказать про API для получения чеков, которое нам не предоставилавсеми любимая ФНС.
Когда только появились QR-коды на чеках я подумал «Вау, как круто! Ты сканируешь код и видишь если не всю инфу по чеку, то ссылку на него». И какого же было мое разочарование, когда просканировав такой код я увидел что-то вроде
Но расстраиваться я не стал и подумал, что ФНС позаботилась о нас и предоставила API для получения такой информации. Погуглив некоторое время я понял, что ФНС нам предоставила только мобильное приложение для проверки чека и просмотра той информации, что поступила к ним от магазина.
В данной статье хотелось бы рассказать про API для получения чеков, которое нам не предоставила
Когда только появились QR-коды на чеках я подумал «Вау, как круто! Ты сканируешь код и видишь если не всю инфу по чеку, то ссылку на него». И какого же было мое разочарование, когда просканировав такой код я увидел что-то вроде
t=20180518T220500&s=975.88&fn=8710000101125654&i=99456&fp=1250448795&n=1
Но расстраиваться я не стал и подумал, что ФНС позаботилась о нас и предоставила API для получения такой информации. Погуглив некоторое время я понял, что ФНС нам предоставила только мобильное приложение для проверки чека и просмотра той информации, что поступила к ним от магазина.
+31
Что можешь получить от 54-ФЗ лично ты, username, или DIY-автоматизация учета расходов
5 мин
23KС 1 июля 2017 года на территории Российской Федерации стало обязательным использование контрольно-кассовых машин (ККМ), отправляющих все свои транзакции прямо в Федеральную налоговую службу. Так называемых онлайн-касс. Введение этого новшества уже успели обсудить со всех сторон или по крайней мере со всех серьезных сторон. Могут ли у федерального закона быть не слишком серьезные стороны и какой простор для творчества это нам дает – об этом под катом.


+61
Повышение уровня защиты сети путём использования облачного анализатора
7 мин
3.5K
В представлении неискушённых людей работа администратора безопасности выглядит как захватывающий поединок антихакера со злыми хакерами, которые то и дело вторгаются в корпоративную сеть. А наш герой в режим реального времени ловким и быстрым введением команд отбивает дерзновенные выпады и в итоге выходит блестящим победителем.
Прямо королевский мушкетёр с клавиатурой вместо шпаги и мушкета.
А на деле всё выглядит обыденно, незатейливо, и даже, можно сказать, скучно.
+14
Как это работает: архитектура тайлового бэкенда карт «Спутника»
4 мин
30KМы, команда карт «Спутника», разрабатываем карты на основе данных «OpenStreetMap». В этой заметке мы расскажем об архитектуре нашего решения для рендеринга тайлов.


+43
Работаем с нейросетями: чек-лист для отладки
6 мин
6.6KПеревод

Код программных продуктов для машинного обучения часто бывает сложным и довольно запутанным. Обнаружение и ликвидация багов в нем — ресурсоемкая задача. Даже простейшие нейросети с прямой связью требуют серьезного подхода к сетевой архитектуре, инициализации весов, оптимизации сети. Небольшая ошибка может привести к появлению неприятных проблем.
Эта статья посвящена алгоритму отладки ваших нейронных сетей.
+15
Информация
- В рейтинге
- 1 178-й
- Откуда
- Россия
- Дата рождения
- Зарегистрирован
- Активность
Специализация
Embedded Software Engineer, Software Architect
Lead
C++
OOP
Linux
Programming microcontrollers
Embedded system
C
Qt
Software development