Статьи / Закладки / Профиль kemsky / Хабр

Как стать автором

Пользователь

Профиль Публикации 4Комментарии 647Закладки 463

dmitrybugaychenko 6 мар 2019 в 16:03

Анализ данных на Scala — суровая необходимость или приятная возможность?

18 мин

14K

Блог компании ОКБлог компании VKМашинное обучение*Data Mining*Big Data*

Туториал

Традиционными инструментами в сфере Data Science являются такие языки, как R и Python — расслабленный синтаксис и большое количество библиотек для машинного обучения и обработки данных позволяет достаточно быстро получить некоторые работающие решения. Однако бывают ситуации, когда ограничения этих инструментов становятся существенной помехой — в первую очередь, если необходимо добиться высоких показателей по скорости обработки и/или работать с действительно крупными массивами данных. В этом случае специалисту приходится, скрепя сердце, обращаться к помощи "темной стороны" и подключать инструменты на "промышленных" языках программирования: Scala, Java и C++.

Но так ли уж темна эта сторона? За годы развития инструменты "промышленного" Data Science прошли большой путь и сегодня достаточно сильно отличаются от своих же версий 2-3 летней давности. Давайте попробуем на примере задачи SNA Hackathon 2019 разобраться, насколько экосистема Scala+Spark может соответствовать Python Data Science.

Читать дальше →

+34

dchabanenko 20 фев 2019 в 23:02

Как я пытался починить поиск по картам для водителей. Часть 2

12 мин

3.8K

Разработка мобильных приложений*Проектирование и рефакторинг*Дизайн мобильных приложений*Автомобильные гаджетыFlutter*

Первое, что хочется сказать — это было сложно. Гораздо сложнее, чем я думал. Я имел до этого весьма жесткий опыт выведения продуктов в релиз на работе, однако никогда не дотаскивал до продакшена персональные проекты. Они у меня все заканчивались на прототипах разной степени отвратительности, но этот вроде бы выжил. В данный момент он запущен для 80+ стран (вся Европа, Азия и Северная Америка), на обеих мобильных платформах, и в конце статьи будут ссылки на скачивание — поэтому всех заинтересовавшихся приглашаю попробовать, поломать и поругать.

Вот вкратце мысль, с которой все началось: На мой взгляд поиск по существующим мобильным картам сделан для пешеходов и не работает для водителей совсем. Нужно останавливаться, копаться в заваленных лишней информацией и рекламой картах, тыкать на маленькие иконки. Это неудобно, никак не выручит тебя в неизвестном месте, в конце концов просто опасно. Необходимо интуитивное и чистое решение, которые не отвлекает и не заставляет тормозить.

В первой части я описал свой путь от этой нехитрой мысли до рабочего решения, а далее расскажу, как протащил это решение до релиза.

Читать дальше →

+12

dchabanenko 9 ноя 2018 в 11:02

Как я пытался починить поиск по картам для водителей

8 мин

3.7K

Геоинформационные сервисы*Разработка мобильных приложений*

Из песочницы

Это история про то, как я пытался решить одну странную проблему, которая мешала мне самому. Забегая вперед, скажу — получившимся решением я доволен и довел приложение до логического конца. Однако, чтобы запустить его полноценно, нужно больше ресурсов, поэтому я решил взять паузу и спросить людей, нужно ли оно кому-то еще. С этой целью (а еще чтобы просто выговориться) и пишу здесь.

Читать дальше →

+7

mansonheart 17 фев 2019 в 13:32

Откуда растут ноги у Java Memory Model

19 мин

77K

Java*Параллельное программирование*

Из песочницы

Современное железо и компиляторы готовы перевернуть с ног на голову наш код, лишь бы он работал быстрее. А их производители тщательно скрывают свою внутреннюю кухню. И все прекрасно, пока код выполняется в одном потоке.

В многопоточной среде можно волей-неволей наблюдать интересные вещи. Например выполнение инструкций программы не в том порядке, как написано в исходном коде. Согласитесь, неприятно осознавать, что выполнение исходного кода строчка за строчкой это всего лишь наша фантазия.

Но все уже осознали, ведь жить с этим как-то надо. А Java программисты даже неплохо живут. Потому что в Java есть модель памяти — Java Memory Model (JMM), которая предоставляет достаточно простые правила для написания корректного многопоточного кода.

И правил этих достаточно для большинства программ. Если вы их не знаете, но пишите или хотите писать многопоточные программы на Java, то лучше как можно скорее ознакомиться с ними. А если знаете, но вам не хватает контекста или интересно узнать откуда растут ноги у JMM, тогда статья может вам помочь.

Читать дальше →

+51

KarinaErzina 13 фев 2019 в 13:16

Как отличить хороший ремонт от плохого, или как мы в SRG сделали из Томита-парсера многопоточную Java-библиотеку

7 мин

3K

Блог компании SRGJava*Natural Language Processing*Open source*Машинное обучение*

В этой статье речь пойдет о том, как мы интегрировали разработанный Яндексом Томита-парсер в нашу систему, превратили его в динамическую библиотеку, подружили с Java, сделали многопоточной и решили с её помощью задачу классификации текста для оценки недвижимости.

Читать дальше →

+13

welcomerooot 30 авг 2016 в 00:12

Gitlab-CI

5 мин

110K

Блог компании СлёрмDevOps*IT-инфраструктура*Серверное администрирование*Системное администрирование*

Туториал

Всем привет.
У нас не так много задач, которым необходим полноценный CI. Некоторое время мы использовали в качестве CI-сервиса Jenkins. Там всё довольно очевидно, он прост и гибок в настройке, имеет кучу плагинов, но пару раз мы столкнулись с OOM-убийцами агентов на слабых машинах и решили рассмотреть в качестве CI-сервиса Gitlab CI, потому что мы любим эксперименты и тем более в комментариях к нашей прошлой статье задавали такой вопрос.

Читать дальше →

+24

dmitrybugaychenko 8 фев 2019 в 11:28

Как программист датасаентистам кернелы писал

5 мин

7.3K

Блог компании ОКМашинное обучение*Python*Data Mining*Big Data*

Мало кто верит, что современный data science-стек может быть построен не на Python, но такие прецеденты есть :). Стек Одноклассников формировался долгие годы, в первую очередь программистами, перешедшими в data science, но всё ещё остались близкими к проду, поэтому в его основе лежат открытые технологии JVM-стека: Hadoop, Spark, Kafka, Cassandra и т.д. Это помогает нам сокращать время и затраты на ввод моделей в эксплуатацию, но иногда создаёт и сложности. Например, при подготовке базовых решений для участников SNA Hackathon 2019 пришлось сжать волю в кулак и погрузиться в мир динамической типизации. Подробности (и лёгкий троллинг) под катом :)

Читать дальше →

+15

aghast 8 фев 2019 в 08:18

Как мы сайт Republic на Kubernetes переводили

11 мин

13K

Блог компании ITSummaKubernetes*Высокая производительность*Веб-разработка*Управление медиа*

Скандальные, важные и просто очень крутые материалы выходят в СМИ не каждый день, да и со 100% точностью спрогнозировать успешность той или иной статьи не возьмётся ни один редактор. Максимум, чем располагает коллектив — на уровне чутья сказать, «крепкий» материал или же «обычный». Все. Дальше начинается непредсказуемая магия СМИ, благодаря которой статья может выйти в топы поисковой выдачи с десятками ссылок от других изданий или же материал канет в Лету. И вот как раз в случае публикации крутых статей сайты СМИ периодически падают под чудовищным наплывом пользователей, который мы с вами скромно называем «хабраэффектом».

Этим летом жертвой профессионализма собственных авторов стал сайт издания Republic: статьи на тему пенсионной реформы, о школьном образовании и правильном питании в общей сложности собрали аудиторию в несколько миллионов читателей. Публикация каждого упомянутого материала приводила к настолько высоким нагрузкам, что до падения сайта Republic оставалось совсем «вот столечко». Администрация осознала, что надо что-то менять: нужно было изменить структуру проекта таким образом, чтобы он мог живо реагировать на изменение условий работы (в основном, внешней нагрузки), оставаясь полностью работоспособным и доступным для читателей даже в моменты очень резких скачков посещаемости. И отличным бонусом было бы минимальное ручное вмешательство технической команды Republic в такие моменты.

По итогам совместного со специалистами Republic обсуждения различных вариантов реализации озвученных хотелок мы решили перевести сайт издания на Kubernetes*. О том, чего нам всем это стоило, и будет наш сегодняшний рассказ.

*В ходе переезда ни один технический специалист Republic не пострадал

Читать дальше →

+54

botyaslonim 4 фев 2019 в 11:51

Проблемы использования сервиса Яндекс.Метрика

1 мин

8.6K

JavaScript*Яндекс API*

В последние дни наблюдаем весьма странное поведение сервиса Яндекс.Метрика. Некоторые сайты, в которых нужно вводить/выбирать пользовательские данные, стали вести себя не очень адекватно. При полной очистке истории браузера проблема пропадает, однако далее всё возобновляется.

Суть ошибки, как видно из скриншотов, в JS-ошибке скрипта, расположенного по адресу mc.yandex.ru/metrika/tag.js. Сейчас (11:41 04.02.2019 по Москве) эту ошибку можно увидеть, например, на сайте Аэрофлота, попробовав с морды сайта выбрать направление полёта:

Читать дальше →

+12

caesar_84 27 дек 2018 в 21:29

MVP и Dagger 2 – скелет Android-приложения – часть 2

4 мин

5.1K

Разработка под Android*

Туториал

Данная статья является результатом изысканий, побочным продуктом которых стало воплощение давней идеи в одном очень полезном и очень не хватавшем мне когда-то Android-приложении – My Location Notifier, предназначенном для автоматического оповещения адресата о прибытии пользователя (см. подробное описание по ссылке).

Итак, в первой части мы построили основной скелет Android-приложения в соответствии с архитектурой MVP. Теперь начнем прикручивать к нему Dagger 2.

Читать дальше →

+1

karelovao 27 дек 2018 в 11:20

«Секретики» DPAPI или DPAPI для пентестеров

15 мин

22K

Информационная безопасность*Тестирование IT-систем*

Вторая статья по итогам выступления нашей команды на OFFZONE-2018. На этот раз рассмотрим доклад с MainTrack “Windows DPAPI “Sekretiki” or DPAPI for pentesters”.

Внимание! Очень много буков!

При проведении RedTeam кампаний хочется давать меньше поводов для реакции BlueTeam, но их может быть много. Например, запуск mimikatz для получения пользовательских паролей или сертификатов. Даже если мы сумели «отмазать» его от Касперского, у BlueTeam есть возможность отслеживания с помощью специализированных средств, таких как Sysmon, Microsoft ATA и т.д. В тоже время хотелось бы получить максимум информации со скомпрометированной машины пользователя. В ходе неоднократно проведенных RedTeam кампаний с противодействием настоящим BlueTeam командам мы пришли к выводам, что необходимо в максимально избегать действий, которые могу служить индикаторами компрометации системы. Достигнуть эту цель возможно с помощью использования легальных механизмов и действий, предусмотренных операционной системой для пользователя.

Одним из таких легальных инструментов является механизм DPAPI (Windows Data Protection API), который используется операционной системой и различными приложениями для шифрования чувствительных данных пользователя (прежде всего паролей, криптографических ключей и т.д.) Для конечного пользователя и его приложений DPAPI выглядит предельно просто: есть всего 2 функции – «зашифровать данные» и «расшифровать данные». В данной статье хотелось бы рассмотреть, насколько такой механизм полезен пентестерам при проведении RedTeam кампаний.

Читать дальше →

+16

tashbenbetov 3 дек 2018 в 10:27

Как генерировать осмысленные коммиты. Применяем стандарт Conventional Commits

8 мин

124K

Блог компании ЯндексПрограммирование*Веб-разработка*Разработка мобильных приложений*Разработка под Windows*

Привычный хаос в названиях коммитов. Знакомая картина?

Наверняка вы знаете git-flow. Это отличный набор соглашений по упорядочиванию работы с ветками в Git. Он хорошо документирован и широко распространен. Обычно мы знакомы с правильным ветвлением и много говорим об этом, но, к сожалению, уделяем слишком мало внимания вопросу наименования коммитов, поэтому часто сообщения в Git пишутся бессистемно.

Меня зовут Ержан Ташбенбетов, я работаю в одной из команд Яндекс.Маркета. И сегодня я расскажу читателям Хабра, какие инструменты для создания осмысленных коммитов мы используем в команде. Приглашаю присоединиться к обсуждению этой темы.

Читать дальше →

+70

klimentRu 3 дек 2018 в 21:59

Angular 6+ полное руководство по внедрению зависимостей. providedIn vs providers:[]

7 мин

41K

Веб-разработка*TypeScript*JavaScript*Angular*

Перевод

В Angular 6 появился новый улучшенный синтаксис для внедрения зависимостей сервисов в приложение (provideIn). Несмотря на то, что уже вышел Angular 7, эта тема до сих пор остается актуальной. Существует много путаницы в комментариях GitHub, Slack и Stack Overflow, так что давайте подробно разберем эту тему.

В данной статье мы рассмотрим:

Внедрение зависимостей (dependency injection);
Старый способ внедрения зависимостей в Angular (providers: []);
Новый способ внедрения зависимостей в Angular (providedIn: 'root' | SomeModule);
Сценарии использования provideIn;
Рекомендации по использованию нового синтаксиса в приложениях;
Подведем итоги.

Читать дальше →

+13

iG0Lka 22 ноя 2018 в 15:31

Делаем WX-Mouse в корпусе Nova Slider 600

7 мин

15K

DIY или Сделай самКомпьютерное железоПериферия

WX-Mouse — это создание, в каком либо корпусе, мышки с уникальным функционалом и отличным качеством работы сенсора. В этой заметке я расскажу как сделать WX-Mouse в необычном корпусе — Nova Slider 600.

Читать дальше →

+31

Devcolibri 8 ноя 2018 в 14:51

Drag и Swipe в RecyclerView. Часть 2: контроллеры перетаскивания, сетки и пользовательские анимации

7 мин

17K

Разработка под Android*Разработка мобильных приложений*Программирование*Дизайн мобильных приложений*

Туториал

Перевод

Drag и Swipe в RecyclerView. Часть 2: контроллеры перетаскивания, сетки и пользовательские анимации

В первой части мы рассмотрели ItemTouchHelper и реализацию ItemTouchHelper.Callback, которая добавляет базовые функции drag & drop и swipe-to-dismiss в RecyclerView. В этой статье мы продолжим то, что было сделано в предыдущей, добавив поддержку расположения элементов в виде сетки, контроллеры перетаскивания, выделение элемента списка и пользовательские анимации смахивания (англ. swipe).

Читать дальше →

+5

terrakok 19 окт 2018 в 08:59

Лицензия на вождение болида, или почему приложения должны быть Single-Activity

14 мин

60K

Блог компании red_mad_robotРазработка под Android*

На AppsConf 2018, которая прошла 8-9 октября, я выступил с докладом про создание андроид-приложений целиком в одном Activity. Хотя тема известная, существует много предубеждений относительно такого выбора — переполненный зал и количество вопросов после выступления тому подтверждение. Чтобы не ждать видеозаписи, я решил сделать статью с расшифровкой выступления.

О чем я расскажу

Почему и зачем надо переходить на Single-Activity
Универсальный подход для решения задач, которые вы привыкли решать на нескольких Activity
Примеры стандартных бизнес задач
Узкие места, где обычно подпирают код, а не делают все честно

Читать дальше →

+37

phillennium 12 окт 2018 в 12:50

Оптимизируем веб с Виталием Фридманом: скорость загрузки, память, CPU

10 мин

17K

Блог компании JUG Ru GroupВеб-разработка*Высокая производительность*Веб-дизайн*JavaScript*

Это второй пост о всевозможных трюках во фронтенд-разработке. В нем затронут вопрос оптимизации сайта, скорости его загрузки на устройствах с недостаточным объемом оперативной памяти и медленным CPU.

Отдельный разговор про инструменты, которые помогут ускорить и контролировать работу сайта и сторонних приложений, которые к нему подключены. Плюс рассказ об особенностях верстки email-рассылок, который вас немало удивит.

В основе материала — расшифровка доклада Виталия с конференции HolyJS 2018 Piter.

+29

olegchir 11 окт 2018 в 13:46

Особые исключения в .NET и как их готовить

17 мин

34K

Блог компании JUG Ru Group.NET*Высокая производительность*КонференцииПрограммирование*

У разных исключений в .NET есть свои особенности, и знать их бывает очень полезно. Как обмануть CLR? Как остаться в живых в рантайме, поймав StackOverflowException? Какие исключения перехватить вроде бы нельзя, но если очень хочется, то можно?

Под катом расшифровка доклада Евгения (epeshk) Пешкова с нашей конференции DotNext 2018 Piter, где он рассказал про эти и другие особенности исключений.

+49

Devcolibri 27 сен 2018 в 16:43

Flutter для Android-разработчиков. Как создавать UI для Activity, используя Flutter

6 мин

21K

Dart*Flutter*Дизайн мобильных приложений*Разработка мобильных приложений*Разработка под Android*

Туториал

Перевод

Flutter для Android-разработчиков. Как создавать UI для Activity, используя Flutter

Эта статья написана для Android-разработчиков, которые хотят применить свои существующие знания для создания мобильных приложений с помощью Flutter. В этой статье мы рассмотрим эквивалент Activity во Flutter.

Читать дальше →

+23

sk1project 22 сен 2018 в 17:31

WiX.Py: cобираем MSI пакет «в три строчки»

3 мин

13K

DevOps*IT-инфраструктура*Open source*Python*

Из песочницы

Нет времени и желания изучать километровые файлы WiX, чтобы собрать MSI инсталлер для своего проекта, погружаясь при этом в бездны MSDN? Хотите собирать инсталлер, описывая его простыми и понятными терминами, в несколько строк? Есть клиническая склонность к кроссплатформенности и сборкам под Linux & Docker? Ну тогда вам под кат!

Читать дальше →

+27

4

5 6 ...