Articles / Bookmarks / Profile of EmachinesDIMA / Habr

How to become an author

Kerosin @EmachinesDIMA

DevOps

ProfileArticles1PostsNewsComments17

Vorb Apr 11 2011 at 19:11

Команда dd и все, что с ней связано

4 min

649K

В UNIX системах есть одна очень древняя команда, которая называется dd. Она предназначена для того, чтобы что-то куда-то копировать побайтово. На первый взгляд — ничего выдающегося, но если рассмотреть все возможности этого универсального инструмента, то можно выполнять довольно сложные операции без привлечения дополнительного ПО, например: выполнять резервную копию MBR, создавать дампы данных с различных накопителей, зеркалировать носители информации, восстанавливать из резервной копии данные на носители и многое другое, а, при совмещении возможностей dd и поддержке криптографических алгоритмов ядра Linux, можно даже создавать зашифрованные файлы, содержащие в себе целую файловую систему.
Опять же, в заметке я опишу самые часто используемые примеры использования команды, которые очень облегчают работу в UNIX системах.

Читать дальше →

+307

kravets Oct 24 2018 at 08:22

Сколько зарабатывает Хабр + инструкция как узнать сколько зарабатывают другие компании

3 min

75K

Business Models*Finance in ITMedia management*Start-up developmentWeb services monetization*

Предыстория: после того, как мы с командой в прошлом году закрыли компанию и еще не начали работу над новой, мы решили обновить наш старый, но довольно большой сайт с кулинарными рецептами. Чтобы понять насколько серьезно стоит углубляться в работу над ним, я проанализировал данные по выручке сайтов, которые тоже зарабатывают на рекламе.

В этом году уже вышли новые данные, которыми тоже решил поделиться. Доходы, расходы и прибыль приведены в миллионах рублей.

Читать дальше →

+97

AlexeySushkov Aug 23 2017 at 14:18

Машинное обучение: от Ирисов до Телекома

16 min

56K

Nexign corporate blogBig Data*Data Mining*Python*Machine learning*

Мобильные операторы, предоставляя разнообразные сервисы, накапливают огромное количество статистических данных. Я представляю отдел, реализующий систему управления трафиком абонентов, которая в процессе эксплуатации у оператора генерирует сотни гигабайт статистической информации в сутки. Меня заинтересовал вопрос: как в этих Больших Данных (Big Data) выявить максимум полезной информации? Не зря ведь одна из V в определении Big Data — это дополнительный доход.

Я взялся за эту задачу, не являясь специалистом в исследовании данных. Сразу возникла масса вопросов: какие технические средства использовать для анализа? На каком уровне достаточно знать математику, статистику? Какие методы машинного обучения надо знать и насколько глубоко? А может лучше для начала освоить специализированный язык для исследования данных R или Python?

Как показал мой опыт, для начального уровня исследования данных нужно совсем не много. Но мне для быстрого погружения не хватало простого примера, на котором наглядно был бы показан полный алгоритм исследования данных. В этой статье на примере Ирисов Фишера мы пройдем весь путь начального обучения, а далее применим полученное понимание к реальным данным оператора связи. Читатели, уже знакомые с исследованием данных, могут сразу переходить к главе, посвященной Телекому.

Читать дальше →

+13

IgorLevin Feb 12 2018 at 10:47

Увидеть мир глазами животных: новые горизонты айтрекинга

7 min

6.6K

Neurodata Lab corporate blogReading roomSystem Analysis and Design*Usability*

Когда мы говорим о технологиях по распознаванию эмоций, мы по умолчанию имеем в виду человека, то есть весь тот массив данных — вербальных и невербальных, — который им генерируется и используется для комплексной оценки его состояния. Однако чем дальше, тем большее внимание уделяется и животным: в последние годы регулярно проводятся исследования «эмоционального» мира лошадей или собак, например. В нашей статье мы обсудим один из разворотов этой темы: то, как айтрекинговые технологии применяются для изучения особенностей некоторых представителей фауны, обитающих бок о бок с нами. Так как же посмотреть вокруг глазами собаки, павлина или даже мыши?

Читать дальше →

+23

vodozhaba Dec 1 2017 at 20:12

Как выйти на путь разработки ОС

10 min

36K

Assembler*C*System Programming*

Tutorial

Данная статья служит одной простой цели: помочь человеку, который вдруг решил разработать свою операционную систему (в частности, ядро) для архитектуры x86, выйти на тот этап, где он сможет просто добавлять свой функционал, не беспокоясь о сборке, запуске и прочих слабо относящихся к самой разработке деталей. В интернете и на хабре в частности уже есть материалы по данной теме, но довольно трудно написать хотя бы “Hello world”-ядро, не открывая десятков вкладок, что я и попытаюсь исправить. Примеры кода будут по большей части на языке C, но многие другие языки тоже можно адаптировать для OSDev. Давно желавшим и только что осознавшим желание разработать свою операционную систему с нуля — добро пожаловать под кат.

Читать дальше →

+37

MzMz Dec 28 2015 at 16:16

Kaggle и Titanic — еще одно решение задачи с помощью Python

23 min

81K

Sport programming*Programming*Machine learning*Python*

Tutorial

Хочу поделиться опытом работы с задачей известного конкурса по машинному обучению от Kaggle. Этот конкурс позиционируется как конкурс для начинающих, а у меня как раз не было почти никакого практического опыта в этой области. Я немного знал теорию, но с реальными данными дела почти не имел и с питоном плотно не работал. В итоге, потратив пару предновогодних вечеров, набрал 0.80383 (первая четверть рейтинга).

Читать дальше →

+29

goldkostya Oct 5 2015 at 06:50

Предсказание выживания пассажиров Титаника при помощи Azure Machine Learning

9 min

26K

Microsoft corporate blogMachine learning*R*Microsoft Azure*Data Mining*

Выражаем большое спасибо за подготовку статьи Кириллу Малеву из компании Merku. Кирилл больше 3х лет занимается практическим применением машинного обучения для разных объёмов данных. В компании решает задачи в области предсказания оттока клиентов и обработки естественного языка, большое внимание уделяя коммерциализации полученных результатов. Закончил магистратуру Болонского университета и НГТУ

Сегодня мы расскажем вам про то, как на практике использовать облачную платформу Azure для решения задач машинного обучения для решения задач машинного обучения на примере популярной задачи предсказания выживших пассажиров Титаника.

Мы всем помним известную картинку про сову, поэтому в этой статье все шаги подробно комментируются. Если вам не понятен любой шаг, вы можете задать вопросы в комментариях.

предсказать вероятность спасения утопающих

+23

nevmenandr Nov 20 2017 at 04:50

Языки России в Интернете

15 min

34K

Popular scienceSocial networks and communities

Recovery Mode

Я начал писать этот текст уже давно, так что он не планировался как политически актуальный. Но так вышло, что именно в эти дни у СМИ появился инфоповод, связанный с малыми (миноритарными) языками России. Возможно, что исследование, о котором я пишу ниже, что-то кому-то в этом смысле прояснит.

Сколько в России языков?

Это не так просто осознать, но в России говорят на внушительном числе языков. Более того, в России говорят на таких языках, которые больше нигде не распространены. Скажем, в России обитают миллионы украинцев и узбеков, вместе с тем существуют и суверенные государства Украина и Узбекистан, где соответствующие языки являются государственными. А вот в России говорят на башкирском, тувинском, удмуртском и многих (действительно многих) других языках, у которых своего государственного статуса больше нигде нет.

Государственный статус — это важно. В эпоху глобализации языкам, чтобы выжить, нужна поддержка, которая позитивно влияет на печать, масс-медиа, искусство, в конечном счёте — на желание и возможность людей говорить на родном языке.

А насколько эти языки адаптировались к новым цифровым реалиям? Правда ли, что на них говорят только в отдалённых горных аулах? Или всё-таки они являются полноправным способом онлайн-общения? Несколько лет назад мы с коллегами решили это выяснить.

Читать дальше →

+77

VikSam Nov 12 2017 at 11:32

Как программно управлять WiFi маршрутизатором TP-Link с помощью Python requests

11 min

37K

Однажды передо мной встала задача реализации программного управления одним из распространенных домашних Wi-Fi маршрутизаторов TP-Link TL-WR841N, у которого, к сожалению, нет интерфейса управления через командную строку (telnet, SSH). Я хотел, чтобы мой Telegram бот, реализованный на Python на базе SBC в локальной домашней сети, на основе моих команд выполнял следующие функции управления маршрутизатором:

Перезагрузка маршрутизатора
Открытие/закрытие NAT Port Forwarding к внутренним WEB-сервисам
Открытие/закрытие удаленного доступа к маршрутизатору из WAN (интернет)
Определение устройств, зарегистрированных в локальной WiFi сети маршрутизатора

Читать дальше →

+11

1cloud Oct 18 2017 at 10:59

Microsoft и Amazon представили новую библиотеку для машинного обучения — Gluon

3 min

7.7K

1cloud.ru corporate blogDevelopment for e-commerce*Machine learning*API*

На прошлой неделе Amazon Web Services (AWS) и Microsoft представили открытую библиотеку Gluon для машинного обучения. Создатели утверждают, что она позволит разработчикам легко прототипировать и развёртывать сложные модели машинного обучения в облаке.

Читать дальше →

+11

Karaoke Sep 29 2017 at 13:06

Страницы 404

1 min

38K

Edison corporate blogUsability*Web design*Graphic design*Interfaces*

404 страница. Это место для пасхалок, дурачества и креатива создателей сайтов. Про 404 ошибку есть даже выступление на TED.

Первая «4» — означает, что ошибка на стороне клиента, «04» — означает конкретную ошибку «Not Found».

Кому в пятницу нечего делать или кто в поисках вдохновения — добро пожаловать под кат, там подборка лучших (и худших) 404 страниц.

+9

FirstJohn Sep 22 2017 at 08:34

Сheat-sheets «регулярные выражения»

1 min

23K

FirstVDS corporate blogServer Administration*System administration*DevOps**nix*

Ловите 2 плаката с регулярными выражениями в форматах A2 и A3.

Плакаты просто идеальные, потому что красивые и полезные сразу. Распечатайте, повесьте, любуйтесь и пользуйтесь.

Читать дальше →

+20

roman_logo Sep 19 2017 at 15:31

4 распространенные ошибки в дизайне, которые легко исправить

3 min

22K

Логомашина corporate blogGraphic design*Vector graphics*

Логомашине постоянно присылают дизайн для разбора: в соцсети, в комментарии на Хабре, на наш прямой эфир. Очень часто его можно легко улучшить, исправив какую-нибудь мелочь: цвета, размеры, расстояния. Мы сделали из того, что нам прислали подборку, которая поможет вам заметить самые распространенные проблемы и легко их исправить.

Confideal: чистим грязный цвет

Этот логотип прислали Логомашине в ВК.

Тут явная проблема с переходом цветов — градиентом. Между оттенками, которые стоят на разных концах цветового круга, всегда появляется «грязный» цвет. Такую же ошибку допустила Студия Лебедева в своем экспресс-дизайне за 100 000 рублей:

Читать дальше →

+21

xmm10 Aug 31 2017 at 12:40

Как правильно хешировать пароли в высоконагруженных сервисах. Опыт Яндекса

8 min

40K

Яндекс corporate blogCryptography*Information Security*High performance*

Я расскажу о такой проблеме, как хеширование паролей в веб-сервисах. На первый взгляд кажется, что тут все «яснопонятно» и надо просто взять нормальный алгоритм, которых уже напридумывали много, написать чуть-чуть кода и выкатить все в продакшн. Но как обычно, когда начинаешь работать над проблемой, возникает куча подводных камней, которые надо обязательно учесть. Каких именно? Первый из них — это, пожалуй, выбор алгоритма: хоть их и много, но у каждого есть свои особенности. Второй — как выбирать параметры? Побольше и получше? Как быть с временем ответа пользователю? Сколько памяти, CPU, потоков? И третий — что делать с computational DoS? В этой статье я хочу поделиться некоторыми своими мыслями об этих трех проблемах, опытом внедрения нового алгоритма хеширования паролей в Яндексе и небольшим количеством кода.

Attacker & Defender

Прежде чем переходить к алгоритмам и построению схемы хеширования, надо вообще понять, от чего же мы защищаемся и какую роль в безопасности веб-сервиса должно играть хеширование паролей. Обычно сценарий таков, что атакующий ломает веб-сервис (или несколько веб-сервисов) через цепочку уязвимостей, получает доступ к базе данных пользователей, видит там хеши паролей, дампит базу и идет развлекаться с GPU (и, в редких случаях, с FPGA и ASIС).

Читать дальше →

+94

rubyruby Aug 23 2017 at 10:57

Погружение в разработку на Ethereum. Часть 1

11 min

98K

Solidity*Cryptography*Programming*

Tutorial

Recovery Mode

Технология блокчейна завладела умами. Покупаются фермы, ICO собирают миллионы долларов. Наша компания тоже захотела приобщиться. Решили начать с малого. В серии статей будет описан наш путь от новичков в сфере блокчейна до общепризнанных гуру. На момент написания этих слов мы все еще на этапе новичков, предлагаем следить за нашим развитием и развиваться с нами.

Читать дальше →

+22

AloneCoder Aug 22 2017 at 16:52

Управление памятью в Python

9 min

119K

VK corporate blogPython*System Analysis and Design*High performance*Designing and refactoring*

Translation

Одна из главных проблем при написании крупных (относительно) программ на Python — минимизация потребления памяти. Однако управлять памятью здесь легко — если вас вообще это волнует. Память в Python выделяется прозрачно, управление объектами происходит с помощью системы счётчиков ссылок (reference count), и память высвобождается, когда счётчик падает до нуля. В теории всё прекрасно. А на практике вам нужно знать несколько вещей об управлении памятью в Python, чтобы ваши программы эффективно её использовали. Первая вещь, надо хорошо в ней разбираться: размеры основных объектов в Python. И вторая вещь: как устроено управление «под капотом» языка.

Начнём с размеров объектов. В Python есть много примитивных типов данных: целые числа (int), long (версия int с неограниченной точностью), числа с плавающей запятой (они же числа с двойной точностью, double), кортежи (tuple), строковые значения, списки, словари и классы.

Читать дальше →

+69

AllSoliton Aug 20 2017 at 17:06

О том, как довести первый проект до конца

6 min

23K

Unity3D*Game development*

Приветствую всех читателей данной статьи! Около двух лет назад я впервые открыл Unity и осмотрел просторы этого движка. И показался мне он чем-то невероятно сложным и запутанным. И вот я, обладая лишь начальными знаниями по программированию на C, решил сделать полноценную игру своей мечты, поскольку был наслышан о низком пороге вхождения.

Но теперь я могу сказать: я один из немногих, кто довёл свой первый проект до релиза! Сделал это, причём, не вложив в него ни копейки.

Читать дальше →

+22

Greendq Mar 13 2011 at 21:32

Веб-кластер — опыт реального применения

9 min

20K

High performance*

Приветствую, уважаемые сообщники!

Эта статья — о том, как мы реализовали веб-кластер для новостного портала (с пиком посещений в 130 тысяч уникальных посетителей в день — это 7Тб траффика за 3 дня — выборы и 2 последующих. Сейчас в среднем кластер раздаёт 35-40 Тб траффика в месяц), о том, как по-разному понимают одинаковые задачи программисты и журналисты, о том, как можно достичь одной и той же цели, идя разными путями.

Она будет интересна тем, кто хочет построить легко масштабируемый географически распределённый веб-кластер, не вкладывая астрономических сумм в оборудование (а по меркам телевидения — будут вообще смешные суммы).

Я больше чем уверен, что маркетологи, толкающие убер-решения свежевыпущенных продуктов, имеющих в своём названии слова «масштабируемый веб-кластер» или «horizontal infinite scalable web cluster», меня возненавидят.

Я больше чем уверен, что конкуренты наших клиентов будут удивлены простотой решения, которое мы использовали.

Читать дальше →

+71

volodalexey Jun 26 2017 at 15:34

Таблицы! Таблицы? Таблицы…

Easy

16 min

59K

HTML*JavaScript*ReactJS*

В статье я покажу стандартную табличную разметку, какие у неё есть альтернативы. Дам пример собственной таблицы и разметки, а также опишу общие моменты её реализации.

Читать дальше →

+14

Audioman May 18 2017 at 08:28

«Знакомство с аудиобрендами»: подборка материалов и полезных источников по теме

6 min

6.1K

Аудиомания corporate blogSoundComputer hardwareGadgets

В этой подборке мы решили познакомить наших читателей с историей, модельными линейками и особенностями продукции некоторых новых и устоявшихся аудиобрендов.

Здесь вы найдете примеры классической акустики и динамиков, а также подробнее узнаете о брендах, которые были представлены на нашей выставке на Барабанном.

Читать дальше →

+10

6

7 8 ...