Статьи / Закладки / Профиль sukhe / Хабр

Олег Сухонос @sukhe

программист

Профиль Статьи 9Посты Новости Комментарии 406

cotique 28 фев 2017 в 12:45

Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas

Простой

15 мин

1.1M

Блог компании Open Data ScienceData Mining*Python*Визуализация данных*Машинное обучение*

Туториал

Открытый курс машинного обучения mlcourse.ai сообщества OpenDataScience – это сбалансированный по теории и практике курс, дающий как знания, так и навыки (необходимые, но не достаточные) машинного обучения уровня Junior Data Scientist. Нечасто встретите и подробное описание математики, стоящей за используемыми алгоритмами, и соревнования Kaggle Inclass, и примеры бизнес-применения машинного обучения в одном курсе. С 2017 по 2019 годы Юрий Кашницкий yorko и большая команда ODS проводили живые запуски курса дважды в год – с домашними заданиями, соревнованиями и общим рейтингом учаcтников (имена героев запечатлены тут). Сейчас курс в режиме самостоятельного прохождения.

Читать дальше →

+42

DmitryOlkhovoi 12 фев 2020 в 16:24

Backblaze — статистика жестких дисков за 2019

4 мин

30K

Хранилища данных*Хранение данных*Резервное копирование*Накопители

Перевод

На 31 декабря 2019 г. у нас 124 956 работающих жестких дисков. Из них 2 229 загрузочных и 122 658 с данными. В данном обзоре мы рассмотрим статистику по отказам среди жестких дисков с данными. Также рассмотрим 12 и 14 TB версии дисков и новые 16 TB, которые мы активно используем с начала четвертого квартала 2019 года.

Статистика за 2019 год

На конец 2019 года мы мониторили 122 658 жестких дисков, использующихся для хранения данных. Мы убрали из расчета диски, которые использовались для тестирования, и диски, у которых нет наработки ~5 000 диско-дней (на модель) в течение четвертого квартала. Таким образом, мы собрали данные на основе 122 507 жестких дисков. Таблица ниже отображает нашу статистику:

Читать дальше →

+47

AndrewShmig 26 мая 2019 в 15:57

Введение в глубокое обучение с использованием TensorFlow

3 мин

19K

Искусственный интеллектМашинное обучение*

Туториал

Перевод

Полный курс на русском языке можно найти по этой ссылке.
Оригинальный курс на английском доступен по этой ссылке.

+15

MaxRokatansky 15 мар 2019 в 15:43

Сравнение фреймворков для глубокого обучения: TensorFlow, PyTorch, Keras, MXNet, Microsoft Cognitive Toolkit, Caffe, etc

7 мин

31K

Блог компании OTUSМашинное обучение*

Перевод

Всем привет. В этот пятничный день делимся с вами первой публикацией посвященной запуску курса «Data Scientist». Приятного прочтения.

Великое множество организаций загорелось идеей использовать в своих решениях искусственный интеллект для расширения масштабов деятельности или развития своего старт-апа, однако нужно понимать одну важную вещь: выбранная технология разработки должна идти вкупе с хорошим фреймворком для глубокого обучения, особенно потому, что каждый фреймворк служит для какой-то своей отдельной цели. Поиск идеального тандема в этом случае – это необходимое условие для плавного и быстрого развития бизнеса и успешного развертывания проектов.

Следующий список фреймворков для глубокого обучения может стать подспорьем в процессе выбора подходящего средства для решения конкретных задач, с которыми вы сталкиваетесь в процессе работы над проектом. Вы сможете сравнить плюсы и минусы различных решений, оценить их пределы возможностей и узнать о лучших вариантах использования для каждого решения!

Читать дальше →

Potok 19 авг 2013 в 23:56

LAN-тестер на AVR своими руками

7 мин

296K

DIY или Сделай сам

Проблема тестирования свежепроложенной локальной сети актуальна всегда. Когда-то мне в руки попала железка под названием «Rapport II», которая, вообще говоря, тестер для систем CCTV, но витую пару прозванивать умеет тоже. Железка та давно уже умерла, а вот впечатление осталось: при тестировании витой пары она показывала не просто переполюсовку и распарку, но точную схему обжима! Например, для кроссовера это выглядело 1 → 3, 2 → 6, 3 → 1, и так далее.
Но заплатить порядка 800 нерусских рублей за устройство, в котором я реально буду использовать всего одну функцию? Увольте! Как же это работает, может, проще сделать самому? Гугл в руки, и… сплошное разочарование. Вывод поиска состоит на 80% из мигалок светодиодами на сдвиговом регистре / AVR / PIC / свой вариант, и на 20% из глубокомысленных обсуждений форумных гуру на темы «купите %название_крутой_железки_за_100499.99_вечнозеленых% и не парьтесь». Посему, хочу предложить хабрасообществу свое решение данной проблемы в стиле DIY. Кого заинтересовало — прошу под кат (осторожно, некоторое количество фото!).

И что же там за велосипед?

+93

LukaSafonov 6 авг 2018 в 13:13

Новая техника атаки WPA2, не требующая наличия клиента на AP

3 мин

86K

Блог компании Инфосистемы ДжетБеспроводные технологии*Информационная безопасность*

Перевод

Участниками проекта hashcat обнаружен новый вектор атаки на беспроводной стандарт WPA2, не требующий классического перехвата "рукопожатия" между клиентом и точкой доступа. Данная уязвимость выявлена в рамках исследования потенциальных проблем безопасности нового протокола WPA3.

Читать дальше →

+42

Tri-Edge 29 янв 2020 в 12:02

[Конспект админа] Что делать, если программа хочет прав администратора, а вы нет

7 мин

209K

Блог компании СЕРВЕР МОЛЛИнформационная безопасность*Системное администрирование*

(с) Вася Ложкин.

К сожалению, в работе сисадмина нет-нет да и приходится разрешать пользователям запускать всякий софт с админскими правами. Чаще всего это какие-нибудь странные китайские программы для работы с оборудованием. Но бывают и другие ситуации вроде небезызвестного bnk.exe.

Выдавать пользователю права администратора, чтобы решить проблему быстро и просто, противоречит нормам инфобезопасности. Можно, конечно, дать ему отдельный компьютер и поместить в изолированную сеть, но — это дорого и вообще…

Попробуем разобрать решения, которые позволят и программу запустить, и безопасника с финансистом не обозлить.

Читать дальше →

+86

olegbunin 29 янв 2020 в 12:01

Нейросети в производстве зубных протезов

11 мин

6.5K

Блог компании Конференции Олега Бунина (Онтико)Высокая производительность*Искусственный интеллектМашинное обучение*Обработка изображений*

Замена зуба на имплант или установка коронки — болезненная и дорогая процедура. Одна из самых сложных частей в восстановлении — дизайн протеза в CAD-системе, которым занимаются зубные техники. Каждая коронка проектируется индивидуально под пациента и его челюсть за 8-10 минут. При этом у каждого техника своё субъективное видение, что такое хорошая зубная коронка, а оценка качества одной и той же коронки у разных специалистов одного уровня может варьироваться от «хорошо» до «можно и лучше».

Поэтому неудивительно, что в стоматологии задались целью убрать человеческий фактор и добавить автоматизацию. Сделать это можно с помощью нейросетей. Они сейчас продвинулись настолько, что могут распознавать объекты, находить преступников в толпе, рисовать картины по наброску, и заменять лица актеров в фильмах, например, Ди Каприо на Бурунова в фильме «Великий Гэтсби». С зубами они также помогают справиться, а как это получилось, расскажет Станислав Шушкевич.

+17

MaxRokatansky 29 янв 2020 в 15:06

Замена дисков меньшего объёма на диски большего объёма в Linux

17 мин

17K

Блог компании OTUSНастройка Linux*

Всем привет. В преддверии старта новой группы курса «Администратор Linux» публикуем полезный материал, написанный нашим студентом, а также наставником на курсах, специалистом технической поддержки корпоративных продуктов REG.RU — Романом Травиным.

В данной статье будет рассмотрены 2 случая замены дисков и переноса информации на новые диски большего объёма с дальнейшим расширением массива и файловой системы. Первый случай будет касаться замены дисков c одноименной разметкой MBR/MBR либо GPT/GPT, второй случай касается замены дисков с разметкой MBR на диски объёмом более 2 TB, на которые потребуется ставить разметку GPT с разделом biosboot. В обоих случаях диски, на которые переносим данным, уже установлены в сервер. Файловая система, используемая для корневого раздела — ext4.

Читать дальше →

+13

mobilz 26 янв 2018 в 22:14

Добываем Wi-Fi соседа стандартными средствами MacOS

5 мин

371K

Беспроводные технологии*Информационная безопасность*

Я всегда был фанатом багов и уязвимостей «на поверхности», всегда завидовал чувакам, которые пишут эксплойты для самых защищённых ОС, а сам умел только скрипткиддить (термин из нулевых). Однако мой пост про уязвимости в системах контроля версий набрал более 1000 лайков на Хабре и остаётся топ1 постом за всю историю Хабра, несмотря на то, что был написан 9(!) лет назад.

И сегодня я хотел бы на пальцах показать и рассказать про такую штуку, как вардрайвинг. А точнее, как стандартными средствами MacOS можно добыть пароли от Wi-Fi соседей. Нелёгкая забросила меня на очередную квартиру. Как-то исторически сложилось, что я ленивый. Пару лет назад я уже писал, что моя лень, новая квартира и провод Beeline (бывшая Corbina) помогли мне найти багу у Билайна и иметь бесплатно интернет в их сети. «Сегодня» происходит «подобное», я на новой квартире, нет даже провода, но есть много сетей у соседей.

Заколебавшись расходовать мобильный трафик, я решил, что «соседям надо помогать», и под «соседями» я имел введу себя…

Читать дальше →

+139

249

zhovner 30 янв 2020 в 06:46

Похек Wi-Fi встроенными средствами macOS

13 мин

67K

Беспроводные технологии*Информационная безопасность*

Туториал

TL;DR Встроенные средства macOS позволяют выполнить некоторые атаки на Wi-Fi-сети. В статье описывается, как с помощью встроенного в Macbook Wi-Fi адаптера AirPort и macOS похекать Wi-Fi.

Обычно для аудита безопасности Wi-Fi-сетей используется классическая связка: виртуалка с Kali Linux + внешний USB адаптер типа Alfa AWU-blabla1337. Но оказывается, что с помощью macOS и встроенного адаптера Broadcom тоже можно делать грязь.

Содержимое статьи:

Мониторный режим на встроенном адаптере
Расшифровываем WPA трафик
Ловим хендшейки и PMKID
Собираем под макось пацанские тулзы: hcxtools, hashcat, bettercap
Брутим хеши на онлайн-фермах и локально

Йоу, камон мазафака

+60

Alex_Donchuk 20 янв 2020 в 15:17

TensorRT 6.x.x.x — высокопроизводительный инференс для моделей глубокого обучения (Object Detection и Segmentation)

9 мин

24K

Блог компании Open Data ScienceDevOps*Python*Машинное обучение*Обработка изображений*

Туториал

Больно только в первый раз!

Всем привет! Дорогие друзья, в этой статье я хочу поделиться своим опытом использования TensorRT, RetinaNet на базе репозитория github.com/aidonchuk/retinanet-examples (это форк официальной репы от nvidia, который позволит начать использовать в продакшен оптимизированные модели в кратчайшие сроки). Пролистывая сообщения в каналах сообщества ods.ai, я сталкиваюсь с вопросами по использованию TensorRT, и в основном вопросы повторяются, поэтому я решил написать как можно более полное руководство по использованию быстрого инференса на основе TensorRT, RetinaNet, Unet и docker.

Читать дальше →

+55

YuriyIvon 10 янв 2020 в 11:27

Какие английские слова IT-лексикона мы неправильно произносим чаще всего

5 мин

173K

Блог компании EPAMИзучение языков

Пока пара новых статей на технические темы еще в процессе написания, я решил опубликовать небольшой лингвистический материал. Достаточно часто замечаю, что коллеги, у которых английский язык — не родной, неправильно произносят некоторые характерные для IT сферы слова. И дело здесь не в том, насколько аутентично произносятся отдельные звуки, а именно в транскрипции. Регулярно встречал ситуации при общении с носителями, когда неправильно произносимое слово приводило к недопониманиям.

Дальше я приведу несколько наборов слов, сгруппированных по типовым ошибкам. К каждому слову будет приложена транскрипция, приблизительная транскрипция на русском и ссылка на более детальную информацию в словаре. Так как большинство IT компаний все-таки работает с Северной Америкой, то транскрипции будут из US English.

Читать дальше →

+307

486

ITNOOB 7 янв 2020 в 14:14

Deep Reinforcement Learning: как научить пауков ходить

14 мин

22K

Python*TensorFlow*Алгоритмы*Искусственный интеллектМашинное обучение*

Туториал

Из песочницы

Сегодня я расскажу, как я применил алгоритмы глубинного обучения с подкреплением для управления роботом. Вкратце, поведаю о том, как создать «чёрный ящик с нейросетями», который на входе принимает архитектуру робота, а на выходе выдаёт алгоритм, способный им управлять.

Основой решения является алгоритм Advantage Actor Critic (A2C) с оценкой Advantage через Generalized Advantage Estimation (GAE).

Под катом математика, реализация на TensorFlow и множество демок того, к каким способам ходьбы сошлись алгоритмы.

+26

AlexanderYurev 6 янв 2020 в 19:54

Mask R-CNN от новичка до профессионала

7 мин

32K

Python*Искусственный интеллект

Из песочницы

Однажды мне потребовалось анализировать информацию с изображения и на выходе иметь тип объекта, его вид, а также, анализируя совокупность кадров, мне нужно было выдать идентификатор объекта и время пребывания в кадре, было нужно определять как перемещался объект и в поле зрения каких камер попадал. Начнем, пожалуй, с первых двух, о анализе кадров в совокупности речь пойдет в следующей части.

Читать дальше →

+20

GomboTs 7 янв 2020 в 21:44

Что делать, если забыт код от замка чемодана?

5 мин

123K

Лайфхаки для гиков

Из песочницы

Новый год — сезон путешествий. Сегодня весь путешествующий мир использует чемоданы с замками, одобренными TSA. Обычно замок кодовый и выглядит примерно вот так:

Не секрет, что безопасность, обеспечиваемая такими замками, в основном виртуальная — во-первых, тысяча комбинаций это совсем немного; во-вторых, форма мастер-ключей TSA давно утекла в сеть (поиск их предоставлю в качестве упражнения заинтересованному читателю); в-третьих, эти замки легко вскрываются обычными отмычками; наконец, открыть чемодан на молнии вполне можно не трогая замок, а распустив молнию (для этого хватит шариковой ручки). Тем не менее, мы продолжаем пользоваться этими замками — они удобно паркуют бегунки молнии, страхуя от случайного расстегивания, а также от того, что брелок за что-то зацепится и оторвется; да и все-таки отвращают любопытство совсем случайных прохожих.

При таких исходных данных, вообще говоря, неразумно менять код с фабричного 000; однако, либо вам самим, либо кому-то из неугомонных родственников вполне может показаться, что тайный код — идея неплохая в и вообще интересно посмотреть, как это работает. И тогда, рано или поздно, наступает день, когда завтра вам вылетать в отпуск, а чемодан заперт и кода никто не помнит.

Что делать?

Читать дальше →

+101

100

ru_vds 6 янв 2020 в 12:30

Изучаем Metaflow за 10 минут

13 мин

13K

Блог компании RUVDS.comPython*Программирование*Веб-разработка*

Перевод

Metaflow — это Python-фреймворк, созданный в Netflix и ориентированный на сферу Data Science. А именно, он предназначен для создания проектов, направленных на работу с данными, и для управления такими проектами. Недавно компания перевела его в разряд опенсорсных. Фреймворк Metaflow в последние 2 года нашёл широкое применение внутри Netflix. Он, в частности, позволил значительно сократить время, необходимое для вывода проектов в продакшн.

Материал, перевод которого мы сегодня публикуем, представляет собой краткое руководство по Metaflow.

Читать дальше →

+31

FooBar167 1 янв 2020 в 23:10

Письмо начинающему изучать Data Science

2 мин

64K

Python*Искусственный интеллектМашинное обучение*Обработка изображений*Программирование*

Из песочницы

Я бы хотел получить такое письмо три года назад, когда только начинал изучать Data Science (DS). Чтобы там были необходимые ссылки на полезные материалы. Статья не претендует на полноту охвата необъятной области DS. Однако для начинающего специалиста будет полезна.

Нейронные сети – это...

Читать дальше →

+28

ph_piter 27 дек 2019 в 08:53

Интервью с Уиллом Куртом о его новой книге «Байесовская статистика – это здорово»

11 мин

6.6K

Блог компании Издательский дом «Питер»Big Data*Машинное обучение*Профессиональная литература*Статистика в IT

Перевод

Привет, Хабр!

В самом конце года успеваем поделиться с вами новостью о том, что приступаем к работе «Bayesian Statistics the Fun Way» от издательства No Starch Press. Предлагаем перевод развернутого интервью с автором книги; текст касается как самой книги, так и смежных с ней тем, и даже дополнительного чтения.

Читать дальше →

ph_piter 20 дек 2019 в 16:12

Анонс книги «Машинное обучение без лишних слов»

3 мин

6.6K

Блог компании Издательский дом «Питер»Профессиональная литература*

Привет, Хаброжители!

Готовится к сдаче в типографию полноцветная новинка «Машинное обучение без лишних слов»
#1 in Data Mining
#2 in Programming Algorithms
#3 in Machine Theory

Эту книгу рекомендуют к прочтению Питер Норвиг, Джеймс Гаррет и Орельен Жерон. Предисловие к русскоязычному изданию написал Сергей Николенко, автор нашей культовой книги «Глубокое обучение»

В ближайшее время мы выложим отрывок и откроем предзаказ, а пока предоставляем слово Сергею Николенко и благодарим его за бесценные рекомендации, которые позволили улучшить русскоязычное издание книги.

Читать дальше →

+14

1 2 ...

34 35

37 38 39 40 41

Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas

Backblaze — статистика жестких дисков за 2019

Статистика за 2019 год

Введение в глубокое обучение с использованием TensorFlow

Сравнение фреймворков для глубокого обучения: TensorFlow, PyTorch, Keras, MXNet, Microsoft Cognitive Toolkit, Caffe, etc

LAN-тестер на AVR своими руками

Новая техника атаки WPA2, не требующая наличия клиента на AP

[Конспект админа] Что делать, если программа хочет прав администратора, а вы нет

Нейросети в производстве зубных протезов

Замена дисков меньшего объёма на диски большего объёма в Linux

Добываем Wi-Fi соседа стандартными средствами MacOS

Похек Wi-Fi встроенными средствами macOS

TensorRT 6.x.x.x — высокопроизводительный инференс для моделей глубокого обучения (Object Detection и Segmentation)

Какие английские слова IT-лексикона мы неправильно произносим чаще всего

Deep Reinforcement Learning: как научить пауков ходить

Mask R-CNN от новичка до профессионала

Что делать, если забыт код от замка чемодана?

Изучаем Metaflow за 10 минут

Письмо начинающему изучать Data Science

Интервью с Уиллом Куртом о его новой книге «Байесовская статистика – это здорово»

Анонс книги «Машинное обучение без лишних слов»

Информация

Специализация