Все потоки

Python *

Высокоуровневый язык программирования

702,58

Рейтинг

СтатьиПостыНовостиАвторыКомпании

a-pichugin 26 мар 2018 в 08:29

Обзор второго дня Data Science Weekend 2018. Data Engineering, ETL, поисковые сервисы и многое другое

9 мин

4.2K

Блог компании New Professions LabBig Data * Data Engineering * Data Mining * Python *

Несколько дней назад мы публиковали обзор первого дня Data Science Weekend 2018, который прошел 2-3 марта на Мансарде Rambler&Co. Изучив практику использования алгоритмов машинного обучения, теперь перейдем к обзору второго дня конференции, в течении которого спикеры рассказывали об использовании различных инструментов дата инженера для нужд дата-платформ, ETL, сервисах подсказок при поиске и многом другом.

Читать дальше →

+5

Scorobey 25 мар 2018 в 00:53

Контроллер Arduino с датчиком температуры и Python интерфейсом для динамической идентификации объектов управления

7 мин

15K

Python * Анализ и проектирование систем * Математика * Программирование микроконтроллеров * Windows *

Введение

Возможность получения действительной информации о состоянии реальных объектов в реальном масштабе времени позволяет обоснованно приступать к следующему этапу анализа и синтеза систем – математическому моделированию динамических характеристик объектов управления.

В данной публикации рассматривается доступный в реализации проект системы измерения технологического параметра – температуры, с дистанционной передачей сигнала в вычислительную среду для дальнейшей обработки измерительной информации.

В основу данного проекта положены аппаратные средства для прототипирования на базе платформы Arduino со множеством совместимых с ними модулей и свободных программных средств Python, образующих интегрированную среду разработки Arduino Software.

Читать дальше →

+6

YuliyaCl 24 мар 2018 в 19:37

«Cделать красиво». Визуализация обучения с Tensorboard от Google

5 мин

38K

Google API * Python * TensorFlow * Визуализация данных * Машинное обучение *

Туториал

Красота, как известно, требует жертв, но и мир обещает спасти. Достаточно свежий (2015г) визуализатор от Google призван помочь разобраться с процессами, происходящими в сетях глубокого обучения. Звучит заманчиво.

Красочный интерфейс и громкие обещания затянули на разбор этого дизайнерского шайтана, с неинтуитивно отлаживающимися глюками. API непривычно скудный и часто обновляющийся, примеры в сети однотипны (глаза уже не могут смотреть на заезженный MNIST).

Чтобы опыт не прошел зря, решила поделиться максимально простым описанием инсайтов с хабравчанами, ибо рускоязычных гайдов мало, а англоязычные все как на одно лицо. Может, такое введение поможет вам сократить время на знакомство с Tensorboard и количество ругательных слов на старте. Также буду рада узнать, какие результаты он дал в вашем проекте и помог ли в реальной задаче.

Читать дальше →

+4

PavelMSTU 23 мар 2018 в 09:02

Хеш-стеганография в dataset-ах. На этот раз быстрая

4 мин

4.6K

Python * Информационная безопасность * Криптография * Программирование * Системы связи *

Всех с пятницей! В своём прошлом посте про хеш-стеганографию я предложил иной подход в стеганографии — не вкраплять никакой информации в контейнер, а просто упорядочивать контейнеры в нужном порядке и тем самым передавать скрытую информацию. Два дня назад romabibi опубликовал proof of consept для хеш-стеганографии в соц.сети вКонтакте.

Однако в использовании картинок как контейнеров есть важный изьян. Цитирую коммент alekseev_ap:

Всё это очень интересно, но КПД такой системы чрезвычайно низкий. Сколько надо отправить десятков (а то и сотен) килобайт чтобы передать строку из нескольких слов?!

Действительно, если изображение весит условно 0.5 — 2 Мбайт, а на каждое изображение мы передаем от 1 до 3 нибллов, то получаемая скорость очень мала: от 0.5 до 6 B/MB

Поэтому для практического применения нужно найти такой контейнер, который обладал бы следующими свойствами:

был бы очень мал;
при большом количестве контейнеров, стоящие друг за другом; не вызывал бы "подозрений";
при смене порядка контейнеров, они бы не вызывали "подозрение".

Итак, капитан-очевидность решение: необходимо осуществлять хеш-стеганографию в больших датасетах. Одна строка — один ниббл (полубайт).

_{Gif-анимация, показывающая суть хеш-стеганографии в датасетах. Разумеется на практике нужно сжать и зашифровать перед стеганографией}

Дальше читать

+10

sdore 23 мар 2018 в 02:20

Стойкое шифрование данных в PNG

2 мин

15K

Open source * Python * Криптография * Обработка изображений * Сжатие данных *

Доброго утра Хабру. Читал вчера статью о хэш-стеганографии через социальные сети, и пришла мне в голову мысль сделать что-то более оптимальное в плане объёма выходных данных. Получилось что-то более-менее работоспособное и даже оптимизированное (в отличие от proof-of-concept romabibi), поэтому, как и обещал, пишу статью.

Что ж, поздороваюсь с вами ещё раз: key=habr

key=habr

, и добро пожаловать под кат.

Поехали!

+6

albu 22 мар 2018 в 11:00

Автоматическая векторизация спутниковых снимков: одна модель — два первых места

10 мин

16K

Блог компании Open Data SciencePython * Алгоритмы * Машинное обучение * Обработка изображений *

Всем привет!

В данной статье хочу поделиться с вами историей о том, как одна и та же архитектура модели принесла сразу две победы в соревнованиях по машинному обучению на платформе topcoder с интервалом месяц.

Речь пойдёт о следующих соревнованиях:

Urban 3d mapper — поиск домиков на спутниковых снимках. Соревнование длилось 2 месяца, было 54 участников и пять призовых мест.
Spacenet: road detection challenge — поиск графа дорог. На решение также давалось 2 месяца, включало 33 участника и пять призовых позиций.

В статье рассказывается об общих подходах к решению таких задач и особенностях реализации для конкретных конкурсов.

Для комфортного чтения статьи желательно обладать базовыми знаниями о свёрточных нейронных сетях и их обучении.

Читать дальше →

+59

romabibi 21 мар 2018 в 18:20

Хэш-стеганография с использованием vkapi

3 мин

6.4K

Python * Информационная безопасность * Криптография * Программирование *

Привет, Хабр. Некоторое время назад решил разобраться, что такое стеганография, в чем её смысл и какая она бывает. И спустя несколько ссылок наткнулся на интересную статью про хэш-стеганографию. Возник вопрос — а почему бы не попробовать реализовать такой способ передачи на практике? Для начала — в виде proof of concept.

Читать дальше →

+12

M00nL1ght 20 мар 2018 в 17:11

Hessian-Free оптимизация с помощью TensorFlow

16 мин

14K

Python * Алгоритмы * Математика * Машинное обучение * Программирование *

Добрый день! Я хочу рассказать про метод оптимизации известный под названием Hessian-Free или Truncated Newton (Усеченный Метод Ньютона) и про его реализацию с помощью библиотеки глубокого обучения — TensorFlow. Он использует преимущества методов оптимизации второго порядка и при этом нет необходимости считать матрицу вторых производных. В данной статье описан сам алгоритм HF, а так же представлена его работа для обучения сети прямого распространения на MNIST и XOR датасетах.

Читать дальше →

+26

a-pichugin 20 мар 2018 в 10:23

Обзор первого дня Data Science Weekend 2018. Практика машинного обучения, новый подход к соревнованиям и многое другое

10 мин

5.1K

Блог компании New Professions LabBig Data * Data Mining * Python * Машинное обучение *

Привет, Хабр! 2-3 марта на Мансарде наших партнёров, компании Rambler&Co, прошел уже традиционный Data Science Weekend, на котором было множество выступлений специалистов в области работы с данными. В рамках этой статьи расскажем вам о самых интересных моментах первого дня нашей конференции, когда все внимание было уделено практике использования алгоритмов машинного обучения, управлению коллективами и проведению соревнований в области Data Science.

Читать дальше →

+14

sergeypid 20 мар 2018 в 09:14

Военное ведомство США должно срочно переосмыслить стратегию в области машинного обучения

2 мин

14K

Машинное обучение * Карьера в IT-индустрииИсследования и прогнозы в IT * Python *

Перевод

— Скажите государю, что у англичан ружья кирпичом не чистят: пусть что бы и у нас не чистили, а то, храни Бог войны, они стрелять не годятся – внятно выговорил Левша, перекрестился и умер.

Читать дальше →

+13

baldr 19 мар 2018 в 23:00

Несколько советов по организации Python-приложения на сервере

6 мин

32K

Django * Python * Программирование *

В этой статье я хочу поделиться несколькими удобными способами организации вашего проекта на рабочем (даже продакшен) сервере.

Я работаю, в основном, с Python/Django стеком, поэтому все примеры будут, в первую очередь, применительно к этому набору. Также ключевые технологии: Ubuntu (17.10), Python3 (3.6).

Содержание:

Логи (logrotate)
Демоны (systemd)
локальные настройки

Читать дальше →

+12

Sklert 19 мар 2018 в 08:14

Классификация музыкальных композиций по исполнителям с помощью Скрытых Марковских Моделей

8 мин

11K

Python * Алгоритмы * Машинное обучение *

Из песочницы

Скрытые марковские модели (Hidden Markov Models) с давних времен используются в распознавании речи. Благодаря мел-кепстральным коэффициентам (MFCC), появилась возможность откинуть несущественные для распознавания компоненты сигнала, значительно снижая размерность признаков. В интернете много простых примеров использования HMM с MFCC для распознавания простых слов.

После знакомства с этими возможностями появилось желание опробовать этот алгоритм распознавания в музыке. Так родилась идея задачи классификации музыкальных композиций по исполнителям. О попытках, какой-то магии и результатах будет рассказано в этом посте.

Читать дальше →

+6

evgri 19 мар 2018 в 06:51

Python’ом по машинлернингу

16 мин

19K

Блог компании MicrosoftMicrosoft Azure * Python * Машинное обучение * Программирование *

Сегодня только ленивый не говорит (пишет, думает) про машинное обучение, нейросети и искусственный интеллект в целом. Всего лишь в прошлом году ML сравнили с подростковым сексом — все хотят, но никто не занимается. Сегодня все озабочены тем, что ИИ нас оставит без работы. Хотя, судя по последним исследованиям Gartner, можно успокоиться, так как к 2020 году благодаря ИИ появится больше рабочих мест, чем ликвидируется. Так что, дорогой друг, учи ML, и будет тебе счастье.

Читать дальше →

+13

AGrin 19 мар 2018 в 03:36

Небольшая библиотека для применения ИИ в Telegram чат-ботах

11 мин

10K

Open source * Python * Машинное обучение * Программирование *

Добрый день! На волне всеобщего интереса к чат-ботам в частности и системам диалогового интеллекта вообще я какое-то время занимался связанными с этой темой проектами. Сегодня я хотел бы выложить в опенсорс одну из написанных библиотек. Оговорюсь, что в первую очередь я специализируюсь на алгоритмических аспектах разработки и поэтому буду рад конструктивной критике решений кодерского характера от более сведущих в этом вопросе специалистов.

Библиотека посвящена построению интерфейса между алгоритмом, возвращающим ответ на текстовый запрос и API мессенджера Telegram. Предназначена для гибкого применения алгоритмов машинного обучения.

Читать дальше →

+4

Scorobey 17 мар 2018 в 20:56

Математическая модель тепловыделяющего элемента ядерного реактора

10 мин

25K

Python * Алгоритмы * Анализ и проектирование систем * Математика * Windows *

Введение

Тепловыделяющий элемент (ТВЭЛ) — главный конструктивный элемент активной зоны гетерогенного ядерного реактора, содержащий ядерное топливо [1].

В ТВЭЛах происходит деление тяжелых ядер урана 235 или плутония 239, сопровождающееся выделением тепловой энергии, которая затем передаётся теплоносителю.

ТВЭЛ должен обеспечить отвод тепла от топлива к теплоносителю и препятствовать распространению радиоактивных продуктов из топлива в теплоноситель.

Поэтому расчёт температурных полей в ТВЭЛах является важной задачей проектирования ядерного реактора.

Читать дальше →

+11

tutam 17 мар 2018 в 19:34

Распознавание речи на python с помощью pocketsphinx или как я пытался сделать голосового ассистента

5 мин

132K

Python * Звук

Туториал

Это туториал по использованию библиотеки pocketsphinx на Python. Надеюсь он поможет вам
побыстрее разобраться с этой библиотекой и не наступать на мои грабли.

Читать дальше →

+10

snovvcrash 17 мар 2018 в 19:09

Искусство эксплойта минных полей: Разбираем CTF-таск про игру в Сапёра из «Мистера Робота»

16 мин

12K

CTF * Python * Криптография * Реверс-инжиниринг *

Здравствуйте, хабродамы и хаброгоспода!

Recently попался мне случайно на глаза один эпизод из недавно модного сериала «Мистер Робот». Не будучи сильно знакомым с проектом, я всё же знал о связанной с ним массивной пиар-кампании (которая вроде как даже проводила нечто вроде ARG-мероприятий), поэтому когда я услышал условие занимательного CTF-таска (из жанра bin/exploitation), представленного в сюжете одной из серий, я подумал, что скорее всего, этот таск существовал в действительности. Обратившись ко всемирной паутине, я подтвердил своё предположение, и, так как задача не очень сложная (не успеет наскучить в рамках одной хабростатьи), но крайне оригинальная и интересная, сегодня займемся её разбором.
Cut, cut, cut!

Читать дальше →

+14

SlavikMIPT 17 мар 2018 в 13:20

FFMPEG. Загружаем часть видео с YouTube

2 мин

32K

Серверная оптимизация * Работа с видео * Программирование * Python *

Туториал

Иногда мы хотим поделиться с друзьями частью какого то видео на YouTube — время концентрации внимания в современной реальности снижено до предела, и если скидывать ссылку на ролик(даже с таймкодом начала) с комментарием «смотреть с 21:51 по 24:55» — велика вероятность, что видео просмотрено не будет.

Кроме того — куски видео могут потребоваться для монтажа своих роликов — и довольно неудобно скачивать ради нескольких секунд весь ролик и искать/вырезать нужную часть в программе для монтажа.

Как загружать часть видео YouTube при помощи ffmpeg — под катом

Читать дальше →

+25

synedra 16 мар 2018 в 09:18

Distant Joining: выбираем репрезентативный набор генов

9 мин

3.2K

Python * Программирование *

Современные методы биоинформатики позволяют довольно точно восстанавливать эволюционные истории на основании последовательностей генов или белков ныне живущих организмов. А благодаря технологиям секвенирования нового поколения последовательности производятся быстрее, чем их успевают анализировать. Вот только эволюционная реконструкция – дело вычислительно дорогое и неплохо бы уметь получать репрезентативные выборки пригодного для анализа размера. Как это сделать и что вообще такое в данном случае “репрезентативная” – под катом.
Древо жизни по Hug et al. 2016

Древо жизни по Hug et al. 2016

Читать дальше →

+2

AlekSandrDr 16 мар 2018 в 06:41

Мега-Учебник Flask, Часть XV: Улучшение структуры приложения

18 мин

52K

Flask * Python * Веб-разработка *

Туториал

(издание 2018)

Miguel Grinberg

Туда Сюда

Это пятнадцатая часть серии Мега-учебников Flask, в которой я собираюсь реструктурировать приложение, используя стиль, подходящий для более крупных приложений.

Читать дальше →

+6

1 2 ...

418

419 420 ...