Все потоки

Python *

Высокоуровневый язык программирования

711,05

Рейтинг

СтатьиПостыНовостиАвторыКомпании

DmitrySpb79 16 сен 2019 в 20:03

Хабрастатистика: анализируем комментарии читателей

4 мин

11K

HabrPython * Программирование * Социальные сетиСтатистика в IT

Привет Хабр. В предыдущей части была проанализирована популярность различных разделов сайта, и параллельно возник вопрос — какие данные можно извлечь из комментариев к статьям. Также хотелось проверить одну гипотезу, о которой скажу ниже.

Данные получились довольно интересные, также удалось составить небольшой «мини-рейтинг» комментаторов. Продолжение под катом.

Читать дальше →

+56

RalfHacker 15 сен 2019 в 06:23

Решение задания с pwnable.kr 23 — md5 calculator. Разбираемся со Stack Canary. Подключаем библиотеки C в python

4 мин

6.1K

Информационная безопасность * Python * CTF * C *

Туториал

В данной статье решим 23-е задание с сайта pwnable.kr, узнаем, что такое stack canary и подключим libc в python.

Организационная информация

Специально для тех, кто хочет узнавать что-то новое и развиваться в любой из сфер информационной и компьютерной безопасности, я буду писать и рассказывать о следующих категориях:

PWN;
криптография (Crypto);
cетевые технологии (Network);
реверс (Reverse Engineering);
стеганография (Stegano);
поиск и эксплуатация WEB-уязвимостей.

Вдобавок к этому я поделюсь своим опытом в компьютерной криминалистике, анализе малвари и прошивок, атаках на беспроводные сети и локальные вычислительные сети, проведении пентестов и написании эксплоитов.

Читать дальше →

+3

DmitrySpb79 14 сен 2019 в 12:32

Хабрастатистика: исследуем наиболее и наименее посещаемые разделы сайта

12 мин

8.1K

Управление медиа * Статистика в ITСоциальные сетиPython * Habr

Привет, Хабр.

В предыдущей части была проанализирована посещаемость Хабра по основным параметрам — количеству статей, их просмотрам и рейтингам. Однако вопрос популярности разделов сайта остался не рассмотренным. Стало интересно рассмотреть это более подробно, и найти самые популярные и самые непопулярные хабы. Наконец, я рассмотрю «geektimes-эффект» более подробно, и в завершении читатели получат новую подборку лучших статей по новым рейтингам.

Кому интересно что получилось, продолжение под катом.

Читать дальше →

+32

zoldaten 13 сен 2019 в 07:36

Робот-тележка на ROS. Часть 4. Создаем симуляцию робота, используя редакторы rviz и gazebo

14 мин

21K

Python * Raspberry Pi * РобототехникаDIY или Сделай сам

Туториал

Посты серии:
8. Управляем с телефона-ROS Control, GPS-нода
7. Локализация робота: gmapping, AMCL, реперные точки на карте помещения
6. Одометрия с энкодеров колес, карта помещения, лидар
5. Работаем в rviz и gazebo: xacro, новые сенсоры.
4. Создаем симуляцию робота, используя редакторы rviz и gazebo.
3. Ускоряемся, меняем камеру, исправляем походку
2. Софт
1. Железо

Продолжение цикла статей о создании небольшого робота. В этот раз речь пойдет о создании копии робота в симуляции, которую предлагают визуальные ROS-среды rviz и gazebo (далее «редакторы»). Работа в редакторах будет вестись на виртуальной машине, образ которой был ранее предоставлен для скачивания образ. Так как речь идет о симуляции, построении модели, сам робот-тележка не понадобится.

Читать дальше →

+9

denizkudryavtsev 11 сен 2019 в 19:21

Анализ эмоциональной окраски отзывов с Кинопоиска

10 мин

18K

Natural Language Processing * Python * Машинное обучение *

Из песочницы

Вступление

Обработка естественного языка (NLP) является популярной и важной областью машинного обучения. В данном хабре я опишу свой первый проект, связанный с анализом эмоциональной окраски кино отзывов, написанный на Python. Задача сентиментного анализа является довольно распространенной среди тех, кто желает освоить базовые концепции NLP, и может стать аналогом 'Hello world' в этой области.

В этой статье мы пройдем все основные этапы процесса Data Science: от создания собственного датасета, его обработки и извлечения признаков с помощью библиотеки NLTK и наконец обучения и настройки модели с помощью scikit-learn. Сама задача состоит в классификации отзывов на три класса: негативные, нейтральные и позитивные.

Читать дальше →

+7

tytanya 11 сен 2019 в 12:59

Проектирование дашбордов для веб-аналитики e-commerce сайта. Часть 4: Youtube-канал

4 мин

3.2K

Проектирование API * Python * Веб-аналитика * Визуализация данных *

Легко посчитать, сколько трафика пришло с ютуб-канала. К примеру, зайти в счетчик Яндекс Метрики или Google Analytics. А вы попробуйте узнать, что происходило с вашим видео на канале. Кто его посмотрел, кто добавил в фавориты, а кто дислайкнул. Вот для выгрузки таких данных и потребуется скрипт на Python.

Динамика Youtube-активностей

Читать дальше →

+5

tytanya 11 сен 2019 в 12:29

Проектирование дашбордов для веб-аналитики e-commerce сайта. Часть 3: SEO-канал

5 мин

4.6K

Яндекс API * Визуализация данных * Веб-аналитика * Python * Проектирование API *

Туториал

В этой статье соберем дашборд для аналитики SEO-трафика. Данные будем выгружать через скрипты на python и через .csv файлы.

Что будем выгружать?

Для аналитики динамики позиций поисковых фраз потребуется выгрузки из Яндекс.Вебмастера и Google Search Console. Для оценки «полезности» прокачивания позиции поисковой фразы будут полезны данные о частотности. Их можно получить из Яндекс.Директа и Google Ads. Ну а для анализа поведения технической стороны сайта воспользуемся Page Speed Insider.

Динамика SEO-трафика

Читать дальше →

+4

blognetology 11 сен 2019 в 09:24

Что почитать и посмотреть для старта в Data Science: книги, словари и курсы

3 мин

22K

Блог компании НетологияPython * SQL * Статистика в IT

Подборка ресурсов по математике, статистике и программированию для начинающих Дата Сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.

Читать дальше →

+12

MaxRokatansky 11 сен 2019 в 08:55

JWT: Атака на цифровую подпись VS MAC-атака

4 мин

6.6K

Блог компании OTUSPython * Информационная безопасность *

Перевод

Всем привет. Ни для кого не секрет, что ежемесячно OTUS запускает несколько абсолютно новых уникальных курсов, в этом месяце в их число вошел курс «Пентест. Практика тестирования на проникновение». По устоявшейся традиции, в преддверии старта курса, делимся с вами переводом полезного материала по данному направлению.

Во время последнего пентеста я наткнулся на схему авторизации на основе JSON Web Token (или просто JWT). JWT состоит из трех частей: заголовок, полезная нагрузка, информация для верификации. Первая часть заголовка содержит имя алгоритма, который в дальнейшем будет использоваться для верификационной части JWT. Это опасно, так как злоумышленник может изменить эту информацию и таким образом (возможно) проконтролировать, какая схема будет использоваться сервером для проверки.

Читать дальше →

+15

kamish721 11 сен 2019 в 07:25

Сравнение популярных CLI-библиотек для Python: click, cement, fire и другие

13 мин

39K

Из песочницы

Python — отличный язык для консольных приложений, и это подчёркивает большое количество библиотек для этих задач. Но какие вообще библиотеки существуют? А какую лучше взять? В этом материале сравниваются популярные и не очень инструменты для консольного мира и дана попытка ответить на второй вопрос.

Для удобства чтения обзор разделён на два поста: в первом сравнивается шесть самых популярных библиотек, во втором — менее популярные и более специфичные, но всё же заслуживающие внимания.

Читать дальше →

+18

pro100olga 10 сен 2019 в 20:13

Угадай меня, если сможешь: прогнозирование рейтинга фильма до его выхода

5 мин

12K

Открытые данные * Машинное обучение * Python * Data Mining *

Недавно мне на глаза попался датасет на Kaggle с данными о 45 тысячах фильмов с Full MovieLens Dataset. Данные содержали не только информацию об актерах, съемочной команде, сюжете и т.п., но и оценки, выставленные фильмам пользователями ресурса (26 миллионов оценок от 270 тыс.пользователей).

Стандартная задача для таких данных — это рекомендательная система. Но мне в голову почему-то пришло прогнозирование рейтинга фильма на основе информации, доступной до его выхода. Я не знаток кинематографа, и поэтому обычно ориентируюсь на рецензии, выбирая что посмотреть из новинок. Но ведь рецензенты тоже несколько biased — они-то смотрят гораздо больше разных фильмов, чем рядовой зритель. Поэтому спрогнозировать, как оценит фильм обычная публика, показалось занятным.

Читать дальше →

+14

DmitrySpb79 10 сен 2019 в 20:10

Хабрастатистика: как живет Хабр без geektimes

15 мин

18K

HabrPython * Веб-аналитика * Социальные сетиСтатистика в IT

Привет, Хабр.

Данная статья является логическим продолжением рейтинга Лучших статей Хабра за 2018 год. И хотя год еще не закончился, но как известно, летом произошли изменения в правилах, соответственно, стало интересно посмотреть, повлияло ли это на что-нибудь.

Кроме собственно статистики, будет приведен и обновленный рейтинг статей, а также немного исходников для тех кому интересно, как это работает.

Для тех, кому интересно что получилось, продолжение под катом. Те, кому интересен более подробный анализ разделов сайта, могут также посмотреть следующую часть.

Читать дальше →

+83

zoldaten 8 сен 2019 в 10:42

Как обойти капчу, используя распознавание звука

4 мин

13K

Туториал

На просторах интернета до сих пор остаются актуальными капчи, которые в качестве опции предлагают прослушать текст с картинки, нажав на соответствующую кнопку. Если кому-то знакома картинка ниже и/или есть интерес как ее обойти, используя систему оффлайн распознавания звука, предлагается к прочтению.

Читать дальше →

+11

beardnessandy 7 сен 2019 в 15:56

Рост. Вес. Три соседа

9 мин

16K

Python * Математика * Машинное обучение *

В поиске интересного и простого ДатаСета я набрёл этого красавца.

Об этом красавце

В нём есть данные о росте и весе 10 000 мужчин и женщин. Никакого описания. Ничего «лишнего». Только рост, вес и метка пола. Эта таинственная простота мне понравилась.

Что ж, начнём!

Что мне было интересно?

В каком диапазоне вес и рост у большинства мужчин и женщин?
Какие они — «средний» мужчина и «средняя» женщина?
Сможет ли простенькая модель машинного обучения «KNN» по этим данным угадать вес по росту?

Погнали!

logo

Читать дальше →

+3

DollaR84 7 сен 2019 в 15:05

Передача двумерных списков из python в DLL

4 мин

9.6K

Python * C++ * C *

Туториал

Всем привет. Решил несколько дополнить статью C/C++ из Python.

Передача стандартных типов, таких как int, bool, float и так далее довольно проста, но мало необходима. С такими данными быстро справится и сам python, и вряд ли у кого-то возникнет необходимость вынесения части такого кода в библиотеку C/C++.

А вот передача больших массивов данных, или еще лучше двумерных массивов данных, или даже двумерных массивов объектов.

Тут уже все не так очевидно, и есть ряд вещей, которые думаю можно осветить для тех кто хочет существенно ускорить трудные для интерпретатора python участки кода.

Приведенный под катом пример не очень полезный для применения, но думаю достаточный, чтобы осветить все нюансы данной процедуры.

Читать дальше →

+10

DmitrySpb79 7 сен 2019 в 13:41

Python + OpenCV + Keras: делаем распознавалку текста за полчаса

12 мин

259K

Python * Искусственный интеллектМашинное обучение * Обработка изображений * Программирование *

Привет Хабр.

После экспериментов с многим известной базой из 60000 рукописных цифр MNIST возник логичный вопрос, есть ли что-то похожее, но с поддержкой не только цифр, но и букв. Как оказалось, есть, и называется такая база, как можно догадаться, Extended MNIST (EMNIST).

Если кому интересно, как с помощью этой базы можно сделать несложную распознавалку текста, добро пожаловать под кат.

Читать дальше →

+30

asvbkr 6 сен 2019 в 13:32

Разработка ТамТам-бота на Python

10 мин

14K

Блог компании VKPython * Мессенджеры *

Туториал

Привет, Хабр! Позвольте представиться: меня зовут Сергей Агальцов, и я "программист по жизни". Это значит, что я давно уже IT-менеджер, а вовсе не программист по профессии, но программирование использую постоянно, как в своей основной деятельности, так и как хобби. Как часто говорил один из моих бывших начальников — "Серёга! Ты опять скатился в программирование!" Правда, не могу сказать, что этим был сильно не доволен он или кто-то другой когда-либо.

После появления Bot API у мессенджера ТамТам, я как истинный, а значит ленивый программист, создал 2 библиотеки Python для работы с ним:

open API клиента (далее — OAC) — изначально сгенерировал её при помощи OpenAPI Generator на основе схемы API, затем адаптировал с учётом особенностей генератора;
оболочку для этого клиента — TamTamBot (далее — TTB), упрощающую работу с OAC.

Так появился некий ТамТам Python SDK.

Сделал это я в первую очередь "для себя, для души", но также предложил и комьюнити ТамТам при желании им воспользоваться. Но, как известно, ни одно доброе дело не остаётся безнаказанным — народ попросил написать обучающую статью. И вот я здесь с этой статьёй. В ней я расскажу, как разработать простого бота при помощи этих библиотек.

Читать дальше →

+26

Jessy_James 6 сен 2019 в 12:55

C/C++ из Python (ctypes)

6 мин

81K

C * C++ * Python *

Туториал

main

Про то как вызывать Python из C написал в прошлой статье, теперь поговорим как делать наоборот и вызывать C/C++ из Python3. Раз начал писать об этом, то раскроем всю тему до конца. Тем более, что ни чего сложного здесь нет тоже.

Читать дальше →

+20

swetlanaspb 6 сен 2019 в 12:49

Глючный код на Python: 10 самых распространенных ошибок, которые допускают разработчики

11 мин

99K

Перевод

О Python

Python — это интерпретируемый, объектно-ориентированный язык программирования высокого уровня с динамической семантикой. Встроенные структуры данных высокого уровня в сочетании с динамической типизацией и динамическим связыванием делают его очень привлекательным для БРПС (быстрой разработки прикладных средств), а также для использования в качестве скриптового и связующего языка для подключения существующих компонентов или сервисов. Python поддерживает модули и пакеты, тем самым поощряя модульность программы и повторное использование кода.

О данной статье

Простота и легкость в освоении данного языка может ввести разработчиков в заблуждение (особенно тех, кто еще только начинает изучать Python), так что можно упустить из виду некоторые важные тонкости и недооценить силу разнообразия возможных решений с помощью Python.

Имея это в виду, в этой статье представлен «топ-10» тонких, трудных для обнаружения ошибок, которые могут допустить даже продвинутые разработчики Python.

Читать дальше →

+31

xo4y_B_BostonDynamics 5 сен 2019 в 21:35

Перепрограммируем кассу и печатаем на ней Киану Ривза. Часть 2. ПО для ПК

2 мин

3.1K

Python * Программирование микроконтроллеров *

В предыдущей статье я кратко описал свою прошивку для ККТ ШТРИХ-ФР-К, которая позволяет управлять термоголовкой, движками и соответственно выводить на печать все что угодно. В этой части я покажу как написать софт, который будет общаться с кассой и форматировать картинку для печати.

+5

1 2 ...

376

377 378 ...