Как стать автором
Обновить
82
0

Пользователь

Отправить сообщение

Профилирование и отладка Python, отладка

Время на прочтение7 мин
Количество просмотров112K
В предыдущей статье мы закончили разговор о профилировании обзором событийных профайлеров.

Сегодня я предлагаю рассмотреть методы отладки программ.

Начнём!

Поиск кропнутых дубликатов изображений с помощью перцептуальных хешей

Время на прочтение6 мин
Количество просмотров72K
В этой статье пойдет речь о том, как решалась небольшая задачка поиска дубликатов по фрагменту или кропу картинки.



Читать дальше →

Введение в анализ текстовой информации с помощью Python и методов машинного обучения

Время на прочтение9 мин
Количество просмотров66K

Введение


Сегодня я продолжу рассказ о применении методов анализа данных и машинного обучения на практических примерах. В прошлой статье мы с вами разбирались с задачей кредитного скоринга. Ниже я попытаюсь продемонстрировать решение другой задачи с того же турнира, а именно «Задачи о паспортах» (Задание №2).
При решении будут показаны основы анализа текстовой информации, а также ее кодирование для построения модели с помощью Python и модулей для анализа данных (pandas, scikit-learn, pymorphy).
Читать дальше →

Извлечение объектов и фактов из текстов в Яндексе. Лекция для Малого ШАДа

Время на прочтение6 мин
Количество просмотров43K
В докладе рассказывается о том, как мы извлекаем сущности (например, имена людей и географические названия) из текстов и запросов. А также об извлечении фактов, т.е. связей между объектами. Мы рассмотрим несколько подходов к решению этих задач: формулирование правил, составление словарей всевозможных объектов, машинное обучение.

Лекция рассчитана на старшеклассников — студентов Малого ШАДа, но и взрослые смогут с ее помощью восполнить некоторые пробелы.

http://video.yandex.ru/users/e1coyot/view/4/
Конспект лекции

Как и почему я начал ходить на Управленческие поединки в Киеве

Время на прочтение5 мин
Количество просмотров8K


Сначала о Тарасове и его технологиях



О Тарасове и его концепции Искусства управленческой борьбы я впервые прочитал у Архангельского в его монографии «Организация времени», сама концепция борьбы, где «на войне обман морален», меня насторожила (сказался недостаток жизненного опыта — ну подросток, что вы хотите?). Почитал «Книгу для героев» — не понравилось, книга показалась каким-то вычурным гуруизмом автора. Ну и так я себе и жил дальше. Потом как-то наткнулся на хороший отзыв об аудиозаписи семинара «Управления по Макиавелли». Скачал (понимаю что украл – каюсь, надеюсь возместить авторскую плату) – послушал, и пришел в восторг: многие основополагающие вещи, как говорится «по жизни», я для себя открыл заново. Это было сродни какому-то взрослению, вроде как таблетку съел – и стал взрослым:)

Шутка, на самом деле это дало совершенно другой взгляд на мир, точнее дало социально-технологический взгляд на мир. Потому как именно здесь у меня был большой пробел. Это все равно что ты вдруг вынырнул совсем в другом мире, я понял, что не видел значительной, огромной по важности, стороны жизни. Я увидел неадекватность своей картины мира, очень надеюсь, что благодаря этому моя картина мира стала более адекватной. Я начал видеть те “мелочи жизни”, которые имеют невероятное влияние на жизнь (неспроста вначале этой статьи была такая картинка — ведь даже гвоздь, лежащий на дороге регулирует движение автомобилей).
Читать дальше →

Решение японских кроссвордов в Wolfram Mathematica

Время на прочтение8 мин
Количество просмотров25K


Японский кроссворд — это известная головоломка, ответом которой является рисунок. Что это такое и как это решать, можно почитать на Википедии. Я хочу показать, как можно написать программу, которая будет решать японский кроссворд в системе Wolfram Mathematica путем перебора.
Читать дальше →

Пишем красивый идиоматический Python

Время на прочтение4 мин
Количество просмотров113K

Иногда сложно найти в Сети правильные, а главное актуальные «best practices» для языка. Документация, конечно же, содержит всю необходимую информацию, но отсеять нужную вещь в абзацах подробного (на то она и документация) описания довольно сложно. Но недавно мне улыбнулся поиск Google, и я наткнулся на очень полезные «паттерны» языка Python от одного из core разработчиков — Raymond Hettinger.

Примечание: Все рекомендации даны в нескольких вариантах: сначала идут самые «плохие» варианты, а дальше предлагается лучшая альтернатива. Актуально для версии языка 2.7, отличия для версии 3.3 читайте в примечаниях к конкретному «паттерну».
Читать дальше →

Microsoft Robotics. Параллельная обработка данных

Время на прочтение7 мин
Количество просмотров7.1K
Один из продуктов Microsoft — Microsoft Robotics включает библиотеку Concurrent and Coordination Runtime. Библиотека очень нужна роботам для организации параллельных вычислений при обработке звука и изображений (да и не только их). В посте я расскажу как с помощью данной библиотеки создать параллельный алгоритм умножения матрицы A (m × n элементов) на вектор B (1 × n элементов) по следующей формуле: . Алгоритм вычисления вектора C (m × 1 элементов) легко распараллеливается, так как значение i-го элемента вектора не зависит от значений других его элементов. Перед запуском примера из исходников рекомендуется установить Microsoft Robotics.
Подробности

Архитектура Поиска Яндекса. Лекция для Малого ШАДа

Время на прочтение4 мин
Количество просмотров29K
В этой лекции на примере Яндекса будут рассмотрены базовые компоненты, необходимые для организации интернет-поисковика. Мы поговорим о том, как эти компоненты взаимодействуют и какими особенностями обладают. Вы узнаете также, что такое ранжирование документов и как измеряется качество поиска.

Лекция рассчитана на старшеклассников – студентов Малого ШАДа, но и взрослые могут узнать из нее много нового об устройстве поисковых машин.





Первый компонент нашей поисковой машины – это Паук. Он ходит по интернету и пытается выкачать как можно больше информации. Робот обрабатывает документы таким образом, чтобы по ним было проще искать. По простым html-файлам искать не очень удобно. Они очень большие, там много лишнего. Робот отсекает все лишнее и делает так, чтобы по документам было удобно искать. Ну и непосредственно поиск, который получает запросы и выдает ответы.
Конспект лекции

OpenVX: стандарт компьютерного зрения

Время на прочтение4 мин
Количество просмотров28K
Автор: Виктор Ерухимов, исполнительный директор Itseez, председатель рабочей группы OpenVX

The Khronos Group 18 ноября 2013 года представила предварительную спецификацию стандарта OpenVX 1.0 для компьютерного зрения. Поскольку Itseez был одним из инициаторов этой деятельности и активно участвовал в создании спецификации, мы решили рассказать про этот стандарт аудитории Хабрахабра.

Читать дальше →

Нестандартные чекбоксы

Время на прочтение4 мин
Количество просмотров11K

Задача


Получить возможность стилизовать чекбоксы с полным функционалом стандартных, с возможностью оставить стандартные при выключенном javascript-е, и вооружить различными колбеками и кастомными событиями. Иметь возможность изменять состояние групы чекбоксов.



Посмотреть пример на jsfiddle
Читать дальше →

JavaFX и Spring. Вместе веселей

Время на прочтение8 мин
Количество просмотров32K


В данной статье я хочу рассказать о своем опыте интеграции таких вещей как JavaFX и Spring. И заодно использовать базу данных Derby и Maven для сборки приложения.

Введение


JavaFX выглядит довольно удобной и привлекательной технологией для реализации десктопных решений на платформе Java. Начиная с версии Java SE 7 Update 6, JavaFX является частью реализации Oracle Java SE, т.е. никаких дополнительных установок на стороне пользователя не требуется.

Spring со своей стороны, дает удобные фишечки в виде IoC, управление транзакциями и т.д., которые не хочется реализовывать самому.

Читать дальше →

Учимся писать в информационном стиле

Время на прочтение2 мин
Количество просмотров106K
По работе я пишу тексты: посты на хабр, email-рассылку, статьи в СМИ. Пишу уже пару лет, последние полгода не меньше двух текстов в неделю. Значительным шагом в развитии моего навыка письма было открытие для себя информационного стиля и советов Максима Ильяхова.

Цель текста в информационном стиле — донести информацию до читателя. Информационный стиль: лаконичный, однозначный, точный и объективный. В информационных текстах нет лишних слов, эмоций, личного мнения. Они читаются легко и быстро.

Максим вводит понятие стоп-слов. Стоп-слова не характерны для текстов в информационном стиле и если вы встретили его — задумайтесь и перефразируйте это место. Стоп-слова это «кстати», междометия, модальные глаголы, отглагольные существительные и другие, всего около 100.

В какой-то момент мне стало сложно искать эти слова в текстах, поэтому я создал себе в помощь Test The Text. Test The Text выделяет в тексте слова нехарактерные для информационного стиля и объясняет почему.


Читать дальше →

Открытые данные уже здесь

Время на прочтение6 мин
Количество просмотров9.9K
Не так давно я наткнулся на активно развивающуюся в России тему, которая у многих на слуху — Открытые данные.
Поскольку государственные органы агрегируют в себе большой массив полезных и важных данных, очевидна мотивация раскрыть информацию общественности.

Из официальных определений:
Открытые данные – это информация, созданная госорганами в пределах своих полномочий, которая может использоваться в любых законных целях без ограничения.


Погрузившись в поисковики, я нашел несколько площадок и даже конкурсных номинаций, где публикуются перспективные сервисы на основе государственных открытых данных, что мнгновенно натолкнуло меня на желание сделать для вас небольшой обзор наиболее заинтересовавших меня сервисов.

Читать дальше →

WOW CSS

Время на прочтение2 мин
Количество просмотров38K
Доброго времени суток, уважаемые хабравчане. Не так уж давно, для того чтобы сделать что-то «округленное» с нефиксированной высотой приходилось создавать таблицу и крайним ячейкам в бэкграунд задавать нарезанные углы. Вообще любое «непрямоугольное» могло быть только графическим изображением. Сейчас же современные стандарты CSS позволяют создавать весьма интересные вещи. Но все нетипичные фигуры в большинстве своем дозволено сделать благодаря псевдо-селекторам :before и :after. Даже существуют некоторые «паттерны» для этого. А в недалеком будущем появится возможность задавать любые формы для элементов. С приходом CSS Masking я бы сказал наступит веб-дизайнерская сингулярность — веб-дизайн сможет быть любым. Единственное ограничение — это предел фантазии дизайнера. Но не будем о будущем. Все же я предлагаю вдохновиться прекрасным настоящим. В этом посте я собрал несколько крутых CSS реализаций. В некоторых из них спрятаны полезные техники, а в других любовь к CSS творчеству авторов этих подделок.

Не для таких же как и я каскадных зануд хочу добавить, что CSS изобретения могут быть и коммерчески выгодными. Только присутствие в CSSAWARDS, СSSWINNER, CSSREEL или CSSDESIGNAWARDS будет неплохой рекламой.

Таймер на чистом CSS




Читать дальше →

Идеальный сайт – ТЗ как основа работы сайта, построенного на базе грамотных программных решений

Время на прочтение4 мин
Количество просмотров9.3K

Идеальный сайт – ТЗ как основа работы сайта, построенного на базе грамотных программных решений



Представьте себе, что Вы как владелец некой компании заказываете сайт компании у студии разработчика. Ситуация вполне стандартная и развивающаяся по стандартному сценарию.
Читать дальше →

Почему 98% текстов на ваших сайтах не работают. Вообще. И как это починить

Время на прочтение7 мин
Количество просмотров285K

Вот так люди видят вашу страницу

Привет!
Проблема вот в чём. Если зайти на практически любой сайт интернет-магазина или компании с услугами, вы встретите контент. Точнее — отвратительные тексты, которые писали, кажется, маркетологи, воспитанные сеошниками.

Разумеется, можно не делать, как они. Если работать по-умному, то вы поможете и читателям по жизни, и себе в продажах.

По моим примерным подсчётам (усреднение с ряда позиций), конверсии для нас выглядят так:
  • Только название и картинка — около 1,5%.
  • С описанием от производителя — чуть более 2%.
  • С описанием человека, который держал это в руках и знает правила — около 6%.

Ниже — рассказ про то, как мы доводили время на сайте от 3 минут сначала до 6:40, а потом до 20:48. Да-да, двадцати минут сорока восьми секунд для среднего посетителя. Честного среднего, с учётом отказов и по полной выборке.
Читать дальше →

Продающий дизайн интернет-магазина. Часть 2. Элементы интерфейса

Время на прочтение7 мин
Количество просмотров74K
Вторая часть статьи из цикла «Продающий дизайн интернет-магазина». Для тех, кто пропустил первую, её можно прочитать тут: «Продающий дизайн интернет-магазина. Часть 1. Аналитика». Сегодня я расскажу про разные части интерфейсов магазинов, которые важны для конверсии и продаж. Постараюсь обозначить какие элементы должны быть в шапке и футере сайта, на главной странице, на странице каталога и многое другое.

Логотипы крупнейших интернет-магазинов
Читать дальше →

Менеджер версий python

Время на прочтение5 мин
Количество просмотров95K
Иногда полезно держать несколько версий python на одной машине. Допустим для разработки двух проектов нам необходима вторая и третья ветка python. Или вы поддерживаете проект который использует старую версию python.

Обычно для этого мы используем виртуальное окружение virtualenv или же обертку для него virtualenvwrapper. Об этом я рассказывать не буду, так как есть уже много подобных статей, да и в документациях к самим утилитам все очень хорошо объяснено. Достаточно только забить virtualenv или virtualenvwrapper в поисковик.
Но в дополнение к ним я хочу рассказать в этой статье про менеджер версий python. Кому любопытно прошу под кат.
Читать дальше →

Продающий дизайн интернет-магазина. Часть 1. Аналитика

Время на прочтение13 мин
Количество просмотров147K
Сегодня я хочу поговорить про дизайн интернет-магазина и подойти к этому вопросу основательно. В статье не будут затронуты другие аспекты связанные с интернет-магазинами, только дизайн. Эта первая часть статьи, она больше про аналитику и общие моменты, которые прорабатываются еще до интерфейсов, а вторая статья будет больше про сами интерфейсы.

Это первая статья. Всего их будет 3.

image

Читать дальше →

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность