Статьи / Закладки / Профиль netmaxed / Хабр

Как стать автором

Пользователь

ПрофильСтатьи8ПостыНовостиКомментарии312

Dreadatour 10 дек 2013 в 02:07

Профилирование и отладка Python, отладка

7 мин

112K

Блог компании VKPython*Django*

В предыдущей статье мы закончили разговор о профилировании обзором событийных профайлеров.

Сегодня я предлагаю рассмотреть методы отладки программ.

+46

valbok 9 дек 2013 в 18:41

Поиск кропнутых дубликатов изображений с помощью перцептуальных хешей

6 мин

72K

Обработка изображений*

В этой статье пойдет речь о том, как решалась небольшая задачка поиска дубликатов по фрагменту или кропу картинки.

Читать дальше →

+107

kuznetsovin 9 дек 2013 в 16:20

Введение в анализ текстовой информации с помощью Python и методов машинного обучения

9 мин

66K

Python*Data Mining*

Введение

Сегодня я продолжу рассказ о применении методов анализа данных и машинного обучения на практических примерах. В прошлой статье мы с вами разбирались с задачей кредитного скоринга. Ниже я попытаюсь продемонстрировать решение другой задачи с того же турнира, а именно «Задачи о паспортах» (Задание №2).
При решении будут показаны основы анализа текстовой информации, а также ее кодирование для построения модели с помощью Python и модулей для анализа данных (pandas, scikit-learn, pymorphy).

Читать дальше →

+38

tlando 7 дек 2013 в 16:27

Извлечение объектов и фактов из текстов в Яндексе. Лекция для Малого ШАДа

6 мин

43K

Блог компании ЯндексАлгоритмы*Natural Language Processing*

В докладе рассказывается о том, как мы извлекаем сущности (например, имена людей и географические названия) из текстов и запросов. А также об извлечении фактов, т.е. связей между объектами. Мы рассмотрим несколько подходов к решению этих задач: формулирование правил, составление словарей всевозможных объектов, машинное обучение.

Лекция рассчитана на старшеклассников — студентов Малого ШАДа, но и взрослые смогут с ее помощью восполнить некоторые пробелы.

http://video.yandex.ru/users/e1coyot/view/4/

Конспект лекции

+65

sashaboyko 6 дек 2013 в 16:44

Как и почему я начал ходить на Управленческие поединки в Киеве

5 мин

8.1K

Управление персоналом*Управление проектами*Управление сообществом*

Сначала о Тарасове и его технологиях

О Тарасове и его концепции Искусства управленческой борьбы я впервые прочитал у Архангельского в его монографии «Организация времени», сама концепция борьбы, где «на войне обман морален», меня насторожила (сказался недостаток жизненного опыта — ну подросток, что вы хотите?). Почитал «Книгу для героев» — не понравилось, книга показалась каким-то вычурным гуруизмом автора. Ну и так я себе и жил дальше. Потом как-то наткнулся на хороший отзыв об аудиозаписи семинара «Управления по Макиавелли». Скачал (понимаю что украл – каюсь, надеюсь возместить авторскую плату) – послушал, и пришел в восторг: многие основополагающие вещи, как говорится «по жизни», я для себя открыл заново. Это было сродни какому-то взрослению, вроде как таблетку съел – и стал взрослым:)

Шутка, на самом деле это дало совершенно другой взгляд на мир, точнее дало социально-технологический взгляд на мир. Потому как именно здесь у меня был большой пробел. Это все равно что ты вдруг вынырнул совсем в другом мире, я понял, что не видел значительной, огромной по важности, стороны жизни. Я увидел неадекватность своей картины мира, очень надеюсь, что благодаря этому моя картина мира стала более адекватной. Я начал видеть те “мелочи жизни”, которые имеют невероятное влияние на жизнь (неспроста вначале этой статьи была такая картинка — ведь даже гвоздь, лежащий на дороге регулирует движение автомобилей).

Читать дальше →

-8

klimenkov 6 дек 2013 в 15:38

Решение японских кроссвордов в Wolfram Mathematica

8 мин

25K

Программирование*Алгоритмы*Математика*

Из песочницы

Японский кроссворд — это известная головоломка, ответом которой является рисунок. Что это такое и как это решать, можно почитать на Википедии. Я хочу показать, как можно написать программу, которая будет решать японский кроссворд в системе Wolfram Mathematica путем перебора.

Читать дальше →

+47

Aft3rmath 2 дек 2013 в 22:03

Пишем красивый идиоматический Python

4 мин

113K

Из песочницы

Иногда сложно найти в Сети правильные, а главное актуальные «best practices» для языка. Документация, конечно же, содержит всю необходимую информацию, но отсеять нужную вещь в абзацах подробного (на то она и документация) описания довольно сложно. Но недавно мне улыбнулся поиск Google, и я наткнулся на очень полезные «паттерны» языка Python от одного из core разработчиков — Raymond Hettinger.

Примечание: Все рекомендации даны в нескольких вариантах: сначала идут самые «плохие» варианты, а дальше предлагается лучшая альтернатива. Актуально для версии языка 2.7, отличия для версии 3.3 читайте в примечаниях к конкретному «паттерну».

Читать дальше →

+73

iagsav 2 дек 2013 в 18:28

Microsoft Robotics. Параллельная обработка данных

7 мин

7.1K

Параллельное программирование*.NET*

Из песочницы

Один из продуктов Microsoft — Microsoft Robotics включает библиотеку Concurrent and Coordination Runtime. Библиотека очень нужна роботам для организации параллельных вычислений при обработке звука и изображений (да и не только их). В посте я расскажу как с помощью данной библиотеки создать параллельный алгоритм умножения матрицы A (m × n элементов) на вектор B (1 × n элементов) по следующей формуле:

. Алгоритм вычисления вектора C (m × 1 элементов) легко распараллеливается, так как значение i-го элемента вектора не зависит от значений других его элементов. Перед запуском примера из исходников рекомендуется установить Microsoft Robotics.

Подробности

+8

elcoyot 30 ноя 2013 в 23:32

Архитектура Поиска Яндекса. Лекция для Малого ШАДа

4 мин

29K

Блог компании ЯндексПоисковые технологии*

В этой лекции на примере Яндекса будут рассмотрены базовые компоненты, необходимые для организации интернет-поисковика. Мы поговорим о том, как эти компоненты взаимодействуют и какими особенностями обладают. Вы узнаете также, что такое ранжирование документов и как измеряется качество поиска.

Лекция рассчитана на старшеклассников – студентов Малого ШАДа, но и взрослые могут узнать из нее много нового об устройстве поисковых машин.

Первый компонент нашей поисковой машины – это Паук. Он ходит по интернету и пытается выкачать как можно больше информации. Робот обрабатывает документы таким образом, чтобы по ним было проще искать. По простым html-файлам искать не очень удобно. Они очень большие, там много лишнего. Робот отсекает все лишнее и делает так, чтобы по документам было удобно искать. Ну и непосредственно поиск, который получает запросы и выдает ответы.

Конспект лекции

+56

SeninAndrew 29 ноя 2013 в 22:16

OpenVX: стандарт компьютерного зрения

4 мин

28K

Блог компании IntelОбработка изображений*

Автор: Виктор Ерухимов, исполнительный директор Itseez, председатель рабочей группы OpenVX

The Khronos Group 18 ноября 2013 года представила предварительную спецификацию стандарта OpenVX 1.0 для компьютерного зрения. Поскольку Itseez был одним из инициаторов этой деятельности и активно участвовал в создании спецификации, мы решили рассказать про этот стандарт аудитории Хабрахабра.

Читать дальше →

+49

frontMisc 28 ноя 2013 в 21:19

Нестандартные чекбоксы

4 мин

11K

Блог компании ImageCMSCSS*JavaScript*

Recovery Mode

Задача

Получить возможность стилизовать чекбоксы с полным функционалом стандартных, с возможностью оставить стандартные при выключенном javascript-е, и вооружить различными колбеками и кастомными событиями. Иметь возможность изменять состояние групы чекбоксов.

Посмотреть пример на jsfiddle

Читать дальше →

-8

Tsivarev 28 ноя 2013 в 11:11

JavaFX и Spring. Вместе веселей

8 мин

32K

В данной статье я хочу рассказать о своем опыте интеграции таких вещей как JavaFX и Spring. И заодно использовать базу данных Derby и Maven для сборки приложения.

Введение

JavaFX выглядит довольно удобной и привлекательной технологией для реализации десктопных решений на платформе Java. Начиная с версии Java SE 7 Update 6, JavaFX является частью реализации Oracle Java SE, т.е. никаких дополнительных установок на стороне пользователя не требуется.

Spring со своей стороны, дает удобные фишечки в виде IoC, управление транзакциями и т.д., которые не хочется реализовывать самому.

Читать дальше →

+13

TestTheText 28 ноя 2013 в 14:07

Учимся писать в информационном стиле

2 мин

106K

Блог компании Test The TextВеб-дизайн*

По работе я пишу тексты: посты на хабр, email-рассылку, статьи в СМИ. Пишу уже пару лет, последние полгода не меньше двух текстов в неделю. Значительным шагом в развитии моего навыка письма было открытие для себя информационного стиля и советов Максима Ильяхова.

Цель текста в информационном стиле — донести информацию до читателя. Информационный стиль: лаконичный, однозначный, точный и объективный. В информационных текстах нет лишних слов, эмоций, личного мнения. Они читаются легко и быстро.

Максим вводит понятие стоп-слов. Стоп-слова не характерны для текстов в информационном стиле и если вы встретили его — задумайтесь и перефразируйте это место. Стоп-слова это «кстати», междометия, модальные глаголы, отглагольные существительные и другие, всего около 100.

В какой-то момент мне стало сложно искать эти слова в текстах, поэтому я создал себе в помощь Test The Text. Test The Text выделяет в тексте слова нехарактерные для информационного стиля и объясняет почему.

Читать дальше →

+183

Args 27 ноя 2013 в 14:18

Открытые данные уже здесь

6 мин

9.9K

Открытые данные*

Не так давно я наткнулся на активно развивающуюся в России тему, которая у многих на слуху — Открытые данные.
Поскольку государственные органы агрегируют в себе большой массив полезных и важных данных, очевидна мотивация раскрыть информацию общественности.

Из официальных определений:

Открытые данные – это информация, созданная госорганами в пределах своих полномочий, которая может использоваться в любых законных целях без ограничения.

Погрузившись в поисковики, я нашел несколько площадок и даже конкурсных номинаций, где публикуются перспективные сервисы на основе государственных открытых данных, что мнгновенно натолкнуло меня на желание сделать для вас небольшой обзор наиболее заинтересовавших меня сервисов.

Читать дальше →

+12

ilusha_sergeevich 26 ноя 2013 в 19:58

WOW CSS

2 мин

38K

Доброго времени суток, уважаемые хабравчане. Не так уж давно, для того чтобы сделать что-то «округленное» с нефиксированной высотой приходилось создавать таблицу и крайним ячейкам в бэкграунд задавать нарезанные углы. Вообще любое «непрямоугольное» могло быть только графическим изображением. Сейчас же современные стандарты CSS позволяют создавать весьма интересные вещи. Но все нетипичные фигуры в большинстве своем дозволено сделать благодаря псевдо-селекторам :before и :after. Даже существуют некоторые «паттерны» для этого. А в недалеком будущем появится возможность задавать любые формы для элементов. С приходом CSS Masking я бы сказал наступит веб-дизайнерская сингулярность — веб-дизайн сможет быть любым. Единственное ограничение — это предел фантазии дизайнера. Но не будем о будущем. Все же я предлагаю вдохновиться прекрасным настоящим. В этом посте я собрал несколько крутых CSS реализаций. В некоторых из них спрятаны полезные техники, а в других любовь к CSS творчеству авторов этих подделок.

Не для таких же как и я каскадных зануд хочу добавить, что CSS изобретения могут быть и коммерчески выгодными. Только присутствие в CSSAWARDS, СSSWINNER, CSSREEL или CSSDESIGNAWARDS будет неплохой рекламой.

Таймер на чистом CSS

Читать дальше →

+64

basstrust 25 ноя 2013 в 18:53

Идеальный сайт – ТЗ как основа работы сайта, построенного на базе грамотных программных решений

4 мин

9.3K

Веб-разработка*

Идеальный сайт – ТЗ как основа работы сайта, построенного на базе грамотных программных решений

Представьте себе, что Вы как владелец некой компании заказываете сайт компании у студии разработчика. Ситуация вполне стандартная и развивающаяся по стандартному сценарию.

Читать дальше →

-3

Milfgard 25 ноя 2013 в 09:39

Почему 98% текстов на ваших сайтах не работают. Вообще. И как это починить

7 мин

285K

Блог компании Мосигра

^{Вот так люди видят вашу страницу}

Привет!
Проблема вот в чём. Если зайти на практически любой сайт интернет-магазина или компании с услугами, вы встретите контент. Точнее — отвратительные тексты, которые писали, кажется, маркетологи, воспитанные сеошниками.

Разумеется, можно не делать, как они. Если работать по-умному, то вы поможете и читателям по жизни, и себе в продажах.

По моим примерным подсчётам (усреднение с ряда позиций), конверсии для нас выглядят так:

Только название и картинка — около 1,5%.
С описанием от производителя — чуть более 2%.
С описанием человека, который держал это в руках и знает правила — около 6%.

Ниже — рассказ про то, как мы доводили время на сайте от 3 минут сначала до 6:40, а потом до 20:48. Да-да, двадцати минут сорока восьми секунд для среднего посетителя. Честного среднего, с учётом отказов и по полной выборке.

Читать дальше →

+270

SECL 25 ноя 2013 в 15:47

Продающий дизайн интернет-магазина. Часть 2. Элементы интерфейса

7 мин

74K

Блог компании SECL GroupВеб-дизайн*Интерфейсы*

Туториал

Вторая часть статьи из цикла «Продающий дизайн интернет-магазина». Для тех, кто пропустил первую, её можно прочитать тут: «Продающий дизайн интернет-магазина. Часть 1. Аналитика». Сегодня я расскажу про разные части интерфейсов магазинов, которые важны для конверсии и продаж. Постараюсь обозначить какие элементы должны быть в шапке и футере сайта, на главной странице, на странице каталога и многое другое.

Логотипы крупнейших интернет-магазинов

Логотипы крупнейших интернет-магазинов

Читать дальше →

+24

prokoptsev 25 ноя 2013 в 12:41

Менеджер версий python

5 мин

95K

Туториал

Из песочницы

Иногда полезно держать несколько версий python на одной машине. Допустим для разработки двух проектов нам необходима вторая и третья ветка python. Или вы поддерживаете проект который использует старую версию python.

Обычно для этого мы используем виртуальное окружение virtualenv или же обертку для него virtualenvwrapper. Об этом я рассказывать не буду, так как есть уже много подобных статей, да и в документациях к самим утилитам все очень хорошо объяснено. Достаточно только забить virtualenv или virtualenvwrapper в поисковик.
Но в дополнение к ним я хочу рассказать в этой статье про менеджер версий python. Кому любопытно прошу под кат.

Читать дальше →

+29

SECL 21 ноя 2013 в 15:31

Продающий дизайн интернет-магазина. Часть 1. Аналитика

13 мин

148K

Блог компании SECL GroupВеб-дизайн*Интерфейсы*

Туториал

Сегодня я хочу поговорить про дизайн интернет-магазина и подойти к этому вопросу основательно. В статье не будут затронуты другие аспекты связанные с интернет-магазинами, только дизайн. Эта первая часть статьи, она больше про аналитику и общие моменты, которые прорабатываются еще до интерфейсов, а вторая статья будет больше про сами интерфейсы.

Это первая статья. Всего их будет 3.

Читать дальше →

+33

1 2 ...

27