Статьи / Закладки / Профиль semenoffalex / Хабр

Перевод

Содержание

Списки. Свёртка списка (reduce). Прохождение по списку (range, xrange и enumerate). Проверка всех элементов списка на выполнение условия (all и any). Группировка элементов нескольких списков (zip). Еще несколько операторов для работы со списками. Продвинутые логические операции с типом set.
Словари. Создание словаря с помощью именованных аргументов. Преобразование словаря в список и обратно. «Dictionary Comprehensions».

qrazydraqon 14 ноя 2011 в 15:41

+63

Как работает yield

6 мин

694K

Подробный и обстоятельный ответ

Перевод

На StackOverflow часто задают вопросы, подробно освещённые в документации. Ценность их в том, что на некоторые из них кто-нибудь даёт ответ, обладающий гораздо большей степенью ясности и наглядности, чем может себе позволить документация. Этот — один из них.

Вот исходный вопрос:

Как используется ключевое слово yield в Python? Что оно делает?

Например, я пытаюсь понять этот код (**):
def _get_child_candidates(self, distance, min_dist, max_dist):
    if self._leftchild and distance - max_dist < self._median:
        yield self._leftchild
    if self._rightchild and distance + max_dist >= self._median:
        yield self._rightchild
Вызывается он так:
result, candidates = list(), [self]
while candidates:
    node = candidates.pop()
    distance = node._get_dist(obj)
    if distance <= max_dist and distance >= min_dist:
        result.extend(node._values)
        candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))
        return result
Что происходит при вызове метода _get_child_candidates? Возвращается список, какой-то элемент? Вызывается ли он снова? Когда последующие вызовы прекращаются?

** Код принадлежит Jochen Schulz (jrschulz), который написал отличную Python-библиотеку для метрических пространств. Вот ссылка на исходники: http://well-adjusted.de/~jrschulz/mspace/

+131

zvezdnii 19 янв 2011 в 13:25

Точка, точка, запятая: машинное обучение

7 мин

17K

Блог компании VK

Как научить поисковую машину правильно разбивать текст на предложения? Сделать так, чтобы она могла распознавать точки, которые не являются концами предложений.

Наша статья о машинном обучении объясняет одну из техник, которые применяются в поисковой машине тогда, когда возникает нужда в корректном разбиения текста на предложения. Решение такой задачи имеет принципиальное значение, например, при генерации сниппетов поисковыми системами или при построении базы контекстов словоупотребления. Сейчас эта технология встраивается в индексатор Поиска@Mail.Ru. Точность метода, по нашим наблюдениям — не менее 99%.
О том, как это работает, читайте в нашей статье.

Paul_Smith 1 мая 2012 в 17:52

+26

Нейросети для чайников. Начало

5 мин

803K

Алгоритмы*Программирование*

Так получилось, что в университете тема нейросетей успешно прошла мимо моей специальности, несмотря на огромный интерес с моей стороны. Попытки самообразования несколько раз разбивались невежественным челом о несокрушимые стены цитадели науки в облике непонятных «с наскока» терминов и путанных объяснений сухим языком вузовских учебников.

В данной статье (цикле статей?) я попытаюсь осветить тему нейросетей с точки зрения человека непосвященного, простым языком, на простых примерах, раскладывая все по полочкам, а не «массив нейронов образует перцептрон, работающий по известной, зарекомендовавшей себя схеме».

Заинтересовавшихся прошу под кат.

alizar 3 июн 2011 в 19:06

+194

Визуальная демонстрация алгоритмов машинного обучения

1 мин

14K

Алгоритмы*

Кандидат наук из Федеральной политехнической школы Лозанны Басилио Норис создал замечательную программу, которая великолепно подходит для демонстрации некоторых задач, которые решают алгоритмы машинного обучения (классификация, кластеризация, регрессия — различными методами). В одной программе собраны библиотеки, алгоритмы и фрагменты кода, которые удалось найти. В отличие от Matlab, здесь GUI работает быстро в интерактивном режиме, поэтому получается очень красиво.

Дистрибутив:
MLDemos 0.3.2 for Windows (минимальные требования: XP SP3)
MLDemos 0.3.2 for Mac (минимальные требования: Snow Leopard)
MLDemos 0.1.3 for Linux 32bit (deb) (билд для: Ubuntu 10.04)

+64

anvaka 29 мая 2012 в 09:20

Визуализация «В Контакте»: Скажи мне, кто твой друг?

2 мин

145K

JavaScript*Веб-разработка*

Привет, Хабралюди!

У меня есть хобби. Я ночами (в нерабочее время) пишу библиотеку укладки графов: vivagraph.js. Хотел поделиться с вами, узнать что думаете. Визуализировал я сеть друзей своих на «В Контакте» с использованием WebGL. Но лучше один раз увидеть, чем читать, верно?

Это мои друзья. Каждая точка — человек, целый мир, с которым так или иначе мне повезло встретиться. Линия между точками обозначает дружбу. По этой сети можно, правда, сказать многое о человеке.

Как построить свою сеть?

+290

256

KeepYourMind 29 мар 2009 в 15:58

Валидация email

3 мин

156K

В этой статье рассмотривается валидация email изпользуя регулярные выражения. Все регэкспы выполняются с модификатором i, т.е. делают регистронезависимую проверку.

+28

122

ZIJ 12 авг 2009 в 22:22

8 полезных регэкспов с наглядным разбором

2 мин

273K

О мощи и гибкости регулярных выражений написано много, и их использование давно уже является стандартом для различного рода операций над текстом. Пожалуй, чаще всего регэкспы работают при валидации вводимых данных — здесь им практически нет альтернативы, если не считать громоздкий циклический разбор с кучей неочевидных проверок. Начнём с самого простого:

1. Часть ЧПУ (человекопонятный URL)

По сути, слово с дефисами.

Паттерн: /^[a-z0-9-]+$/
short_url

Примеры посерьёзнее

+88

119

Wott 21 окт 2009 в 19:23

Квантификаторы в регулярных выражениях

8 мин

76K

Туториал

Регулярные выражения — это арифметика для алгоритмов. Они доступны во многих языках программирования, редакторах и настройках приложений. Как и сложение с умножением они просты в использовании.
Но для правильного и эффективного использования regexp-ов нужно понимание того, как они работают. Я постараюсь описать принцип работы регулярных выражений, покажу в каких случаях бывают проблемы и как их решать.

В продолжение общих советов.

umnik 26 дек 2010 в 13:50

+105

Номер телефона

1 мин

284K

Регулярное выражение для валидации номера телефона:

^((8|\+7)[\- ]?)?($?\d{3}$?[\- ]?)?[\d\- ]{7,10}$

Ориентировано на российские мобильные + городские с кодом из 3 цифр (например, Москва).

karaboz 7 янв 2012 в 04:15

+52

121

Социальные интернет-сервисы как инструменты созидания социальных сред

11 мин

2.6K

Блог компании ДарударУправление сообществом*

В октябре 2011 года наш интернет-сервис безвозмездного дарения Дару-дар пригласили поучаствовать в VIII международном научно-практическом междисциплинарном симпозиуме Рефлексивные процессы и управление, проводимом под эгидой Института Философии РАН.

Ключевым словом, по которому мы нашли пересечение с сугубо философской проблематикой, было слово «среда», а если быть более точным, то понятие «социальная среда». Мы давно ввели это слово в повседневный язык нашей группы разработчиков, чтобы лучше понимать, чем мы занимаемся, чтобы уточнить методологию и приоритеты нашей разработки, а также и для того, чтобы обозначить место разрабатываемого нами сервиса в сложном пространстве современных интернет-стартапов.

Подготовка к философской конференции спровоцировала нас, наконец, оформить свои мысли в текст, который теперь хочется предоставить вниманию IT-сообществу. Как нам представляется, сформулированные нами концепты могут быть полезны всем тем, кто занимается разработкой социальных интернет-сервисов или кто мыслит себя как социальный предприниматель. В данном тексте с помощью понятия «социальная среда» на примере интернет-сервиса дарения делается попытка выделить определенный вид социальных интернет-сервисов и посмотреть на них в широком контексте человеческого общества как такового, его устройства и возможностей преобразования.

alizar 31 мар 2012 в 21:59

10 миллионов хитов в день с WordPress на сервере за $15

1 мин

17K

Amazon Web Services*WordPress*Высокая производительность*

Английский разработчик Эван Лейт (Ewan Leith) опубликовал пошаговую инструкцию, как поднять виртуальный микросервер на Amazon, Linode или другом облачном хостинге, который сможет крутить блог WordPress и выдерживать 10 миллионов хитов в сутки (отчёт составлен с помощью Blitz.io), при этом будет стоить всего пятнадцать долларов в месяц.

Инструкция описывает, как последовательно установить Ubuntu 11.10 (Oneiric), MySQL, PHP с PHP FPM, APC и модулем MySQL, Nginx с конфигурацией для WordPress, ну и сам WordPress. После этого сервер работает ещё довольно медленно, но всё меняет установка W3 Total Cache и Varnish, которые вместе с Nginx способны сотворить настоящее чудо.

Выполнить действия из инструкции способен даже человек, не являющийся техническим специалистом.

skim1776 12 июн 2011 в 00:10

+63

Этикет хабрапользователя

1 мин

850

Habr

Чтобы окончательно закрыть тему кармы-шмармы и всего остального, предлагаю придумать что-нибудь вроде этикета хабрапользователя.

sirQaziop 19 сен 2011 в 15:24

+163

401

Преимущество книги перед блогом или улучшаем свой блог

4 мин

1.6K

Usability*

Из песочницы

Раньше, чтобы узнать ответ на интересующий нас вопрос, мы шли в библиотеку или книжный магазин, находили нужную нам книжную полку, перечитывали множество оглавлений и только после этого, выбрав две-три книги, отдавая чуть ли не последние деньги, шли домой, чтобы внимательно прочитать каждую от корки до корки. Сейчас достаточно иметь интернет, поисковик – и вот мы уже читаем статьи чего-нибудь блога. Казалось бы, всё стало гораздо проще. Но книга – эта целая гора материала, посвященного конкретной теме, и прочитав книгу, мы не только узнали ответ на вопрос, но и стали гораздо лучше разбираться во всей этой теме. Читая же статью блога, мы просто узнаем ответ на вопрос.

EgorKotkin 28 мар 2012 в 12:59

+24

Как избавиться от SMS-спама

4 мин

303K

Информационная безопасность*

Слово спам традиционно ассоциируется с email-спамом, и как с ним бороться — более-менее понятно: можно отправлять в «Спам», можно настраивать фильтры, можно жаловаться хостеру спамера. Однако спам — это ещё и лишняя макулатура в ваших почтовых ящиках, и нежелательные SMS в вашем телефоне. И вот что делать с последними — не всегда понятно, хотя раздражают они гораздо больше, ведь, в отличие от email-рассылок, в SMS нет кнопки «отписаться». Вот как бороться с SMS-спамом я и расскажу в этой статье.

itforge 5 мар 2012 в 14:27

+47

Документация по Grab — библиотеке для парсинга сайтов

2 мин

34K

Я ранее уже рассказывал на хабре о Grab — библиотеке для парсинга сайтов и о Spider — асинхронном модуле для парсинга. Рад сообщить, что я наконец-то дописал документацию по Grab. Я решил писать всё на русском языке т.к. на английском языке мне труднее выражать мысли. На деле писанины получилось гораздо больше, чем представлялось в начале, но я таки описал практически все функции библиотеки. Я решил просто вставить сюда, оглавление, кликайте на интересный раздел и читайте о возможностях Grab:

itforge 2 сен 2011 в 14:37

+67

Grab — python библиотека для парсинга сайтов

13 мин

149K

Лет пять-шесть назад, когда я ещё программировал преимущественно на PHP, я начал использовать библиотеку curl для парсинга сайтов. Мне нужен был инструмент, который позволял эмулировать сессию пользователя на сайте, отсылать заголовки обычного браузера, давать удобный способ отсылки POST-запросов. Сначала я пытался использовать напрямую curl-расширение, но его интерфейс оказался очень неудобным и я написал обёртку с более простым интерфейсом. Время шло, я пересел на python и столкнулся с таким же дубовым API curl-расширения. Пришлось переписать обёртку на python.

alizar 19 фев 2012 в 21:45

+78

Онлайн-репетитор по Python

1 мин

24K

mc_dir 16 фев 2012 в 13:11

Туториал

Для курса по программированию MIT разработан интерактивный инструмент Online Python Tutor, он в графическом виде показывает изменение стека и кучи на каждом шаге выполнения кода. Таким образом, онлайновый «наставник» как бы наглядно объясняет студенту работу программы.

В окно редактора можно скопировать любой код или посмотреть несколько уже готовых простеньких примеров (факториал, квадратный корень, последовательность Фибоначчи и т.д.). Навигация осуществляется стрелками на клавиатуре. Студенты, изучающие Python, могут увидеть и лучше понять работу кода.

+76

Наиболее часто встречающаяся структура предложений в русском языке по версии библиотеки Флибуста

6 мин

4.1K

Программирование*

Из песочницы

Я программист php, но захотел расширить горизонты, узнать что ни будь новое. Поэтому решил поучить другие языки и технологии. Выбор пал пока на perl, python и mysql.

Был взят замечательный пакет pymorphy , библиотека Флибуста (только .fb2), sedna для хранения fb2, mysql percona 5.1 для хранения статистики и маленький напильник. Была создана примитивная myisam табличка куда записывалась сколько встречалось предложение, и описание частей речи этого предложения.