Articles / Bookmarks / Profile of ciiccii / Habr

ciiccii @ciiccii

User

ProfileArticles1PostsNewsComments129

nikolaynag Oct 25 2013 at 08:21

Пишем numpy-модуль для ускорения математических функций с помощью SIMD-инструкций

11 min

9.9K

High performance*Python*Programming*

Tutorial

From sandbox

Пакеты numpy и scipy предоставляют прекрасные возможности для быстрого решения различных вычислительных задач. Концепция универсальных функций (ufunc), работающих как со скалярными значениями, так и с массивами различных размерностей, позволяет получить высокую производительность при сохранении присущей языку Python простоты и элегантности. Универсальная функция обычно используются для выполнения одной операции над большим массивом данных, что идеально подходит для оптимизации с помощью SIMD-инструкций, однако мне не удалось найти готового решения, основанного на свободном программном обеспечении и позволяющего использовать SIMD для вычисления в numpy таких математических функций, как синус, косинус и экспонента. Реализовывать алгоритмы вычисления этих функций с нуля совсем не хотелось, но к счастью в интернете нашлось несколько свободных библиотек на языке «С». Преодолев ~~лень~~ сомнения, я решил написать собственный numpy-модуль, предлагающий универсальные функции для синуса, косинуса и экспоненты. За подробностями и результатами тестов добро пожаловать под кат.

Пишем свой numpy-модуль!

+34

rmq Oct 23 2013 at 12:19

Алгоритм Ахо-Корасик

8 min

106K

Programming*C++*Algorithms*

From sandbox

Вступление

В посте я постарался избежать сложных дефиниций и строгих матетематических доказательств, а некоторые вещи вообще понятны интуитивно. Алгоритм удобно разбивается на взаимосвязные части, поэтому и уловить принцип его работы не должно составлять труда.

Начальное описание

Алгоритм Ахо-Корасик реализует эффективный поиск всех вхождений всех строк-образцов в заданную строку. Был разработан в 1975 году Альфредом Ахо и Маргарет Корасик.
Опишем формально условие задачи. На вход поступают несколько строк pattern[i] и строка s. Наша задача — найти все возможные вхождения строк pattern[i] в s.

Суть алгоритма заключена в использование структуры данных — бора и построения по нему конечного детерминированного автомата. Важно помнить, что задача поиска подстроки в строки тривиально реализуется за квадратичное время, поэтому для эффективной работы важно, чтоб все части Ахо-Корасика ассимптотически не превосходили линию относительно длинны строк. Мы вернемся к оценке сложности в конце, а пока поближе посмотрим на составляющие алгоритма.

Вступление

Начальное описание

Добро пожаловать!

Предыстория

Что нужно знать

О чем эта часть?

Логарифмы

1. Введение

7. Связь один-ко-многим.

4. ТАБЛИЦЫ И ПЕРВИЧНЫЕ КЛЮЧИ

Руководство по проектированию баз данных.

1. Вступление.