Комментарии / Профиль flashnik / Хабр

flashnik @flashnik^{read⁠-⁠only}

Head of Data Science

ПрофильСтатьи2ПостыНовостиКомментарии147

Как я участвовал в стартап конкурсе от телеканала «Дождь»

flashnik 14 мая 2011 в 10:00

У остальных участников не было этапов 2 и 3. А была только заявка в виде описания и файла с презентацией. Как бэ возможности для представления информации о проекте немного разные.

Loginza — простота хуже воровства

flashnik 24 мар 2011 в 15:05

При формировании токена учитывать реферер, или этого не хватит?

-3

Совет 23. Рассмотрите возможность замены ассоциативных контейнеров сортированными векторами

flashnik 26 фев 2011 в 19:42

Так для не-POD данных memcpy крайне нехорошо делать, разве нет?!

Совет 23. Рассмотрите возможность замены ассоциативных контейнеров сортированными векторами

flashnik 26 фев 2011 в 16:23

В куче push_heap добавляет за логарифм, сохраняя свойство кучи.

Если сценарий использования таков, что данные сначала добавляются, а только потом осуществляется поиск — то да, тут красно-черные деревья будут излишними.

Совет 23. Рассмотрите возможность замены ассоциативных контейнеров сортированными векторами

flashnik 25 фев 2011 в 22:33

Я бы рассмотрел вариант с добавлением в вектор не через сортировку, а через push_heap (предварительно создав кучу с помощью make_heap).

Совет 23. Рассмотрите возможность замены ассоциативных контейнеров сортированными векторами

flashnik 25 фев 2011 в 22:26

А, да, рандомить тоже стоит не с фиксированным параметром. А то мало ли как там наоптимизируют во время компиляции:)

Совет 23. Рассмотрите возможность замены ассоциативных контейнеров сортированными векторами

flashnik 25 фев 2011 в 22:25

Рассмотрите сценарий, когда операции вставки идут вперемешку с поиском. Т.е. вы заранее не знаете, какая операция будет следующей — вставки или поиска. А может, удаления. Тогда после каждой операции вставки вектор надо приводить в сортированный вид.
Мне кажется, что в таком случае он проиграет.

Алгоритм для выявления сообществ в больших сетях

flashnik 26 янв 2011 в 22:12

Пардон, совсем невнимательно прочитал.
Нода относится только к сообществу ее соседей, поэтому сложность линейна по числу линков.
Так что по сути это просто аггломеративная кластеризация/построение дендрограммы с таким особым функционалом, определяющим сливающиеся кластеры.

Алгоритм для выявления сообществ в больших сетях

flashnik 26 янв 2011 в 22:05

Ну как бэ…
Если посмотреть на работы последних лет, то одно из направлений работ по указанным Вами алгоритмам — это как подобрать/варьировать это число без существенной трудоемкой перестройки найденного при данном значении параметра решения.

Если смотреть на их статью, то «Assume that we start with a weighted network of N nodes. First, we assign a different community to each node of the network. So, in the initial partition there are as many communities as there are nodes.»
N человек-> N нод-> на первом этапе N сообществ => N^2 сложность первой итерации. И все, приплыли…

Алгоритм для выявления сообществ в больших сетях

flashnik 26 янв 2011 в 17:53

Псевдолинейный алгоритм, зависящий от угадываемого параметра-числа сообществ :(

Планирование программных разработок: делюсь опытом

flashnik 18 янв 2011 в 10:53

Канбан?
Есть плагины для разных систем.

Построение суффиксного дерева: алгоритм Укконена

flashnik 12 янв 2011 в 20:25

Эх, спалился :((

Построение суффиксного дерева: алгоритм Укконена

flashnik 12 янв 2011 в 19:39

Такая задача?

Построение суффиксного дерева: алгоритм Укконена

flashnik 12 янв 2011 в 19:29

Может, вы оба даже с одного курса? :)

Построение суффиксного дерева: алгоритм Укконена

flashnik 12 янв 2011 в 19:24

Если Вы строите массив за линейное время (например, алгоритм Фарача), то он лучше — время и память не зависят от размера алфавита. Особенно важно последнее обстоятельство. Но это нетривиальный алгоритм. Тот алгоритм построения массива, который чаще встречается и проще в реализации, строит за O(NlogN), что медленнее, чем построение дерева.

Вообще, массив вроде как и появился для оптимизации потребления памяти.

Построение суффиксного дерева: алгоритм Укконена

flashnik 12 янв 2011 в 18:51

Мне кажется, имеет смысл добавить ссылку на оригинал алгоритма и на конспект Юрия Лифшица.

Также надо учитывать, что решение зависит линейно от размера a алфавита (O(na) ). В отличие от, например, суффиксного массива.

Яндекс проиндексировал ВКонтакте

flashnik 2 дек 2010 в 13:54

Понятно, большое спасибо!

Яндекс проиндексировал ВКонтакте

flashnik 2 дек 2010 в 11:54

Является ли поток изменений от Контакта публичным? Или это эксклюзивная договоренность?

Быстрый поиск совпадений объектов по их контрольным суммам на примере поиска дублирующихся изображений

flashnik 7 сен 2010 в 20:19

Ээээ… это переизобретение суффиксного дерева?

Gcc vs Intel C++ Compiler: собираем FineReader Engine for Linux

flashnik 3 сен 2010 в 10:29

У ICC тоже есть возможность использовать оптимизацию вычислений с плавающей точкой: strict (без оптимизации), safe (оптимизация, не влияющая на результат), fast (с потерей точности). Причем именно последняя опция стоит по дефолту при включении оптимизации.

1 2

4 5 6 7 8

Информация

Специализация