Комментарии / Профиль shodan / Хабр

Andrew Aksyonoff @shodan

Пользователь

ПрофильСтатьи30ПостыНовостиКомментарии431

shodan 27 июн 2011 в 19:58

Таки нет сил более молчать ;)

Ребята, там ведь в тексте прямо сразу (сразу) после того предложения про циферки русским по белому все (все) написано.

Вы не поверите, наверное, но я того — типа знаю, что такое mangling, зачем в целом нужен, что такое c++filt, чем __stdcall отличается от __fastcall, и еще массу странных вещей.

Конкретных правил декорирования наизусть, разумеется, не помню — тк. требуется единицы раз и не каждый год.

Смысл, однако, в том, что (снова) заметив несложную зависимость — даже не нужно тратить вреия, гуглить и подновлять в голове эти правила, насущная мини-подзадача мгновенно решается и так, причем — быстрее.

Кроме того, заметка написана — не для меня, и даже не для тех, кому слово mangling последние 20 лет родное, ошибки компиляции boost-а читаемы, а всю заметку можно сжать к трем строкам «skype4com дрочил lcmapstringex как одуревший; хукнулся detours-ом; сделал fastpath; начало 3.6x летать; detours сила; skype4com FUUU» совершенно без потерь.

Но, наверное, революционные выводы о степени незнаний автора делать интереснее ;)

Обходим чужие тормоза

shodan 27 июн 2011 в 13:36

Теоретически можно, если поставить Call Stack Sampling. Практически, в данном случае оно тоже подбрехивает. LCMapStringW в профайле низко; LCMapStringEx высоко. Но по факту LCMapStringEx адскую кучу раз вызывается именно из LCMapStringW и именно W я перехватываю.

Обходим чужие тормоза

shodan 26 июн 2011 в 12:31

5 часов это прикидки (!), причем по числу уже экспортированных чатов, а не мессаг. А там очень неравномерное распределение. Конечная цифра могла быть сильно другая, но я не дождался. 3.6 раза в свою очередь это ускорение на небольшом подмножестве работы, менее 1.5% чатов и менее 0.5% мессаг.

Те. если дождаться конца работы исходной версии на полных данных, коэффициент скорее всего будет другой.

Инкрементально делать сложнее, интерфейс не способствует. Плюс сама идея городить инкрементальные бэкапы для 30 мб текста из 200 мб базы меня коробит, на таких объемах полный экспорт обязан длиться разумное время.

Обходим чужие тормоза

shodan 26 июн 2011 в 11:40

> Зачем ради всяких недогосударств, которые не могут перейти на нормальную письменность

Country, Population, GDP
China, 1336M, $10.1T
Russia, 139M, $2.2T
South Korea, 49M, $1.46T
Thailand, 67M, $0.59T

+13

Обходим чужие тормоза

shodan 26 июн 2011 в 11:35

Нет, конечно — я даже не знал, что у них есть сколько-то публичный трекер.

Обходим чужие тормоза

shodan 26 июн 2011 в 11:07

(пожимает плечами) Меня пока отлично устраивает, если что.

Для старшего поколения вообще единственный вариант, что другое им ставить, чтобы они справлялись с интерфейсом, я не знаю.

А говнокода везде и всюду кучи, не в его наличии или отсутствии счастие.

Обходим чужие тормоза

shodan 26 июн 2011 в 10:57

В тематическом блоге по C++ я ожидаю, что еще и не такое понятно.

+12

Обходим чужие тормоза

shodan 26 июн 2011 в 10:55

Повторюсь, там ОЧЕНЬ МНОГО вложенных вызовов в Skype API видно, если из сисколла глядеть — несколько десятков, возможно, более сотни. Наверняка оно собрано с оптимизациями и потому с одной из точек стек и не разматывается, ага.

Обходим чужие тормоза

shodan 26 июн 2011 в 10:43

Я ж там написал в самом конце, SQLite Browser. Тушишь скайп, открываешь main.db, там открываешь табличку с мессажками, и далее нехитрыми SQL запросами творишь чудеса.

Обходим чужие тормоза

shodan 26 июн 2011 в 10:42

Можно и я пробовал. Только до собственно программы стек не разматывается и поэтому ни в отладчике VS, ни в дереве CA все равно моего кода не видать. Чтобы понять, какой вызов приводит к чему и в каком объеме, так и эдак приходится вручную обставлять программу breakpoint-ами либо printf-ами.

Обходим чужие тормоза

shodan 26 июн 2011 в 10:38

shodan.ru/files/skype-export-1.1.zip

Обходим чужие тормоза

shodan 26 июн 2011 в 10:18

Если два — как понять, который врет?

+25

Обходим чужие тормоза

shodan 26 июн 2011 в 09:47

Чем-то не устроило, деталей уверенно не помню. То ли ряд нужных non-message events экспортировать не удавалось, то ли часть messages терялась, тк. отсутствовала в main.db (предположительно хранилась в chatsync).

Мастер-класс в Киеве, 18 июня (сб)

shodan 18 июн 2011 в 21:50

> Жалко не остались на автопати, просто все рассосались подумали, что не будет.

Вот вечно так, сам не организуешь — ничего не самоорганизуется!!!

Ладно, учтем ошибки на будущее — будем объявлять понятнее, что все оставшиеся вопросы необходимо задать в ближайшем заведении!!!

Мастер-класс в Киеве, 18 июня (сб)

shodan 14 июн 2011 в 11:14

В зависимости от конкретных требований, есть ряд фич и директив: charset_table, blend_chars, exceptions. Первые две позволяют настроить классы символов. Третья дает задать список уникальных исключений из правил (в котором можно использовать вообще любые символы).

Как устроено ранжирование

shodan 28 мая 2011 в 21:01

В тесте помогает.

— Query 1 (mode=extended2,ranker=(default),index=) — Query 'dog run': retrieved 4 of 4 matches in 0.001 sec.
Word stats:
'=dog' found 2 times in 2 documents
'dog' found 4 times in 4 documents
'=run' found 2 times in 2 documents
'run' found 4 times in 4 documents

Matches:
1. doc_id=4, weight=4430 body=«dog run»
2. doc_id=1, weight=3416 body=«dog runs»
3. doc_id=2, weight=3416 body=«dogs run»
4. doc_id=3, weight=2402 body=«dogs running»

Как устроено ранжирование

shodan 27 мая 2011 в 19:28

При включении «просто» морфологии оно все слова приводит к одному и тому же стему внутри и более не отличает.

Можно попробовать index_exact_words=1 + expand_keywords=1. Первое сохранит исходные точные формы в индекс. Второе автоматом расширит запрос и заменит каждое слово на (=слово|слово). Что, теоретически, приведет к бусту веса точных совпадений.

Как устроено ранжирование

shodan 26 мая 2011 в 23:41

можно еще «one two three»/1, оно эквивалентно. (Именно так внутри эмулируется ANY.)

Как устроено ранжирование

shodan 25 мая 2011 в 22:57

> Использую SPH_MATCH_ANY

ыыыааа.

который вообще не смотрит на частоты слов — это вроде умеренно подробно как раз расписано в посте. нет?

(one | two | three) + extended2 + sph_rank_proximity_bm25 и вперед.

Как устроено ранжирование

shodan 25 мая 2011 в 18:44

Длина не имеет значения. При прочих равных ранжироваться выше должны более редкие слова. Если слово «мини» в коллекции реже, чем «трактор», оно победит.

1 2 ...

7 8

10 11 ...

21 22