Comments / Profile of trisch / Habr

Alexandra @trisch

Software engineer

ProfileArticles15PostsNewsComments422

«Рамблер-Авиа»: новый способ планировать путешествия

trisch Nov 15 2011 at 14:45

вы не разрешаете летать безвозвратно? :)

почему дата возврата обязательна для поиска?

В какую социальную сеть постить? Инструкция

trisch Nov 4 2011 at 19:54

вообще перевод в разы хуже оригинала — то есть иногда совсем не соответствует смыслу, и потому в сумме воспринимается хуже и как то нелогичней.

лучше бы оригинал запостили. тут думаю все английский понимают на таком уровне

Классификация документов методом опорных векторов

trisch Oct 13 2011 at 14:35

«После этого документ представляется в виде вектора, где i-тый элемент это мера вхождения i-того слова словаря в документ. Это может быть + 1 или -1 в зависимости от того, входит ли слово в документ или нет»

Я к сожалению не вникала в то как именно работает svmlight, но есть подозрение что структуры там частино одинаковые. это значит, что вы передаете туда компактный вектор:
7:6 11:6.56 19:45.56 25:0.5. то есть только те значения, которые не равны нулю.

Если же вы будете делать как у вас написано в статье +1/-1, то у вас получится вектор с кучей -1 вместо нулей. и вместо того чтобы передавать вектор из 500 значений, вы будете передавать вектор из 47тысяч. Это как бы совсем нелогично и для данного типа классификации не используется. И поэтому я подумала, что либо вы не совсем точно описали в статье что вы хотите сказать этим «i-тый элемент = +1/-1», либо я вас просто не поняла.

Кстати, только что заметила, что например у вас в примере очень разрозненные данные. 19 элемент — 45, 25 — меньше 1! В данном случае просто необходимо делать нормализацию, скалирование. Об этом кстати тоже написано в той статье по моей ссылке.

Классификация документов методом опорных векторов

trisch Oct 13 2011 at 10:43

ошиблась кнопочкой — ответ

Классификация документов методом опорных векторов

trisch Oct 13 2011 at 10:42

кто вам мешает это сделать в libSVM? :)

Классификация документов методом опорных векторов

trisch Oct 13 2011 at 10:38

да, это так и делается в svm. используются ядра более высокого порядка.
но как уже выше было сказано при очень большом количестве атрибутов и относительно маленьком количестве документов линейное ядро показывает такие же результаты

Классификация документов методом опорных векторов

trisch Oct 13 2011 at 10:24

лучше использовать libSVM так как она поддерживает мультиклассовость — то есть входной файл содержит не +1/-1, а номер класса для каждого документа, который вы хотите классифицировать. таким образом вам не нужно 80 классификаторов. а всего лишь 2 файла — для обучения и для тестов

далее, неразумно в качестве свойста использовать +1/-1 для классификации документов. так как у вас из обычного очень разреженного вектора из например 500 значений (500 features), получится вектор из полного списка (47тыс в вашем примере* количество оцениваемых свойств) значений, большая часть которых просто неинформативна — забита -1. или я вас в этом моменте неправильно поняла?

очень рекомендую к прочтению в этом контексте данную статью — A Practical Guide to Support Vector Classication

и по поводу того, какие свойста имеет смысл оценивать в документе — есть так называемые distributional features, которые как раз таки используются для классификации текстов. и если вы знаете о них, то стоило в статье их и описать и назвать своими названиями, можно даже с формулами :) а не обобщенно «доля слова в документе» и т.п.

но в целом приятно было встретить на хабре данную статью.

90% людей не знают про Ctrl+F

trisch Aug 21 2011 at 10:29

один раз кликнешь — узнаешь о хоткее. второй раз за ним уже лезть не будешь
а программа удобней тем, что она одна, а настройки у каждого софта в своем места

90% людей не знают про Ctrl+F

trisch Aug 21 2011 at 10:17

а так же ctrl+[1-8] переключает на порядковый номер вкладки. а ctrl+9 — на последнюю вкладку :)

Будущее гибкой разработки ПО

trisch Jul 15 2011 at 13:39

не по теме, но на вашем профиле хабр что-то заглючило 0_о

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 14 2011 at 09:12

да, так и есть. shading хорошо работает на границах материалов, а внутри мы получаем в принципе одно направление, которое тем не менее достаточно случайное, так как зависит от шума еще

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 14 2011 at 09:10

в плоскости их бы получилось бы 8. в объеме соответственно 26. но по сути вы правы.

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 14 2011 at 09:08

ой, не из 9 конечно же, а из 26

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 14 2011 at 09:04

в текстуре плотность тканей. она не шифрована в RGB, просто эту плотность можно потом дальнейшем как угодно интерпретировать и получать необходимые значения на выходе.
возьмем например плотность мяса и плотность кости — на границе будет большая разница, то есть большой градиент (его длина), внутри одной сущности, например мяса, градиент тоже будет из-за шумов, но весьма маленький. И этот градиент и есть наша нормаль

так же по коду можно заметить, что берутся не просто соседние воксели, а нечто усредненное из всех 9 вокселей, окружающих искомую точку

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 13 2011 at 21:13

нет :))
при большом шаге мы можем проскочить точное положение изоповерхности. рисуется все одинаково.

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 13 2011 at 21:10

режим рендеринга изоповерхностей лишь один из режимов визуализации, причем даже не основной
и вы не построите векторную графику в данной области, здесь физическая суть другая )

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 13 2011 at 21:05

немного избыточно в плане строк кода, но в целом вроде все верно )

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 13 2011 at 09:05

как-то некорректно вы выражаетесь.
возможно мы просто говорим с вами о разных вещах или об одном и том же, но с разных позиций

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 13 2011 at 09:03

мне с ним приходилось иметь дело долгое время. и вот насчет несвязанных друг с другом изображений могу поспорить :) если взять отдельный обычный дайком файл, то raw данные которые там хранятся непосредственно описаны в предыдущих тегах. и они не могут быть никак не связанны. это не имеет смысла
так же это не имеет отношения к текущей статье :)

Рендеринг изоповерхностей с использованием алгоритма рейкастинга

trisch Jul 13 2011 at 08:54

и как раз таки из-за того, что этот rayPosition зависит от скорости прохода, при большой скорости и большом шаге мы может пропустить точное положение изоповерхности и получаются такие вот круги, о которых я в конце упомянула. и которые надеюсь еще рассмотреть в следующей статье

1 2 3

5 6 ...

21 22