Comments / Profile of lightcaster / Habr

User

lightcaster Sep 1 2011 at 15:15

Был точно такой же конкурс. С точно таким же раскладом цен. Подали в ФАС. Были отфудболены по тем же глупым формальным причинам :).

Look

Понимание компьютером текста: действительно ли всё так плохо?

lightcaster Aug 26 2011 at 05:55

Вы заставили меня пробежаться по выводам Пенроуза. Но, простите, это не доказательство. Он хорошо иллюстрирует свои идеи, и с помощью черных дыр, и с помощью машин Тьюринга. Но все равно это лишь иллюстрация.

Он ссылается на нечто, что называет «неалгоритмическим элементом» в сознании. И мол это позволяет выводить мышление за рамки машины тьюринга. Но мне не очень понятно, что такое неалгоритмический элемент. Может быть, я плохо знаю физику. Но даже если он есть, как-то возник в ходе эволюции, я не понимаю почему мы его не можем воссоздать.

Что касается ссылок «величайшие умы». У Пенроуза достаточно критиков. Да и те же Тьюринг и Гедель придерживались другой точки зрения.

Look

Понимание компьютером текста: действительно ли всё так плохо?

lightcaster Aug 25 2011 at 16:59

Да что ж вам эта теорема покоя не дает?? :) Вон математика сплошь в недоказуемых утверждениях. И ничего, работают, не жалуются.

Look

Понимание компьютером текста: действительно ли всё так плохо?

lightcaster Aug 25 2011 at 16:54

Ну и чем вам помешала т.Геделя :) Вы слишком вольно трактуете понятие «язык».

Во-первых в теореме речь идет сугубо о формальных языках. Естественный язык — это не язык вовсе с точки зрения формального описания. Так что применять теорему Геделя к нему как-то странно.

Во-вторых, делать вывод о невозможности описать один язык другим притягивая т.Геделя — тоже неверно. Одну контекстно-свободную грамматику я могу свободно выразить через другую, либо через автомат с очередью. В чем проблема-то? :)

Не сочтите это за упрек. Но все же чтобы быть более объективным почитайте про методы ИИ, а также про формальные языки и грамматики. Понятно, что до человеческого интеллекта нашим методам пока далеко. Но по крайней мере мы стараемся :)

Look

Понимание компьютером текста: действительно ли всё так плохо?

lightcaster Aug 25 2011 at 16:40

ffriend, плюс вам. Сам хотел написать ответ на упоминаемую статью, но поленился.

Не совсем согласен с выводом, но вцелом я считаю вы правы:
1 — компьютер не обязан «понимать» текст в человеческом смысле (привет, Серль!).
2 — человек сам не понимает как он понимает этот текст. думаю, это все те же алгоритмы, только сильно запараллеленые, более сложные и более адаптивные.

Всем, кто заводит речь о «человеческом понимании для компьютера» рекоммендую учить математику.

Look

Определение части речи слов в русском тексте (POS-tagging) на Python 3

lightcaster Aug 10 2011 at 14:28

А, точно, невнимательно прочел. Простите.

Кстати, есть такая штука как Brill Tagger, который в процессе работы инкрементально корректирует проставленные метки. Интересно, можно ли как-нибудь применить здесь то же самое.

Look

Определение части речи слов в русском тексте (POS-tagging) на Python 3

lightcaster Aug 10 2011 at 07:01

Да. Но можно и SVM тот же использовать для этих целей. Чуть-чуть изменив алгоритм. Гляньте мой коммент ниже.

Look

Определение части речи слов в русском тексте (POS-tagging) на Python 3

lightcaster Aug 10 2011 at 06:45

Автор, пара вопросов.

— почему выбраны именно эти фичи?
# 1001 — съешьте, 2001 — ьте, 3001 — те

— почему выбран SVM как классификатор? (а не, к примеру, наивный байес)

И предложение. Попробуйте использовать контекст для разметки. Тут несколько вариантов:
— использовать фичи предыдущего слова для определение метки текущего слова.
пример: для слова «булок» в «съешьте булок»
{'full_suffix': 'булок', '3_suffix': 'лок', '2_suffix': 'ок', 'prev_3_suffix': 'ьте', 'prev_2_suffix': 'те'}

— использовать полученную метку для предыдущего слова чтобы определить метку текущего слова. К примеру, для «съешьте булок»:
{'full_suffix': 'булок', '3_suffix': 'лок', '2_suffix': 'ок', 'prev_tag': 'ГЛ'}

Интересно, как изменится при этом качество.

Look

Определение части речи слов в русском тексте (POS-tagging) на Python 3

lightcaster Aug 10 2011 at 06:19

Контекст также прекрасно отрабатывается машинными методами. Можно использовать n-gram'ы или даже уже размеченные слова. К примеру, после предлога вероятность следования глагола очень мала.

Look

Частотный анализ украинского языка

lightcaster Jul 27 2011 at 20:36

А как же дамп википедии?! :)

Look

Как не терять вещи

lightcaster Jul 15 2011 at 11:50

плюсую за скрин из memento :)

Look

Жизнь в черной дыре или как взаимодействовать с крупными российскими компаниями

lightcaster Jul 4 2011 at 13:41

Один вопрос: где же здесь бизнес? :)

Look

Google не получит патентов Nortel. Не помогло даже число пи

lightcaster Jul 2 2011 at 15:09

Да, монополист. Но вроде-как бинг тоже успехи делает.

-1

Look

Как бы вы реализовали наследственную связь между классами Эллипс и Круг?

lightcaster Jun 29 2011 at 15:39

Не стал бы их делать классами :)

Look

Поиск гамильтонова пути с помощью мембранной системы за полиномиальное время

lightcaster Jun 23 2011 at 15:15

Я к тому, что само понятие сложности алгоритмов имеет смысл только если мы рассматриваем машину тьюринга (или подобное вычисл.устройство). По этому сложность алгоритма по времени, строго говоря, не полиномиальна.

Look

Поиск гамильтонова пути с помощью мембранной системы за полиномиальное время

lightcaster Jun 23 2011 at 12:09

Ох уж эти громкие названия :)
Конечно, алгоритм не полиномиальный. Вы не подменяли временную сложность пространственной. Корректней сказать вы разложили ее по разным вычислительным устройствам. То же самое, что использовать машину тьюринга с очень большим количесвом лент и считывающих гловок. Но сложность алгоритма от этого не меняется.

В остальном, интересно, спасибо.

Look

SumIT-2011 уже рядом, а ты без проекта?

lightcaster Jun 23 2011 at 06:56

Ахренеть. А если у меня нет аккаунта вконтакте?

Look

Корпоративный троллинг. Часть первая

lightcaster Jun 17 2011 at 15:23

Вы описали принцип работы всех наших интеграторов. Грустно это.

Не лучше ли заняться чем-то другим? Чем-то действительно полезным.
Жалко растрачивать жизнь на эти склоки. Я протолкался в этой сфере пять лет. Теперь немного жалею.

Look

Робот Милена меняет имидж

lightcaster Jun 16 2011 at 15:33

Nuance под капотом? :)

Look

Кто разводит рыбок? Или решение загадки Эйнштейна регулярным языком

lightcaster Jun 14 2011 at 12:31

Забавно :) Но этим методом будет сложно, там контекстных правил много.

Look