Comments / Profile of Xom / Habr

Александр Хомяков @Xom

AI-agents, RAG, NLP, Philosophy AI

ProfileArticles12PostsNewsComments362

Регистрация безналоговой компании в Эстонии

Xom Nov 29 2014 at 09:50

Есть ещё пара преимуществ Эстонии. Для живущих в Питере — это полтора часа до границы. И можно самому прелатами себя в органах, если что. И самое интересное — если платит за него, или даже за себя как директора там налоги

0

7 причин роста стоимости компании Dropbox до 4 миллиардов долларов

Xom Nov 29 2014 at 08:52

Автор статьи по моему сильно заблуждается. Все описанные приемчики применяют и другие, но это не даёт такой эффект. И не может дать. Причина в том, что когда был популярен гугл драйв, он позволял хранить и редактировать доки в своём формате, а дропбокс — в формате ворда с быстрой синхронизацией компа с облаком. Вот и весь секрет быстрого набора пользователей. Плюс линукс.

0

Борьба за покупателя или как купить лояльность?

Xom Nov 18 2014 at 20:44

телевидение работает далее на тех, кто сейчас в рекламируемом товаре не нуждается. он пройдёт когда понадобиться в тот магазин, который рекламировался. потому что он теперь его знает. поэтому м видео. почте рекламируется активно на ТВ, несмотря на то что вы его отнесли к прошлому.

0

Любительский подход к компьютерной лингвистике

Xom Sep 12 2014 at 09:36

«В частности, я понял, что обучать вручную, давая на каждый из вариантов вопроса свой вариант ответа — путь тупиковый»

Это да, тут нужен массовый корпус для статистики. Например, на ответы@мейл ру как то обработать. Но там «слишком много букоф», надо выделять тогда что то простое и однотипное из вопросов и ответов.

0

Любительский подход к компьютерной лингвистике

Xom Sep 12 2014 at 09:15

Результаты игры — это именно то, что описано в презентациях? Или есть еще примеры? Обучение у вас как реализовано, так как описано в ЖЖ? Может есть смысл сделать прям такой интерфейс дообучения, я бы с удовольствием поучаствовал учителем ))

«Всё выливается в сравнения больших сортированных массивов» — в этом и вся суть подхода, ну и в данных. Мы не использем, например, гиперонимы из вики, только N-граммы из текстов. Вытащить точно связи из такого сильно связного массива очень непросто имхо. Тут как раз дело в тонкостях.Мне кажется Вы уже столкнулись с ними.

П.С. адрес почты в презентациях действующий, если что туда можно писать (не все готов тут обсуждать).

0

Любительский подход к компьютерной лингвистике

Xom Sep 11 2014 at 10:32

По ответу в принципе я понял, как Вы решаете этот вопрос. У Вас правда не сама «лужайка» получится, что является «определителем» этого определения, а например, «поле». Ну не суть. Я скорее про Ваш же пример «семейная большая машина» -> «минивэн» (сейчас прочитал). Вы там показали как эти связи можно было бы ловить. И по сути обратная задача тоже имеет место — «минивэн» активирует как бы связный «фрейм» «большая семейная машина». То же интересный результат ))

По поводу нейронных ансамблей, совершенно верно, с одним уточнением — есть распространенные слова, а есть специфические. Первые хороши для распространения активации, а вот вторые более ценны для выбора конкретного ответа. Для этого надо выравнивать их веса, чтобы распространенные, которые одинаково связаны со всем и вся, не «зашумляли» селективное действие специфических лемм. Кроме того, бОльшую роль должны имхо играть число связей, а не вес отдельных N-грамм. Вы уже играли с этим насколько я понял? И если не секрет, на какой базе можно все эти «распространения активации» учитывать и оперативно подсчитывать? Даже не представляю при нескольких миллионах слов и… много связей.

«По крайней мере понятно, в каком направлении копать для поддержки диалога в виде общей картины мира» — теперь и я понял, когда дочитал про «народную онтологию». Это именно то, что и я пытаюсь сделать, так что будем рулить в одном направлении в этом аспекте. Но я не в аспекте диалога. Поэтому про формат ответа мало что могу подсказать. Но учитывая опыт ботов, пару десятков синтаксических шаблонов должны решить проблему. Ответы не обязаны быть настолько же многообразны по формам как и вопросы. Можно включить для разнообразия рефлексию оборотов, примененных в вопросе (а-ля, как ты думаешь — я думаю, что).

0

Любительский подход к компьютерной лингвистике

Xom Sep 11 2014 at 07:48

Нет, я не про омонимию спросил, но ответ тоже понравился — разделять омонимию по контекстным связям. Это интересный подход. Частично тоже применяю.
А так, насколько мне известно, такая омонимия неплохо разрешается статистическим таггером (Russian statistical taggers and parsers by Serge Sharoff).

Я спрашивал про другое — когда одно слово является определением группы слов, то есть имеет связь, но не с одним из них (например, с вершиной именной группы), а со всей группой как с совокупностью. Как в определениях, ну например, «лужайка — небольшое поле с травой». Тут не только связь лужайка — поле. Этого как раз мало, если только такие связи устанавливать, получается каша (все со всем связано).

П.С.2 Поддержка диалога — это вы сразу за слишком сложную задачу взялись имхо. Для простых реплик может быть и ничего, но в диалоге много прагматики и знаний по умолчанию (люди в диалоге опираются на общую картину мира, которая не эксплициролована в диалоге). Может локализовать для отработки на более узких задачах, как вы же предлагали судя по slideshare для колл-центов и для уточнения поисковых запросов.

П.С.2 очень странное поведение организаторов Диалога. У вас самая оригинальная разработка имхо из всех, и никакого места не дали. Остальные привезли давно опробованные технологии, которые как то типа доработали. Я вам отдаю второе место уверенно )) Ну только потому что Компренто переплюнуть трудно одному ))

0

Любительский подход к компьютерной лингвистике

Xom Sep 11 2014 at 06:32

Как успехи в конкурсе? И у вас уже есть какой то продукт на основе описанного алгоритма? Там есть трудность, когда одно слово соответствует по онтологии (как бы вы ее не получали) не одному слову, а группе слов (именной группе, высказыванию). И как строить те же N-граммы тогда?

0

Любительский подход к компьютерной лингвистике

Xom Sep 11 2014 at 06:21

А что приемлемо?

0

Домашний робот: от идеи к продукту

Xom Sep 5 2014 at 09:33

Простите, а чем это отличается от обычного чат-бота, того же Гусмана? Или Наносемантики? Я уже не говорю о Siri или Google Now. Получается отличие только в том, что вы засунули его в красивую портативную колонку и приделали управление розетками (стандартный контроллер). Мне кажется, что такой проект, если он объявлен вами именно как голосовая операционная, должен строиться на каких новых возможностях диалога, на прорыве в «понимании» смысла фраз с учетом контекста. Но об этом во всех ваших постах очень мало что говориться. Зато много о том, куда вы его хотите пристроить и сколько вы хотите за него денег )) В том же ролике вы показываете вполне банальные реакции на ключевые слова. Это сейчас может сделать бесплатно любой программист. Более крутой учтет и контекст предыдущего диалога. В чем ваша фишка?

0

Что такое Томита-парсер, как Яндекс с его помощью понимает естественный язык, и как вы с его помощью сможете извлекать факты из текстов

Xom Aug 12 2014 at 17:25

Не очень понятно, как Томита может вам помочь с определением тональности машинным обучением. Найти окрашенные слова в тексте и так можно. Машинное обучение вы можете сделать и по размеченным текстам (а такие есть?). Томита же разбирает цепочки слов по правилам. Что это позволяет вам определить?

0

Тестирование лингвистических технологий: соревнования по автоматическому разрешению кореферентности и анафоры

Xom Jul 18 2014 at 12:43

Хороший пример. Он заключается в том, что некоторые референты местоимений (или антецеденты) отсутствуют в самом предложении, а только подразумеваются. Штанга тут подразумевается, но есть отсылка к ней местоимением «ее». Штанга же подразумевается исходя из контекста — то что можно «уронить». Получается, что полная анафора не разрешима только за счет простых онтологии «Компания-название» (как у Comprento). Coprento такую штуку не возьмет.

0

Android Wear: Что пошло не так?

Xom Jul 17 2014 at 15:15

Очень предвзятый пост. Автор задался целью найти причины по которым «нет». А если поискать да, ровно на те же аргументы можно ответить положительно. Некоторые аргументы явно надуманы и даже абсурдны. Я, например, не хочу ходить в туалет и заниматься сексом со смартфоном в руках. А вы? Я не хочу вынимать каждый раз фаблет с экраном 5 дюймов, чтобы только посмотреть что там блюмкнуло в кармане (сообщение или вконтакте?). Я не хочу вынимать его на ходу, в машине или разговариваю с кем то в кафе. Глянул на часы и все. Голосовое управление — не единственный способ получения инфо на часах. Хотя очень удобное — сказал и получил ответ на экране вместо того, чтобы тыкать в него. Интерфейс еще надо суметь сделать на таком экране удобным, а говорить нас учить не надо. Говорить просто УДОБНО :)

0

Умные часы с Android Wear сделают Google Glass историей?

Xom Jul 11 2014 at 20:26

Что же касается часы vs очки, то смею уверить, что большинство не будут носить их просто потому, что быть постоянно в таких очках — это только для гиков. Вы будете их постоянно снимать, когда будете говорить с кем-то, скажем в кафе. Если вы конечно не напыщенный индюк, пытающийся показать, какой вы ~~очкарик~~ крутой. Такое «снять-надеть» надоест даже стойкому гику. В очках просто не удобно. Они нужны именно Иногда. А вот ту и выясняется, что иногда удобнее применять часы, а не носить для «иногда» постоянно очки.

Дополненная реальность? Во-первых, в очках от Гугла ее пока не много, да и то что есть трудно назвать таковой в полном смысле. Распознание объектов есть только по месту (типа эта та самая достопримечательность). Объекты — только по логотипу или штрих коду реально. См. Google Googes. Приделать к часам камеру (тот же Gear) и будет ровно та же дополненная реальность, но на часах — направил, сфоткал, получил доп инфо.

0

Умные часы с Android Wear сделают Google Glass историей?

Xom Jul 11 2014 at 19:29

Некоторые из тут отметившихся видимо не носили «умных часов». Это не замена смартфону, не звонилка. Это аксессуар к смартфону, как гарнитура, только не звук, а экран. Маленький, только для того, чтобы посмотреть кто звонит, что написали и т.п., не вынимая смартфон из кармана. И удобно это не только в машине, а в любой ситуации. Когда удобный экран для серфинга стал 5 дюймов (у меня такой и видимо я не составляю исключения все больше и больше), удобный и компактный экран на руке стал актуален. Юзер экспириенс проверенный. Если к нему приделать голосовое управление — вообще не заменимый.

0

Стэнфордская нейросеть определяет тональность текста с точностью 85%, код отдадут в Open Source

Xom Feb 16 2014 at 14:14

Анализ отдельных слов без учета метафорических, идиоматичных выражений и различных инверсий смысла дает по ним неверный результат. Например, He showed indifference to the difficulties in his way — считается этим анализатором ярко отрицательным выражением, хотя в действительности оно говорит о стойкости как положительном качестве, но говорит через «отрицательные» слова. И, наоборот, тоже получается смешно, когда ирония (отрицательная оценка) выражается через положительные слова, что кстати очень распространено в комментариях. Например, Oh yes, he distinguished himself as the master mind оценено как сплошь положительная сентенция ))

0

Домашний 3D-принтер окупается за 1 год

Xom Jan 15 2014 at 15:46

Единственно полезное, что нашел в качестве применения — детские игрушки. Даже простейшие пластмассовые стоят в магазинах кучу денег. А представьте себе напечатать весь этот Лего? Пластмаска же. Только хорошая. Вот это точно окупится, судя по моему ребенку )

Но в остальном пожалуй автор лукавит — штампованное китайское будет стоить гораздо дешевле, чем принтер + пластик + время на разбирательство со всем этим.

0

Лайфхаки от TeamLab Office 7.4

Xom May 29 2013 at 10:49

Да, и спасибо за экономию на временных, это реальная проблема была, приходилось всегда брать план с запасом. Нашу выгоду вы явно ставите выше своей, что вызывает даже подозрение ;)

+3

Лайфхаки от TeamLab Office 7.4

Xom May 29 2013 at 09:43

Тогда уж напишу в пику другим — год работали в мегаплане, Вот кто перегружен, так именно мегаплан. Все сразу и отовсюда, в результате логику их пришлось изучать долго. Ну и ценник не адекватный. В тимлабе понравился именно европейский (а не мАсковский) дизайн, лаконичность и уместность функционала. Не перегружайте! Всегда кому то чего то будет не хватать на какой то странице. У меня тоже пятка сейчас чешется, я же не собираюсь вмонтировать в руку навсегда чесалку ноги по этому случаю. Вот документы прямо в тимлабе — это огромный плюс. Претензии есть только по скорости загрузки редактора документов. Приходится ээээ… ждать.

+2

Напоминания в Evernote: новая функция уже доступна на iPhone, iPad, Mac и в веб-клиенте

Xom May 24 2013 at 10:33

Вот это спорно )) Это по разному организованный интерфейс прежде всего. Удобный календарь и удобные заметки — вещи не совместимые. Можно легко переборщить и «замусорить» доп функциями так, что важность имеющихся будет «замылена». Такое бывает, когда хочется всего и сразу в погоне за «улучшениями».

0

1 2 ...

18