All streams
Search
Write a publication
Pull to refresh
7
0
Александр Хомяков @Xom

AI-agents, RAG, NLP, Philosophy AI

Send message
Есть ещё пара преимуществ Эстонии. Для живущих в Питере — это полтора часа до границы. И можно самому прелатами себя в органах, если что. И самое интересное — если платит за него, или даже за себя как директора там налоги
Автор статьи по моему сильно заблуждается. Все описанные приемчики применяют и другие, но это не даёт такой эффект. И не может дать. Причина в том, что когда был популярен гугл драйв, он позволял хранить и редактировать доки в своём формате, а дропбокс — в формате ворда с быстрой синхронизацией компа с облаком. Вот и весь секрет быстрого набора пользователей. Плюс линукс.
телевидение работает далее на тех, кто сейчас в рекламируемом товаре не нуждается. он пройдёт когда понадобиться в тот магазин, который рекламировался. потому что он теперь его знает. поэтому м видео. почте рекламируется активно на ТВ, несмотря на то что вы его отнесли к прошлому.
«В частности, я понял, что обучать вручную, давая на каждый из вариантов вопроса свой вариант ответа — путь тупиковый»

Это да, тут нужен массовый корпус для статистики. Например, на ответы@мейл ру как то обработать. Но там «слишком много букоф», надо выделять тогда что то простое и однотипное из вопросов и ответов.
Результаты игры — это именно то, что описано в презентациях? Или есть еще примеры? Обучение у вас как реализовано, так как описано в ЖЖ? Может есть смысл сделать прям такой интерфейс дообучения, я бы с удовольствием поучаствовал учителем ))

«Всё выливается в сравнения больших сортированных массивов» — в этом и вся суть подхода, ну и в данных. Мы не использем, например, гиперонимы из вики, только N-граммы из текстов. Вытащить точно связи из такого сильно связного массива очень непросто имхо. Тут как раз дело в тонкостях.Мне кажется Вы уже столкнулись с ними.

П.С. адрес почты в презентациях действующий, если что туда можно писать (не все готов тут обсуждать).
По ответу в принципе я понял, как Вы решаете этот вопрос. У Вас правда не сама «лужайка» получится, что является «определителем» этого определения, а например, «поле». Ну не суть. Я скорее про Ваш же пример «семейная большая машина» -> «минивэн» (сейчас прочитал). Вы там показали как эти связи можно было бы ловить. И по сути обратная задача тоже имеет место — «минивэн» активирует как бы связный «фрейм» «большая семейная машина». То же интересный результат ))

По поводу нейронных ансамблей, совершенно верно, с одним уточнением — есть распространенные слова, а есть специфические. Первые хороши для распространения активации, а вот вторые более ценны для выбора конкретного ответа. Для этого надо выравнивать их веса, чтобы распространенные, которые одинаково связаны со всем и вся, не «зашумляли» селективное действие специфических лемм. Кроме того, бОльшую роль должны имхо играть число связей, а не вес отдельных N-грамм. Вы уже играли с этим насколько я понял? И если не секрет, на какой базе можно все эти «распространения активации» учитывать и оперативно подсчитывать? Даже не представляю при нескольких миллионах слов и… много связей.

«По крайней мере понятно, в каком направлении копать для поддержки диалога в виде общей картины мира» — теперь и я понял, когда дочитал про «народную онтологию». Это именно то, что и я пытаюсь сделать, так что будем рулить в одном направлении в этом аспекте. Но я не в аспекте диалога. Поэтому про формат ответа мало что могу подсказать. Но учитывая опыт ботов, пару десятков синтаксических шаблонов должны решить проблему. Ответы не обязаны быть настолько же многообразны по формам как и вопросы. Можно включить для разнообразия рефлексию оборотов, примененных в вопросе (а-ля, как ты думаешь — я думаю, что).
Нет, я не про омонимию спросил, но ответ тоже понравился — разделять омонимию по контекстным связям. Это интересный подход. Частично тоже применяю.
А так, насколько мне известно, такая омонимия неплохо разрешается статистическим таггером (Russian statistical taggers and parsers by Serge Sharoff).

Я спрашивал про другое — когда одно слово является определением группы слов, то есть имеет связь, но не с одним из них (например, с вершиной именной группы), а со всей группой как с совокупностью. Как в определениях, ну например, «лужайка — небольшое поле с травой». Тут не только связь лужайка — поле. Этого как раз мало, если только такие связи устанавливать, получается каша (все со всем связано).

П.С.2 Поддержка диалога — это вы сразу за слишком сложную задачу взялись имхо. Для простых реплик может быть и ничего, но в диалоге много прагматики и знаний по умолчанию (люди в диалоге опираются на общую картину мира, которая не эксплициролована в диалоге). Может локализовать для отработки на более узких задачах, как вы же предлагали судя по slideshare для колл-центов и для уточнения поисковых запросов.

П.С.2 очень странное поведение организаторов Диалога. У вас самая оригинальная разработка имхо из всех, и никакого места не дали. Остальные привезли давно опробованные технологии, которые как то типа доработали. Я вам отдаю второе место уверенно )) Ну только потому что Компренто переплюнуть трудно одному ))
Как успехи в конкурсе? И у вас уже есть какой то продукт на основе описанного алгоритма? Там есть трудность, когда одно слово соответствует по онтологии (как бы вы ее не получали) не одному слову, а группе слов (именной группе, высказыванию). И как строить те же N-граммы тогда?
Простите, а чем это отличается от обычного чат-бота, того же Гусмана? Или Наносемантики? Я уже не говорю о Siri или Google Now. Получается отличие только в том, что вы засунули его в красивую портативную колонку и приделали управление розетками (стандартный контроллер). Мне кажется, что такой проект, если он объявлен вами именно как голосовая операционная, должен строиться на каких новых возможностях диалога, на прорыве в «понимании» смысла фраз с учетом контекста. Но об этом во всех ваших постах очень мало что говориться. Зато много о том, куда вы его хотите пристроить и сколько вы хотите за него денег )) В том же ролике вы показываете вполне банальные реакции на ключевые слова. Это сейчас может сделать бесплатно любой программист. Более крутой учтет и контекст предыдущего диалога. В чем ваша фишка?
Не очень понятно, как Томита может вам помочь с определением тональности машинным обучением. Найти окрашенные слова в тексте и так можно. Машинное обучение вы можете сделать и по размеченным текстам (а такие есть?). Томита же разбирает цепочки слов по правилам. Что это позволяет вам определить?
Хороший пример. Он заключается в том, что некоторые референты местоимений (или антецеденты) отсутствуют в самом предложении, а только подразумеваются. Штанга тут подразумевается, но есть отсылка к ней местоимением «ее». Штанга же подразумевается исходя из контекста — то что можно «уронить». Получается, что полная анафора не разрешима только за счет простых онтологии «Компания-название» (как у Comprento). Coprento такую штуку не возьмет.
Очень предвзятый пост. Автор задался целью найти причины по которым «нет». А если поискать да, ровно на те же аргументы можно ответить положительно. Некоторые аргументы явно надуманы и даже абсурдны. Я, например, не хочу ходить в туалет и заниматься сексом со смартфоном в руках. А вы? Я не хочу вынимать каждый раз фаблет с экраном 5 дюймов, чтобы только посмотреть что там блюмкнуло в кармане (сообщение или вконтакте?). Я не хочу вынимать его на ходу, в машине или разговариваю с кем то в кафе. Глянул на часы и все. Голосовое управление — не единственный способ получения инфо на часах. Хотя очень удобное — сказал и получил ответ на экране вместо того, чтобы тыкать в него. Интерфейс еще надо суметь сделать на таком экране удобным, а говорить нас учить не надо. Говорить просто УДОБНО :)
Что же касается часы vs очки, то смею уверить, что большинство не будут носить их просто потому, что быть постоянно в таких очках — это только для гиков. Вы будете их постоянно снимать, когда будете говорить с кем-то, скажем в кафе. Если вы конечно не напыщенный индюк, пытающийся показать, какой вы очкарик крутой. Такое «снять-надеть» надоест даже стойкому гику. В очках просто не удобно. Они нужны именно Иногда. А вот ту и выясняется, что иногда удобнее применять часы, а не носить для «иногда» постоянно очки.

Дополненная реальность? Во-первых, в очках от Гугла ее пока не много, да и то что есть трудно назвать таковой в полном смысле. Распознание объектов есть только по месту (типа эта та самая достопримечательность). Объекты — только по логотипу или штрих коду реально. См. Google Googes. Приделать к часам камеру (тот же Gear) и будет ровно та же дополненная реальность, но на часах — направил, сфоткал, получил доп инфо.
Некоторые из тут отметившихся видимо не носили «умных часов». Это не замена смартфону, не звонилка. Это аксессуар к смартфону, как гарнитура, только не звук, а экран. Маленький, только для того, чтобы посмотреть кто звонит, что написали и т.п., не вынимая смартфон из кармана. И удобно это не только в машине, а в любой ситуации. Когда удобный экран для серфинга стал 5 дюймов (у меня такой и видимо я не составляю исключения все больше и больше), удобный и компактный экран на руке стал актуален. Юзер экспириенс проверенный. Если к нему приделать голосовое управление — вообще не заменимый.
Анализ отдельных слов без учета метафорических, идиоматичных выражений и различных инверсий смысла дает по ним неверный результат. Например, He showed indifference to the difficulties in his way — считается этим анализатором ярко отрицательным выражением, хотя в действительности оно говорит о стойкости как положительном качестве, но говорит через «отрицательные» слова. И, наоборот, тоже получается смешно, когда ирония (отрицательная оценка) выражается через положительные слова, что кстати очень распространено в комментариях. Например, Oh yes, he distinguished himself as the master mind оценено как сплошь положительная сентенция ))
Единственно полезное, что нашел в качестве применения — детские игрушки. Даже простейшие пластмассовые стоят в магазинах кучу денег. А представьте себе напечатать весь этот Лего? Пластмаска же. Только хорошая. Вот это точно окупится, судя по моему ребенку )

Но в остальном пожалуй автор лукавит — штампованное китайское будет стоить гораздо дешевле, чем принтер + пластик + время на разбирательство со всем этим.
Да, и спасибо за экономию на временных, это реальная проблема была, приходилось всегда брать план с запасом. Нашу выгоду вы явно ставите выше своей, что вызывает даже подозрение ;)
Тогда уж напишу в пику другим — год работали в мегаплане, Вот кто перегружен, так именно мегаплан. Все сразу и отовсюда, в результате логику их пришлось изучать долго. Ну и ценник не адекватный. В тимлабе понравился именно европейский (а не мАсковский) дизайн, лаконичность и уместность функционала. Не перегружайте! Всегда кому то чего то будет не хватать на какой то странице. У меня тоже пятка сейчас чешется, я же не собираюсь вмонтировать в руку навсегда чесалку ноги по этому случаю. Вот документы прямо в тимлабе — это огромный плюс. Претензии есть только по скорости загрузки редактора документов. Приходится ээээ… ждать.
Вот это спорно )) Это по разному организованный интерфейс прежде всего. Удобный календарь и удобные заметки — вещи не совместимые. Можно легко переборщить и «замусорить» доп функциями так, что важность имеющихся будет «замылена». Такое бывает, когда хочется всего и сразу в погоне за «улучшениями».

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity

Specialization

Chief Product Officer (CPO), ИИ агенты
Lead
From 500,000 ₽
Project management
People management
Development management