All streams
Search
Write a publication
Pull to refresh
7
0
Александр Хомяков @Xom

AI-agents, RAG, NLP, Philosophy AI

Send message
В визуальном контексте только есть наметки у таких гигантов как Google, но полностью рабочего варианта нет и у них. И вам я бы посоветовал искать более реалистичные пути )) Лучше исходить из речевого контекста, обращение к прибору — это не так сложно и вполне юзабельно для юзера. Так делают Google (Ok, google), Samsung на телевизорах и другие. Они тем самым создают вполне привычную модель поведения. И поверьте, они проверили ее на юзабельность, прежде чем внедрять. Так что не стоит тут придумывать что-то сложнее. А вот поддерживать контекст — это задачка важнее. Многие согласны с тем, что речевые интерфейсы не приживаются именно из-за этого. Поясню.

Просто команды мало интересны, легче включить музыку или лампочку с экрана смартфона, чем командовать прибору, стоящему где-то в одной комнате, да еще к тому же не уверенно слышащему (не 100%). Поэтому умный дом сейчас активнее и проще развивается на смартфоне такими уже распространенными программами как IFTTT.

Понимания заданного списка команд причем с предзаданной лексикой (сказал иначе — промах) — это не интересно. Поиграться на пару дней и отложить в угол. Вам же, чтобы выжить, надо дать новый экспириенс юзеру, из-за которого он будет готов общаться с вашей игрушкой. Дать то, что будет поддерживать к нему интерес больше, чем к командному пункту. Умение поддерживать диалог, исходя из контекста, и наличие общей «картины мира», о есть представления о чем может говорить человек. Нужно понимание расширенного контекста, так как ни одно предложение не содержит всю информацию об обстоятельствах речи. Без этого любая такая игрушка — тупое баловство, претендующее только на место в пыльном шкафу.

Ваша игрушка должна содержать что-то человеческое, быть неожиданной для ее хозяина. Как это сделать? Вы сильны по железу, это уже хорошо. Но по семантике вам видимо еще надо расти и расти. Обращайтесь если что )
А есть где нибудь обзор не электроники и распознания речи, а лингвистических способностей вашей штучки. И хорошо бы сравнение ее с другими аналогичными проектами (их уже не мало) по одинаковым фразам. Насколько я понимаю, что чат-ботная технология, что есть предзаданные команды. В связи с этим интересно как вы учитываете контекст, точнее сказать, историю диалога?
Специальный язык — плохо, не юзабильно. Его придется учить, а пользователь ленив (не гик). Следить за контекстом — адски сложная задача, поэтому и спрашиваю, как вы ее решили. А распознать из контекста, что речь обращена к тебе, почти невозможно без поддержки визуального контекста.
Вообще то фраза «Алекса, ...» служит для того, чтобы «интеллектуальный помощник» случайно не выполнил команды, которые вы дале жене, а не ему.

Но интересней другое — как вы учитываете контекст и поддерживаете диалог? Чат бот логика или что то другое?
Все верно, если работника не заставлять — он сам обленится и будет делать все меньше. Если же его постоянно заставлять, он начнет искать как бы делать поменьше. Начинается игра «кошки — мышки» с рабовладельцем работодателем. На что в фирмах и правда уходит куча ресурсов. И какой же выход из этой ситуации? Если не говорить о роли воспитания, то выход только один — искать людей, которые готовы работать за результат, а не за зарплату. И не создавать больших компаний, в которых результат работы каждого обезличивается. Все вспомогательные функции как бухгалтерия, логистика, склад, реклама, пиар, расчеты — на аутсорс. Вместе, на виду друг у друга только те, кто делают продукт. Не более 15 человек. В Швеции такие компании делают 70% ВВП страны. У нас — 5%. Делайте выводы. Кстати, роботы заменят не только плохих, но и хороших. Но роботы не могут пока сами создать новый продукт. Чем и должна заниматься команда из 15 человек.
Смарт команды — бессмысленно. В гугле с яндексом итак можно писать Авто купить или авто ремонт. И это разные результаты. Разве что вы уж совсем конкретно выводите на конкретный сервис по команде. Тогда это просто экономия моего времени, если я доверяю вашему выбору ))

Второе даже интересней — public tag. Я могу задать область поиска, тему, ограничив многозначность запроса. Яндекс с гуглом делают это по умолчанию и часто миксуют результаты из разных тем. Например, любимый пример яндекса — ягуар. То ли зверя я ищу, то ли авто. Выдают и то и то на всякий случай. Вы же предлагаете уточнить, как я понял. Но просто ограничением сайтов по tag? Тогда это не очень. Посмотрите на nigma.ru, они делают тоже самое, только путем кластеризации результатов. Может так лучше?
Отличный пост, спасибо )) Выскажусь только по п.1. Потребитель действительно не знает, что хочет, Но узнать можно, только дав ему попробовать, чтобы он оценил. Обратная связь и есть самое важное. Некоторые герои ловят эту обратную связь прям с рынка, без всякого MVP. И секрет вот в чем.

Что появилось первым — смартфон или спрос на смартфон (курица или яйцо)? Ответ очень простой — у потребителя нет потребности в смартфоне, у него есть потребность в информации. Такие потребности не меняются, были до и будут такими же после. Смартфон, как и телевизор, и компьютер до этого просто по новому, лучше удовлетворяют эту потребность (в информации). Сначала, чтобы посмотреть спектакль, надо было идти в театр, потом театр пришел в дом (телевизор). Это и есть ответ на дилемму п.1.
Вы возможно где то упоминали, но не увидел главного отличия от листочков — контроль и статистика. НО не просто как в любом другом CRM, а глубже — какие скрипты были использованы, и варианты отклика выбраны. По ним можно видеть, почему продажи не идут, куда смотреть. Это очень важное отличие. По обычной CRM почему не идут продажи не поймешь, пока всех не опросишь. Практически, вы соединили классическую CRM с дополнительными доками по ведению разговора + сценарий беседы с вариантами ее разрешения (не надо, интересно и т.п.). А если вариант ответа новый — его можно менеджеру занести хотя бы в свои варианты?
Так все таки вы используете какие-то rules на синтаксических связях. И TF-IDF, насколько я понял, и «мягкие» шаблоны. Я почему и задавал вопросы, что думал, как это все вы чисто на нейронных (матрицах) решили эту задачу? Но правила вы применяете только для поиска схожих сущностей (товаров) — это интересно.
Проголосовал.
yadi.sk/i/DxWNlgDsgWFec — Форда пропустил. Почему?
В NELL применяется аж 4 метода, дополняющих друг друга. Вы все из них освоили — имеете код их реализации? И если сркеди прочего вы применяете w2v или то что другое — Glove? Вопрос не праздный. Кстати, конкретную задачу по API вам писать на info@meanotek.ru?
За ссылку спасибо, теперь понятней, о чем речь. А вы прям так как в статье сделали или все таки как то иначе? Методы вы тут описываете несколько иные. Можно в принципе просто по структуре синт. связей существительных вычислять товары — товары покупают, продают в магазинах, ремонтируют, они ломаются. Правда отель не вписывается в этот способ )

«ваше мнение — это ваше мнение, а не последняя инстанция» — я где то утверждал, что это последняя инстанция? Вам надо научиться реагировать иначе на критику — улучшениями продукта, а не минусованием. «Если вы не готовы, то вам здесь не место» ))
Учить меня не надо, я сам могу поучить указанным темам (опыта раза побольше в бизнесе). И я предельно вежлив, в отличие от вас — ссылка на Жирика чья тут? Да, у моих коллег, кстати, есть работающий продукт по указанной теме. Но это не тема вашего блога.
NLPpub, конечно, знаем. Но там нет готовых подобных продуктов. Там только инструменты. Текстерра больше не поддерживается, к сожалению.

Судя по ссылке на хакатон, команде texocat вполне подсилу сделать коммерческий продукт. По моему просто поторопились с выходом. Или хотя бы написали — АЛЬФА-ВЕРСИЯ. ПРЕДЛАГАЕМ ПОТЕСТИРОВАТЬ И НАЙТИ ОШИБКИ. Другое бы отношение было бы. И самим на «придирки» не реагировать «жириком» тогда.

Тем кто знаком с работой по этой теме в Яндексе, понятно, что задача ОЧЕНЬ не простая… Поэтому заячвка должна быть серьезной.
Если бы хотя бы без этих сложных случаев кто сделал анафору… Хотя тут просто стилистическая ошибка — после сочинительного подлежащего (через и) анафора в единственном числе. Тут обе фирмы подходят.
Так она мне самому требуется, но лень собирать. А тут такая заявка! Но на проверку — не работает без ошибок. Вот поэтому и обидно. А так — томита. Но его надо настраивать под задачу.
«Но пока это никому не подсилу» — это я писал не про анафору, а про уголь. Анафора решается в простейшем случае, который a привел («эту фирму»). Критика никогда не мешает, тем более когда идет речь далеко не о задаче уровня ИИ. Есть такое понятие «достигнутый технический уровень». Если вы предлагаете продукт, он должен быть не ниже уже достигнутого уровня в бесплатных продуктах (например, «флексивность» — не проблема уже давно, стеминга, лемматизаторов бесплатных в сети куча). Получается, проект не достоен даже критики, если так рассуждать.
Критика помогает сделать продукт лучше, а не витать в облаках. Где тут придирки? Только факты. Анафоры нет, корефференции толком нет. Как можно выявить факты про фирму, если анафора (ссылка на нее местоимением) не работает? Если продукт не идеален, зачем его выводить на суд божий? Да еще предлагать воспользоваться за деньги! Бред. Передавайте привет авторам блога.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity

Specialization

Chief Product Officer (CPO), ИИ агенты
Lead
From 500,000 ₽
Project management
People management
Development management