В каждом человеческом языке по несколько десятков тысяч слов, а количество возможных комбинаций из них я вообще боюсь себе представить.
В компаниях, занимающихся предоставлением поисковых услуг, работают лучше специалисты и если бы все было бы просто, то описанных вами проблем не возникало бы.
Работы в сторону понимания смысла контента компьютерами идут полным ходом, но быстро это не получится. Одна из подобных попыток — это Семантический веб — почитайте, думаю будет интересно.
Вообще, в принципе, если не говорить о высоких материях, а только применительно к данному случаю,
то это вполне можно решить с помощью метаязыка запросов, например:
"Диссертация: поиск" - вполне можно соотнести "Дисертация" с идентификатором сущности, а "поиск" - с частью содержимого, причем элементарно.
Идея вообще интересная.
Стоит подумать над реализацией.
имеется в виду, как я понимаю, сложность при индексировании страниц сайтов, где поиск должен осуществляться, а не в строке поиска. Там, действительно, не сложно... А вот при индексировании нужно определять какое слово что означает, это может утяжелять и усложнять весь процесс.
Хм. какое слово что означает..
А что может означать для машины слово дисертация? Или поиск?
Это просто поток байтов и всегда им останется.
Человек должен структурировать информацию. ЧеЛоВек.
Для себя. В понятных себе терминах.
Функция машины - выявлять неочивидные человеку отношения и свойства этих структур,
и на базе этого строить новые, позволяющие человеку получать наиболее релевантную информацию.
Машине всеравно как слово диссертация относится к слову поиск.
Они имеют смысл только для человека. Причем даже не для каждого.
Вы хотите научить машину человеческому языку?
Я думаю, в ближайшие лет сто это нереально. Хотя бы только по тому, что человек пока
не понимает как работает сам прототип, то есть, его собственный мозг.
Но зато вполне реально указать машине явно отношение двух этих слов,
используя понятные машине термины.
Поэтому и считаю, что метаинформация в данных + язык запросов - это наше все;)
Гораздо легче научиться самому(человеку) правильно формулировать запросы для поисковика, чем поисковик научить понимать то что на самом деле хочешь найти.
на мой взгляд главная задача поисковика выдавать актуальные и точные ответы на твои запросы.
Но если ты хочешь создать ИИ - то поисковик может стать неплохим инструментом для этого, но не более.
Мысль про новый тип поиска пришла, хочу поделиться и спросить, может такое есть уже?