Comments 4
Только одна проблема. Вам нужно будет или обучать пользователя тем словам которые правильно поймет ваша система, или собирать о своих пользователях достаточно инфы что б подстраивать свои алгоритмы под их соц нюансы (как гугл делает. У вас мощностей хватит?). Бо иначе понять, что запрос «четко с пацанчиками посидели в падике» и «упадок культуры на примере состоянии мест общественного пользования» должен выдавать одну и туже фотку — будет довольно затруднительно.
Ну, или ревалентность выдачи будет зависит от того, насколько ваш датасет совпал с текущим пользователем.
Ну, или ревалентность выдачи будет зависит от того, насколько ваш датасет совпал с текущим пользователем.
Таблица с эмбеддингами для слов, построенная по корпусу языка, сработает, допустим, для 95% пользователей. А чтобы получить эмбеддинги для слов из всевозможных сленгов, нужно потратить много человеко- и машино-часов времени. Стоят ли дополнительные 5% этих усилий — большой вопрос… И каждый коллектив отвечает на него по-своему, в зависимости от целей и ресурсов.
Какая прелесть… На горсточку минусов, аж один адекватный коммент. Технический ресурс, че…
Но если по сути коммента — а у вас есть статистика за вышеозначенные 95%? Бо у меня только личные ощущения, которые, естественно, очень сильно зависят от кучи сложно считаемых факторов, и явно не могут являться репрезентативной выборкой по всем носителям языка. Но, в частности, они базируются на поделиях фонда кино, которые, теоретически должны быть достаточно репрезентативны. Но это не точно.
Но если по сути коммента — а у вас есть статистика за вышеозначенные 95%? Бо у меня только личные ощущения, которые, естественно, очень сильно зависят от кучи сложно считаемых факторов, и явно не могут являться репрезентативной выборкой по всем носителям языка. Но, в частности, они базируются на поделиях фонда кино, которые, теоретически должны быть достаточно репрезентативны. Но это не точно.
Вроде бы в статье нигде не было сказано о возможности искать по каким-то сленговым, субкультурным словам, именованным сущностям и тп.
Речь идет об общем поисковом механизме, где человек хочет иметь какой-то инструмент поиска по фоткам. Обычно речь идет о персонах (есть отдельно обученная распознавалка лиц), геотегах (что б сработало «с Серегой на Ямайке») и вот таком вот движке, который по векторам слов может понять, что «пляж» = «берег», а так же «еда» + «на улице» = «пикник». Этого более чем достаточно. Искать по «четко с пацанчиками посидели в падике» — не вижу смысла…
Не минусил, но минусящих понимаю )
Речь идет об общем поисковом механизме, где человек хочет иметь какой-то инструмент поиска по фоткам. Обычно речь идет о персонах (есть отдельно обученная распознавалка лиц), геотегах (что б сработало «с Серегой на Ямайке») и вот таком вот движке, который по векторам слов может понять, что «пляж» = «берег», а так же «еда» + «на улице» = «пикник». Этого более чем достаточно. Искать по «четко с пацанчиками посидели в падике» — не вижу смысла…
Не минусил, но минусящих понимаю )
Sign up to leave a comment.
Как работает поиск изображений в Dropbox