Pull to refresh

Comments 31

UFO just landed and posted this here
Интереснее в блогах обзоры читать, ИМХО. Покороче и по делу, жаль что Яндекс не собирает и такие обзоры.
Доброе утро. Мы собираем обзоры только с проверенных сайтов, например, mobile-review.com. В блогах, к сожалению, редко можно найти стоящие обзоры. У вас есть примеры таких обзоров?
Я их не собираю. Когда собираюсь что-то купить, ищу тем же Яндексом.
Может вам просто к товару помимо того, что есть добавить поиск обзоров, типа «найти другие обзоры». И написать алгоритм поиска этих обзоров.
Вот могу свой обзор Samsungа только показать, или Panasonicа гыгы))
Но если серьезно, то про хлебопечку подобную я у вас обзоров не нашел, написал сам. И только чуть позже появилось еще пара обзоров в блогах, на Маркете в это время ничего не было.
Интересно было бы прочитать про технологии. Пока сказка, какая-то: «жил-был Формализатор».
Написано немного в игровой форме, а какие подробности Вас интересует помимо того, что мы рассказали?
Использующиеся технологии, примерная структура формилизатора. Про любые технические подробности было бы интересно.
Хотя даже не столько технические, сколько архитектурные подробности интересуют.
Архитектурно выглядит так:
Есть веб-сервис, в котором знания о предметной области настраиваются в xml конфигурации. На вход подаётся текст и тип предметной области, а на выходе после разбора получаем пары ключ-значение.
Для контент-менеджеров в бэкофисе есть интерфейс редактирования предметной области, а также интерфейс формализации предложений для обработки новых предложений.
Спасибо! Уже интереснее.
Конечно, гиковская статья. Вот только итак понятно, что есть «некий формализатор».
Более интересно узнать как работает этот самый формализатор, описание которое приведено в тексте слишком очевидно…

Повторюсь, статья хорошая, но гиковского в ней мало… и она больше похожа на рекламу, но собственно корп.блог от части для этого и существует.
Хмм, ну можно попробовать посмотреть, не публиковал ли Яндекс каких научных статей на эту тему. Но я подозреваю, что там идёт какой-нибудь из более-менее стандартных алгоритмов семантического анализа данных, только «заточенный» под конкретные категории товаров.

Ну а вообще — коммерческая тайна же, кто тут алгоритмы будет расписывать?
У Гугла тоже коммерческая тайна, что не мешает научной статье о PageRank иметь десятки тысяч цитат и находиться в свободном доступе.
Как раз интересны-то не детали, а довольно общие вещи: что за алгоритм, да как заточен.

Кстати, если в области поиска смысл коммерческой тайны очевиден, то есть ли она в алгоритмах Маркета? Там ведь ранжирования никакого особенного нет, магазины, с сайтов которых система собирает данные, заранее известны — с ними и так об оптимизации договорились, YML тому пример.
А почему обязательно ранжирование? Конкурентов Маркета еще никто не отменял.
И да, о подобных алгоритмах всегда на mathlingvo почитать можно. И послушать. И даже посмотреть (:
Да, очень интересный сайт. Может порекомендуете подобные?
А что вас конкретно интересует?
Если б он умел на вопросы отвечать, по типу: «Will it blend?» «А на нем крузис пойдет?» или там «Full HD сможет воспроизводить?», сопоставив данные из разных источников, это уже будет круто. Я надеюсь, к тому и идет.
Я тоже на это надеюсь, что скоро в спецификациях производителя простыня параметров заменится на понятные пользователю вещи.
Мы решили дополнить наш арсенал по извлечению знаний компонентом, который получил название «Терморектальный анализатор».
на форуме оверклокеров есть ветки типа собираем игровой комп ценовые диапазоны а б в г. вот если бы такую базу яндексу, типа покажи ка мне на что проапгрейдится чтоб была топовая машинка, а теперь подешевле и чтоб разгонный потенциал и там ссылочки на обзоры оборудования, вот был бы гиковый сервис.
На самом деле система ответов на вопросы была очень полезной. Например:
«Комп, что бы пошёл Crysis 2», «Телек в большую команату, смотреть блюрей», «Мафон в пацансткую тачку» 8) и т.д.
это никому не нужно
как и долбанные голосовые и сенсорные технологии
А в конце хотелось бы прочитать примерно следующее: «вся эта радость доступна в виде API. вы можете загружать текст и получать распознанные характеристики, или запросить свойства конкретной модели. Подробное описание _тут_»
Такие идеи носятся в воздухе. А расскажите, пожалуйста, если мы сделаем такой сервис, то как Вы будете его использовать?
Первое, что приходит в голову. Большее количество магазинов захотят работать с маркетом, потому что смогут получить хорошую структуру свойств товаров. Следовательно сами разбираться не придется. В маркете же не придется повторно разбирать эти данные (не знаю как это происходит, но в случае, если интернет-магазин заливает данные, то в каждом случае нужно делать разбор и проверку, а если у магазина уже такая структура, то здесь получится немного сэкономить).
Ребята, есть что почитать на тему information retrieval? Поделитесь ссылками пожалуйста.
А какие библиотеки используются для получения информации, свои или, например, Apache UIMA?
Only those users with full accounts are able to leave comments. Log in, please.