Comments 31
1й коммент
-25
UFO just landed and posted this here
Интереснее в блогах обзоры читать, ИМХО. Покороче и по делу, жаль что Яндекс не собирает и такие обзоры.
+1
Доброе утро. Мы собираем обзоры только с проверенных сайтов, например, mobile-review.com. В блогах, к сожалению, редко можно найти стоящие обзоры. У вас есть примеры таких обзоров?
0
Я их не собираю. Когда собираюсь что-то купить, ищу тем же Яндексом.
Может вам просто к товару помимо того, что есть добавить поиск обзоров, типа «найти другие обзоры». И написать алгоритм поиска этих обзоров.
Вот могу свой обзор Samsungа только показать, или Panasonicа гыгы))
Но если серьезно, то про хлебопечку подобную я у вас обзоров не нашел, написал сам. И только чуть позже появилось еще пара обзоров в блогах, на Маркете в это время ничего не было.
Может вам просто к товару помимо того, что есть добавить поиск обзоров, типа «найти другие обзоры». И написать алгоритм поиска этих обзоров.
Вот могу свой обзор Samsungа только показать, или Panasonicа гыгы))
Но если серьезно, то про хлебопечку подобную я у вас обзоров не нашел, написал сам. И только чуть позже появилось еще пара обзоров в блогах, на Маркете в это время ничего не было.
0
Интересно было бы прочитать про технологии. Пока сказка, какая-то: «жил-был Формализатор».
+2
Написано немного в игровой форме, а какие подробности Вас интересует помимо того, что мы рассказали?
0
Использующиеся технологии, примерная структура формилизатора. Про любые технические подробности было бы интересно.
0
Хотя даже не столько технические, сколько архитектурные подробности интересуют.
0
Архитектурно выглядит так:
Есть веб-сервис, в котором знания о предметной области настраиваются в xml конфигурации. На вход подаётся текст и тип предметной области, а на выходе после разбора получаем пары ключ-значение.
Для контент-менеджеров в бэкофисе есть интерфейс редактирования предметной области, а также интерфейс формализации предложений для обработки новых предложений.
Есть веб-сервис, в котором знания о предметной области настраиваются в xml конфигурации. На вход подаётся текст и тип предметной области, а на выходе после разбора получаем пары ключ-значение.
Для контент-менеджеров в бэкофисе есть интерфейс редактирования предметной области, а также интерфейс формализации предложений для обработки новых предложений.
+1
Конечно, гиковская статья. Вот только итак понятно, что есть «некий формализатор».
Более интересно узнать как работает этот самый формализатор, описание которое приведено в тексте слишком очевидно…
Повторюсь, статья хорошая, но гиковского в ней мало… и она больше похожа на рекламу, но собственно корп.блог от части для этого и существует.
Более интересно узнать как работает этот самый формализатор, описание которое приведено в тексте слишком очевидно…
Повторюсь, статья хорошая, но гиковского в ней мало… и она больше похожа на рекламу, но собственно корп.блог от части для этого и существует.
+8
Хмм, ну можно попробовать посмотреть, не публиковал ли Яндекс каких научных статей на эту тему. Но я подозреваю, что там идёт какой-нибудь из более-менее стандартных алгоритмов семантического анализа данных, только «заточенный» под конкретные категории товаров.
Ну а вообще — коммерческая тайна же, кто тут алгоритмы будет расписывать?
Ну а вообще — коммерческая тайна же, кто тут алгоритмы будет расписывать?
-1
У Гугла тоже коммерческая тайна, что не мешает научной статье о PageRank иметь десятки тысяч цитат и находиться в свободном доступе.
Как раз интересны-то не детали, а довольно общие вещи: что за алгоритм, да как заточен.
Кстати, если в области поиска смысл коммерческой тайны очевиден, то есть ли она в алгоритмах Маркета? Там ведь ранжирования никакого особенного нет, магазины, с сайтов которых система собирает данные, заранее известны — с ними и так об оптимизации договорились, YML тому пример.
Как раз интересны-то не детали, а довольно общие вещи: что за алгоритм, да как заточен.
Кстати, если в области поиска смысл коммерческой тайны очевиден, то есть ли она в алгоритмах Маркета? Там ведь ранжирования никакого особенного нет, магазины, с сайтов которых система собирает данные, заранее известны — с ними и так об оптимизации договорились, YML тому пример.
+2
И да, о подобных алгоритмах всегда на mathlingvo почитать можно. И послушать. И даже посмотреть (:
0
А что вас конкретно интересует?
0
Если б он умел на вопросы отвечать, по типу: «Will it blend?» «А на нем крузис пойдет?» или там «Full HD сможет воспроизводить?», сопоставив данные из разных источников, это уже будет круто. Я надеюсь, к тому и идет.
+1
Мы решили дополнить наш арсенал по извлечению знаний компонентом, который получил название «Терморектальный анализатор».
+3
на форуме оверклокеров есть ветки типа собираем игровой комп ценовые диапазоны а б в г. вот если бы такую базу яндексу, типа покажи ка мне на что проапгрейдится чтоб была топовая машинка, а теперь подешевле и чтоб разгонный потенциал и там ссылочки на обзоры оборудования, вот был бы гиковый сервис.
-1
На самом деле система ответов на вопросы была очень полезной. Например:
«Комп, что бы пошёл Crysis 2», «Телек в большую команату, смотреть блюрей», «Мафон в пацансткую тачку» 8) и т.д.
«Комп, что бы пошёл Crysis 2», «Телек в большую команату, смотреть блюрей», «Мафон в пацансткую тачку» 8) и т.д.
+1
А в конце хотелось бы прочитать примерно следующее: «вся эта радость доступна в виде API. вы можете загружать текст и получать распознанные характеристики, или запросить свойства конкретной модели. Подробное описание _тут_»
+7
Такие идеи носятся в воздухе. А расскажите, пожалуйста, если мы сделаем такой сервис, то как Вы будете его использовать?
0
Первое, что приходит в голову. Большее количество магазинов захотят работать с маркетом, потому что смогут получить хорошую структуру свойств товаров. Следовательно сами разбираться не придется. В маркете же не придется повторно разбирать эти данные (не знаю как это происходит, но в случае, если интернет-магазин заливает данные, то в каждом случае нужно делать разбор и проверку, а если у магазина уже такая структура, то здесь получится немного сэкономить).
0
Ребята, есть что почитать на тему information retrieval? Поделитесь ссылками пожалуйста.
0
Introduction to Information Retrieval — очень толковая книга, о чем говорят в том числе и отзывы, приведенные на сайте Amazon.
0
А вот рекомендованная выше книга в доступном для чтения виде:
nlp.stanford.edu/IR-book/information-retrieval-book.html
И еще можно посмотреть:
singhal.info/ieee2001.pdf
www.scribd.com/doc/13742235/Information-Retrieval-Data-Structures-Algorithms-William-B-Frakes
nlp.stanford.edu/IR-book/information-retrieval-book.html
И еще можно посмотреть:
singhal.info/ieee2001.pdf
www.scribd.com/doc/13742235/Information-Retrieval-Data-Structures-Algorithms-William-B-Frakes
0
А какие библиотеки используются для получения информации, свои или, например, Apache UIMA?
0
Only those users with full accounts are able to leave comments. Log in, please.
Извлечение знаний на службе у Яндекс.Маркета