Pull to refresh

Конкурент Google стал ближе к своей мечте

Lumber room
Поисковый стартап Powerset, как стало известно сегодня, получил лицензию на использование технологий, разработанных в Palo Alto Research Center (PARC). Конкурент Google стал чуть ближе к своей мечте.

О компании Powerset стало известно не так давно, однако она успела наделать шуму в интернет-тусовке своими намерениями потягаться с лидером поискового рынка – Google. Основным преимуществом будущего поисковика сами разработчики считают то, что он будет понимать нормальный человеческий язык. Они ругают Google за то, что для него различные предлоги и союзы не являются значимыми: например, «книги для детей» (“book for children”), «книги, написанные детьми» (“book by children”) и «книги о детях» (“book about children”) — эти три фразы для нынешних поисковиков равнозначны.

Powerset и PARC заключили соглашение, в соответствии с которым амбициозная компания получает права на использование технологии «натурального языка», которая и станет основой поисковика. Технология пока «справляется» только с английским, французским и некоторыми другими европейскими языками.

Финансовая сторона сделки не разглашается; всё, о чём мы знаем сейчас – это 2 показателя: $12,5 млн. (столько получила Powerset в ходе первого раунда инвестиций) и 30 лет (столько было потрачено на разработку технологии). Также известно, что PARC получит роялти за её использование и долю в Powerset. А президент PARC Марк Бернштейн говорит, что это – одно из из крупнейших соглашений за историю Центра.

Pal Alto Research Center – организация с давней историей. В начале XXI века компания Xerox решила избавиться от «непрофильного актива», который она просто не могла содержать. В 2002 году Центр был выделен из структуры компании. В своём новом виде он смог не только удержать за собой звание одного из ведущих исследовательских центров США, но и наладить эффективное сотрудничество как с научными организациями, так и с коммерческими фирмами. Больше половины исследований PARC до сих пор финансируется компанией Xerox, однако Центр сотрудничает с Fujitsu, Dai Nippon Printing и др. Направления исследований PARC разнообразны: к примеру, совместно с Scripps Research Institute (Сан-Диего) разрабатывается технология, которая позволит выявлять раковые заболевания на ранних стадиях с помощью лазера, используемого сейчас в принтерах, а совместно с компанией SolFocus идёт работа над технологиями использования солнечной энергии.

В Силиконовой долине и за её пределами PARC называют «лабораторией упущенных возможностей»: именно там велись работы над графическим пользовательским интерфейсом и Ethernet, однако «коммерциализировались» эти разработки другими.

Эксперты неоднозначно оценивают перспективы сотрудничества PARC и Powerset. К примеру, Фернандо Перейра, профессор Университета Пенсильвании, говорит, что эта технология – безусловно прогрессивна и интересна, однако её приобретение не гарантирует Powerset победы в гонке с Google. Неизвестно, сколько времени понадобится на доведение нового поисковика «до ума», хотя разработчики говорят о конце 2007 года как планируемой дате для официального его представления. Зато чётко известно, что любая технология не застрахована от ошибок.
Total votes 31: ↑28 and ↓3 +25
Views 267
Comments 27

Microsoft покупает семантический поисковик за $100 млн

Search engines *
Один из самых перспективных разработчиков технологий семантического (смыслового) поиска, компания Powerset, переходит в собственность Microsoft. По неофициальной информации, сумма сделки может составлять около $100 млн. Это нормальная цена для стартапа, который называли потенциальным конкурентом Google.

Технологии семантического поиска подразумевают, что поисковик пытается анализировать истинный смысл каждого поискового запроса, что на порядок повышает качество выдачи. Как видно на скриншоте (это версия Powerset под iPhone), технология способна находить синонимы фраз (“pat’s rocket” = “Roast Beef”) и учитывать их при поиске.

Однако, многие эксперты оспаривают реальность воплощения в жизнь теории семантического поиска, и даже Google находит эту технологию лишь частично интересной. Наняв в штат нескольких специалистов по семантическому поиску, она всё-таки не применяет её в полной мере. На самом деле семантический поиск выглядит революционным только в теории, а на практике пока никто не смог его нормально реализовать.
Читать дальше →
Total votes 32: ↑29 and ↓3 +26
Views 519
Comments 18

PowerSet подвинет Google?

Lumber room
Translation
Сам я ещё не видел презентацию поискового движка Powerset, но уже многие рассказывали о том, что после увиденного они больше никогда не будут пользоваться Гуглом.

Цель Powerset — дать людям возможность использовать привычные словосочетания при поиске, в том числе и те слова, которые поисковики сейчас игнорируют. Как и многие другие, мне пришлось научиться менять свой традиционный язык при общении с поисковыми сайтами. Я использовал только ключевые слова, отбрасывая всё остальное. Отчасти эта привычка стала для меня нормой даже в общении с людьми, до такой степени, что переговоры в мессенджере или по электронной почте иногда казались забитыми какими-то лишними, бессмысленными словами!

Несмотря на то, что я не считаю нынешние поисковые сервисы совершенными, я всё же не задумывался над проблемой того, что они не понимают нормальный человеческий язык. Откровенно говоря, я бы предпочёл развивать это умение — общаться так, чтобы нас понимали компьютеры, так как это поможет прогрессу в других высокотехнологичных сферах.

Но Pell приводит убедительный аргумент: поиск с использованием нормального языка важен с точки зрения понимания смысла. Он демонстрирует пример в доказательство своей точки зрения — «книги для детей» (“book for children”), «книги, написанные детьми» (“book by children”) и «книги о детях» (“book about children”); эти три фразы для нынешних поисковиков будут равнозначны. То есть его главный аргумент таков: мы просто не сможем корректно выразить своё желание найти книги, написанные детьми, без использования нормального языка.

Для запуска Powerset требуются солидные финансовые средства. Венчурные инвесторы — всегда отличный источник слухов (особенно когда они отказались от сделки или упустили её). При всём уважении к Powerset, ходят слухи, что компания хочет найти 10 миллионов долларов на проект, для запуска которого, по оценкам экспертов, требуется 20. Это действительно серьёзная сумма, но если вдруг Powerset подвинет Гугл — кто вспомнит о ней!..
Total votes 11: ↑11 and ↓0 +11
Views 413
Comments 1

Семантический поиск: мифы и реальность

Semantics *
Translation

О семантическом поиске говорят уже на протяжении нескольких лет. Любая технология, которая сможет сместить Google с вершины, вызывает всеобщий интерес. Особенно если речь идет о долгожданной и часто обсуждаемой возможности семантического поиска. Однако нас ни столько интересует прогресс в этой области, сколько огорчает отсутствие реальных результатов проводимых исследований, ведь итоги поиска не так уж и сильно отличаются от итогов поиска Google. В чем же дело?

Например, при вводе в строку поиска «Столица Франции», оба метода дают один и то же правильный ответ: «Париж». Кроме того, большинство запросов, которые мы вбиваем в строку поиска в виде аббревиатур, дают те же результаты, если вводить термин полностью. Очевидно, что тут что-то не так. Всем известно, что семантические технологии способны на многое, но почему? И как они работают? Ознакомившись с этой статьей, вы узнаете, что на самом деле, мы просто-напросто задаем не те вопросы.
Читать дальше →
Total votes 41: ↑41 and ↓0 +41
Views 21K
Comments 31

Как я отказался от $300 000

Self Promo
Translation
Когда нам по двадцать с копейками лет, когда нам, по большому счету, нечего терять, у нас есть время, навыки и жадность риска, почему бы не предпринять Попытку Всей Жизни? Если ничего не удастся — а у большинства это будет именно так — то конца света не наступит. Но если удастся, то представьте себе награду.
Говорит Tom Preston-Werner
Total votes 123: ↑103 and ↓20 +83
Views 3.2K
Comments 72