Comments 31
Любопытно, попробую...
А будет ли доступна такая штука без приложения яндекс? То есть, чтобы со стороны пользователя нужно было поставить чудесное приложение и любой любимый браузер начинал местами работать без интернета? Я конечно не знаю на сколько правильно в мобильных платформах перехватывать часть трафика, чтобы заэмулировать ответ сервера, либо на сколько глючным и медленным будет браузерное расширение таких размеров, но принципиальных проблем для такого решения придумать не могу.
Второй вопрос: писали, что исходная база была порядков сотен МБ. То есть не космические размеры для современных железок. Можно ли будет выбирать размер, который могут занять словари? Я бы скачал минимум на железяку с 3-4 андроидом так как там места кот наплакал и сказал бы большое спасибо тем, кто уместил поиск в десятки метров, но и рад бы был скачать базу побольше в планшет (или новый телефон), так как места много и не жалко хоть пару гигов выделить для такого.
Ну и финальный вопрос: а в будущем будет расширение базы и её разделение под конкретные аудитории? Пример: хочу продолжать писать на любимом ruby/erlang/etc в самолёте, который 8 часов летит в Тай. Загружаю основную выдачу по руби и 40-80% ответов у меня уже есть. Можно не лезть в документацию, а юзать поисковик и радоваться жизни. Тут же будет интересно посмотреть на размеры таких тематических баз и получить первое оценочное представление о количестве "знаний", содержащихся в конкретной области.
Можно сделать тематический (с выбором по тегам) дамп stackoverflow и прикрутить к нему офлайн поисковик. Я б такой штукой пользовался часто.
С начала 2014 года полный дамп всей сети stackexchange загружается в интернет-архив https://archive.org/details/stackexchange, есть torrent (история: пост https://stackoverflow.blog/2009/06/04/stack-overflow-creative-commons-data-dump/, о переезде — https://stackoverflow.blog/tags/cc-wiki-dump/).
Список файлов — https://archive.org/download/stackexchange, на 15-Dec-2016 посты из stackoverflow занимают 9.6 ГБ в 7z (stackoverflow.com-Posts.7z). Архивы superuser, serverfault, askubuntu имеют размер по 600-500 МБ. Дамп обновляется 4 раза в год: https://meta.stackexchange.com/a/290254.
Для просмотра делали "StackDump" — http://stackapps.com/questions/3610/stackdump-an-offline-browser-for-stackexchange-sites — https://bitbucket.org/samuel.lai/stackdump/overview (JRE 6 solr + Python 2.5 web server).
Еще есть http://data.stackexchange.com/ с онлайн-доступом к свежему дампу.
тем ближе подходили к пониманию, что наш EDGE-поиск уже не просто ускоряет работу, а способен отвечать на широкий круг вопросов вообще без соединения с интернетом
Главное, чтобы этого не поняли ваши новые «эффективные менеджеры». А то они поймут, что весь яндекс умещается в 1 смартфоне и посокращают «лишний» штат…
Я очень рад, что гугл взялся за свою навигацию и делает серьезные и правильные шаги — только после этого яндекс начал хоть что-то делать в навигаторе.
А так же плюсую за настройки:
1) доступного объема хранимого кэша
2) и выбора тематики кэша: разработать классификацию из 20-40 вариантов максимум, выбор которых может отсечь совершенно ненужные в данный момент времени отрасли знаний (к примеру, биология, развлечения, игры, реклама :))
Т.е. чтобы был такой карманный поисковик только тех областей знаний, который нужен сейчас, в текущей работе, или в текущей поездке. Вплоть до кэширования только одной области знаний.
У этого ест такое понятие как Instant Answers — оно прямо соответствует вашему понятию «важные факты», которые вы отображаете (как я понял) без привязки к сайту, а просто вычленяя инфу на основе надёжного источника. Помимо этого, Instant Answers поддерживает специфичные запросы — например «linux cheat sheet», или " debian version vim". Мне кажется это отличное подполье для вас — ведь по факту, вы владеете информацией о пользователе (в большистве случаев), который пользуется вашим сервисом. Можно проанализировать подобные запросы (определить род его деятельность) и закинуть ответы на них в локальную базу. Например, если я имея акк-т на Яндексе постоянно ищу vim hotkeys, почему бы мне не иметь подобную табличку в локальном кэше? Тоже самое с другими областями — астрлогия (карты звёзд например), математика (таблицы, формулы итд). Что именно хранить, будет зависеть от конкретного пользователя.
Поиск без интернета. Новая бета приложения Яндекс