Как стать автором
Обновить
72
0
Oleg Bartunov @zen

Пользователь

Отправить сообщение
Скажу УУУффф, наконец !
УУУффф, потому как я и Федя сделали 58 версий интегрированного tsearch2, а потом еще и
утрясали окончательный синтаксис SQL-комманд. Главное - это теперь мы имеем встроенные типы для полнотекстового поиска с индексами и отстояли SQL интерфейс. А сам поиск - это просто обвязка вокруг, можно теперь писать сколько угодно новых, что народ уже и начал делать. Кстати, вот здесь изменения (может не все) от старого tsearch2 к встоенному -
http://www.sai.msu.su/~megera/wiki/Tsear…

Можно теперь думать о новых вещах (http://www.sai.msu.su/~megera/wiki/TODO), где спонсоры ?
у меня на стене висит блин от древнего ЕС-овского винчестера, смотрится шикарно. Многие даже не подозревают, что это есть такое.
да не нужны мне X, мне читать охота !
У меня LBook V3, купил перед НГ. Штука стоящая, но софт кривой. Он закрыт и не дают поковыряться. А так надо ждать обновления прошивки. Нативно понимает fb2, больше мне и не надо, хотя есть поддержка .rtf, pdf, djvu. Но все это медленно и неудобно. Батарея держит месяц, я даже не выключаю книжку. Сборка некачественная, но ничего не выпадает. Это не мешает. Работает под Linux 2.6.
Купил за 10000 руб, думаю, что реальная цена 6-7 тысяч, но уж больно мне технология нравится - читать на солнце реально удобно. Нет подсветки - меньше вреда глазам, качество как на бумаге, правда сероватой.
Мне кажется, что это все будет возможно только в будущем GGG. Просто еще одна социальная сеть - это уже слишком. Научник ведь тоже человек, он не может себя нарезать по разным плоскостям - по одноклассникам, по контактам, тесниться и кружиться. Это уже надоело,
время нужно для работы, а не для бегания по сетям. А вот, что действительно нужно новое - это новая инфраструктура информационного обмена в науке, но это тема отдельной статьи
используются веса лексем, рассстояние между лексемами.
Вот официальная документация
http://www.postgresql.org/docs/8.3/stati…
В новой версии 8.3 (скоро выйдет) поиск уже просто встроен в ядро и сходу поддерживаются почти все европейские языки. Русский, понятно, тоже. В качестве морфологии используются openoffice-кие словари, которых полно, ну и можно писать свои словари.
Зачем все это городить ? Никакой целостности вы не получите или придется еще чего придумывать. У вас появилась новая статья в БД, а с сфинксе ее нет, или наоборот, сфинкс нашел, а статью закрыли. Я ничего не имею против сфинкса, просто для хабра это лишний tier
мы задумывали поиск *полностью* интегрированный с БД. Представь, что хабр захочет показывать результаты поиска в зависимости от авторизационной информации. Например, есть статьи, которые не всем можно показать. Потом транзакционность (целостность) немаловажная штука.
Именно, с морфологией и стеммингом. Я как раз есть один из авторов этого поиска :) Делается в несколько SQL комманд
Если движок пользует постгрес, то поиск делается в течении нескольких минут.
Гугл - это круто, но иногда требуется доступ к метаданным.
Да, время p5p было супер. Я тогда принимал участие в
интернационализации перла, который не поддерживал тогда
локале (нативно) и надо было "наезжать" на Larry и объяснять зачем это было нужно.
Хорошо горячий финский парень поддержал. Потом после первой перловой конференции в Сан-Хозе мы с Ларри за это выпили.

Ларри, замечательный человек, страдает "mental" болезнью, давайте пожелаем ему
здоровья и удачи !
Вместо искейп с точкой мне удобнее написать !$.
Гарсиа-Молину уважаю. Он воспитал уйму известных сейчас
учеников. Какие впечатления о нем ?
Вот сижу я и смотрю на Distributed Storage
(http://tservice.net.ru/~s0mbre/old/?sect…)
и медитирую. Автор - наш парень, отзывчивый. Единственное,
что мне мешает - отсутствие времени, а так бы попробовал.
До этого пробовал chironfs + PostgreSQL, работает, но раз в 5 медленнее. Можно еще zfs под соляркой пробовать, но тоже говорят медленно. Зато репликация без проблем.
Я бы добавил ссылки на ряд сайтов, специализирующихся на этой тематике. Все-таки,
заметка является уж больно легким введением в проблему, где-то на уровне 2000 года.

Например:

http://www.highscalability.com/
http://www.royans.net/arch/
http://poorbuthappy.com/ease/archives/2007/04/29/3616/the-top-10-presentation-on-scaling-websites-twitter-flickr-bloglines-vox-and-more
http://www.possibility.com/epowiki/Wiki.jsp?page=Scalability


А для начала, я бы попрофилировал бы странички, много проблем будет заметно уже на этом этапе и может даже и шкалировать ничего не нужно :)
Вот нормальная тулза для этого:
http://tools.pingdom.com/fpt/

Олег
Мне нравится, еще бы динамики прибавить. Скажем, сижу я в кафе, работаю, в смысле. Меня определяют и предлагают познакомиться с девушкой, которая за соседним столом тоже залогинилась на сервер и что-то пишет. Только кто разберется в наших ip-сетях !

Информация

В рейтинге
Не участвует
Откуда
Москва и Московская обл., Россия
Работает в
Зарегистрирован
Активность