Андрей Коваленко (Keva) @Keva
Искатель
Информация
- В рейтинге
- Не участвует
- Откуда
- Москва и Московская обл., Россия
- Работает в
- Дата рождения
- Зарегистрирован
- Активность
Специализация
Backend Developer, Software Architect
Lead
Software development
C++
Algorithms and data structures
Git
Linux
High-loaded systems
Design
English
C
PHP
Да, конечно.
Однако у нас стоит немного другая задача - хранить поисковые ключи в оглавлении обратного индекса. Там и лексемы в их морфологическом представлении; и иероглифы - фактически, строки; и числа.
Физическое представление такого оглавления - разного рода деревья, например, префиксное или patricia. Ключ - последовательность байт. Поиск по диапазону - поиск первого GE ключа для нижней границы и последовательная выборка ключей, пока LE верхней границе.
Если физический int туда повесить - сортировка для него будет на каких-то программно-аппаратных платформах правильной, на каких-то - обратной.
Добрый день.
Есть такое развлечение - смотрите книги по запросу 'information retrieval', и почти все будут путными. Статьи, в том числе и, конечно же, на habr.
Ну и общение с себе подобными :)
Я, кстати, запланировал публикацию подробной статьи по морфологическому анализатору, но сделаю только когда дойдут руки выложить украинский и английский вдобавок к русскому. Пока для этих языков в репозитории только намёки.
Автор исходит из посыла, что мечта и цель каждого - руководить людьми.
Что, конечно, не соответствует действительности.
Зачастую руководство людьми - вынужденная деятельность, и ее иногда можно избежать.
Я бы подкорректировал тут одну орфографическую ошибку :) У Танчика в новом проекте не "тоже", а "тот же" поисковый движок стоит :) Да, Лёша? :)