Это индексирование в чистом виде. К тому же документы могут дублироваться и не имеют простой структуры.
То есть связь между найденным ранжиром словоформ и ссылками из них на закешированные документы вы отказываетесь называть реляционной? Вы уверены, что вам не стоит внимательно вчитаться в указанное вами определение и разобраться как работает "реляционная база данных"? Напомню что индексы являются неотъемлемой частью алгоритмов поиска по реляционной базе данных.
А насколько мне известно, ни один из крупных поисковиков в том числе и Яндекс не использует реляционные СУБД. Если считаете что Яндекс использует оракл советую скачать Яндекс Сервер и поискать его там.
На чём основана уверенность, что движок базы, отданной в открытое пользование обязан быть тем же самым, какой используется в оригинале? Даже чисто теоретически, если Яндекс работает на Oracle, то отдавать его в открытое пользование они не имеют права, а заменить на менее производительную и более простую в обслуживании базу логично со всех сторон. Точно то же самое могу сказать про Google Desktop незачем пользователю на своём компе полностью повторять глобальную кластерную систему, поскольку ни потребностей ни возможностей для этого нет.
Если вы не поняли, то под большими записями понимались записи объемом больше 64кб. Так как обычно СУБД содержимое блобов неиндексируется. В результате поиск по таким полям без каких либо специальных средств довольно нехило тормозит. Если у вас какие-то аргументы против приводите.
Вот теперь понятно откуда растут ноги у вашего заблуждения. Вы решили, что ограничения присущие Mysql (а именно их вы назвали) являются естественными ограничениями самой реляционной модели. Это я назову чушью, наравне с предыдущим заявлением о низкой скорости поиска. Попробуйте ознакомиться с другими СУБД. Уверяю вас скорости работы и возможности поиска у промышленных движков БД значительно выше, чем вы думаете. Кроме того простой индексный движок Google Desktop созданный для настольных ПК может удивить вас своей производительностью.
Хотя бы потому, что использование статических путей вне этой идеологии существенно быстрее. Так как алгоритмы проще и объем данных меньше.
Это не нам с вами решать. Когда-то было невозможно иметь на домашнем компьютере глобус из спутниковых карт и такие как вы заклевали бы любого, кто пикнул такую дерзкую мысль. Но сейчас Google Earth есть наверняка и у вас и всё благодаря тем, кто посчитал для себя задачей то, что другие посчитали невозможным.
Любая база данных имеет жесткую иерархию заданную на стадии проектирования. Конечно она может расширяться, но многие изменения могут быть трудоемки.
Вы никогда не делали базы из динамических справочников? Нет ничего сложного в том, чтобы задавать свойства и поля налету руководствуясь реляционной моделью. Для этого даже не нужно менять существующие таблицы связки из трёх таблиц достаточно для того, чтобы сделать расширяемым любой объект.
К тому же вы забываете, что файловая система хранит в себе слабоструктурированные данные. О том что внутри файлов находится она не знает.
База данных никогда не знает что в ней находится. Это дело программ фронтэнда.
Кстати один из вариантов решения этой проблемы есть в haiku. Это статические запросы к поисковому движку. Выглядят как папки. Если появляется новый файл подпадающий под критерий поиска он появлятеся в папке.
Точно то же самое я написал вам в прошлом комментарии. =) Вы непоследовательны.
Вы говорили, что лицензия обязывает распрастранять ПО бесплатно.
Косвенно. Поскольку прямо запрещает требовать соответствия числа копий числу ваших продаж.
Не вижу в этом никакой проблемы. Просто вам дали полные права распоряжения вашей собственностью. К примеру если вы купили у меня молоток, а затем он вам стал не нужен и вы решили его продать, то с какой стати вы должны мне отдавать часть полученной с продажи прибыли? Да ни с какой.
А если вы купили у картину знаменитого художника. Растиражировали её с нулевыми затратами и стали зарабатывать её продажей (напоминаю каждая копия и есть оригинал) не делясь с художником прибылью? Он создавал творение, а вы снимаете сливки?
Не понятно только зачем. Я что-то вашей мысли не улавливаю. Может объясните почему вы считаете, что из лицензии GPL следует, что софт использующий ее обязан быть бесплатным? Из-за того что третьи лица не выплачивают лицензионных отчислений? Так это не основание, это возможность.
Открытый софт является бесплатным хотя бы потому, что требовать за него оплату с третьих лиц вы не можете.
Кстати могу привести хороший пример аналогичного платного цифрового контента. Это музыкальный контент в AppleStore незащищенный DRM. И как не странно его покупают. Единственная разница только в том, что на данный момент я не могу его ни продать и ни дать.
DRM защищает физически то, что защищено законом, а GPL препятствует защите коммерческих интересов автора в распространении его продукта.
Для того чтобы получился хороший программный продукт и он мог развиваться дальше желательно иметь волнение за судьбу творения.
Повторяю ещё раз "вы можете волноваться за судьбу отданного, но это не будет альтруизмом". точка.
Как странно у вас сочетается волнение за судьбу творения с невозможностью получения прибыли от непрямых продаж. Вы против лицензии для альтруистов, хотя можете просто не пользоваться ею. И вы против коммерческой лицензии, хотя за получение прибыли от продажи. И не нужно прикрываться Столменом он видит заработок не в продаже продукта, а в продаже услуг поддержки.
Реляционные базы данных в системах поиска практически никто не использует
Насколько мне известно Яндекс построен на Oracle. Или это по-вашему тоже неряционная БД? =)
К тому же у гугла используются кластеры.
Oracle отлично кластеризуется. А кластеры Google выполняют не только роль распределённого поиска.
Господа в MS заявляли что она будет близка к реляционной базе данных.
Ну что ж, это не так и плохо. Просто нужно понять какая идеология за этим стоит.
А эти СУБД слабо заточены под работу с действительно большими записями.
Чушь.
Не уступит. Так как эта идеология не позволит находить что либо без поиска.
Кто вам сказал что эта идеология не может включать статических путей по индексам? Рановато вы делаете выводы на мой взгляд.
К тому же теги и ключевые слова, как собственно и связи можно легко реализовать и на NTFS используя расширенные аттрибуты.
Но при этом сама структура fs останется иерархической? Так ведь именно жесткая иерархия и есть "пятое колесо" при хранении больших объёмов данных. Думаю именно от неё и пытаются избавиться при помощи реляционной модели. Кроме того создание отношений между объектами может сильно помочь в удобстве работы с fs. Наверно у вас в голове просто пока не укладывается как fs может быть гибкой и способ доступа к данным может зависить от их типа. Ну поживём увидим как это объяснят потребителю.
Отчего же до вашего предыдущего поста я был уверен, что ничего толкового для работы с ntfs из linux/freebsd до сих пор нет (доступ на чтение это ведь не серьёзно). Спасибо, что показали этот продукт. Обязательно пощупаю.
Единственное, что в случае продажи такого ПО необходимо предоставить исходные коды согласно лицензии GPL . А далее вы согласно лицензии можете опять же его продать или бесплатно распрастранять.
Я именно про это и говорю. Не вижу с чем вы тут спорите.
Сама лицензия никаких ограничений на получение комерческой выгоды от кода не накладывает.
Она прямо разрешает распространение вашего кода третьими лицами без учёта вашей коммерческой выгоды. Т.е. вы не имеете право требовать оплаты каждой используемой копии. (Поскольку ваш покупатель имеет право передать программу без каких-либо согласований с вами)
Для соблюдения лицензии софт может быть и не бесплатным. Лицензия не ограничивает ваши права на продажу.
Ваши права на продажу она ограничивает в части гарантий по выплатам третьих лиц. Для примера Microsoft является единственным получателем лицензионных платежей по своим программам, а посредники имеют лишь процент от сделки между пользователем и Microsoft. Такая ситуация невозможна с GPL и это не нравится Microsoft, что я и упомянул.
Она лишь добавляет права делать с ПО тоже самое что вы делаете с предметами материального мира.
ПО не имеет никакого отношения к предметам материального мира. Слишком много различий, например покупатель предмета материального мира не имеет возможности воспроизвести сколько угодно точных копий этого объекта.
а возникающие в результате такой либеральной лицензии механизмы. В случае GPL лицензии если я взял какое-то ПО и каким образом его модифицировал, мне прийдется этот код модификации делать доступным. Т.е. существует обратная связь. В случае же с BSD лицензии я этого могу и не делать, в результате обмен кодом в ПО под GPL лицензией идет более активно нежели, чем в ПО под лицензией BSD.
Это и есть осуждение альтруизма. Альтруист не руководствуется интересами "активности обмена кодом" его стремление лишь в том, чтобы без любых задних мыслей поделиться своим творением. Как только появилось хоть одно ответное условие или даже просто волнение за судьбу своего творения это уже не альтруизм.
С чего вы взяли, что производительность может уменьшиться?
Google тратит на поиск и воспроизведение искомого объекта в базе из десятка милиарда страниц менее секунды. База в качестве fs как раз идеально служит производительности и снимает ограничения на длинну пути к объекту (как и само понятие пути упраздняет). Налицо совершенно другая идеология, но она пока не всем понятна мало для кого очевидно, что нынешняя древовидная структура fs может уступить место тэгам, ключевым словам и реляционным связям между объектами.
Еще раз спрашиваю где в лицензии GPL фраза про то что лицензия GPL обязует распрастранять ПО бесплатно?
Согласно пояснениям к GPL она предоставляет получателями программ право свободного распространения. Если это для вас не основание считать бесплатность достаточным усливием соблюдения лицензии, то даже не знаю как до вас достучаться.
Теоретически вы можете попытаться продать вашу программу, но первый же покупатель не несёт никакой ответственности перед вами, раздавая её бесплатно вместе с кодом. Что же до людей, способных собрать программу из исходных кодов, то с них вы деньги не можете требовать и подавно вы обязаны отдать им исходники без ограничений. Если библиотека, которую вы использовали в своей программе лицензирована под GPL, то ваша программа также попадает под GPL. Именно для того, чтобы разрешить коммерческое использование немодифицированных свободных библиотек и была придумана LGPL. Вы можете использовать LGPL-библиотеку в пропиетарной программе при условии, что не модифицируете её код.
Лицензия BSD плоха тем, что любые модификации ПО даже полезные для этого ПО могут быть закрыты и никогда не смогут попасть к автору первоначального ПО.
Она придумана для тех, кто согласен делиться своими наработками полностью без каких либо условий. Никто не заставляет лицензировать код под этой лицензией. А осуждение альтруизма очень опасное занятие.
tcp/ip стека FreeBSD в Windows нет
можете как-то подтвердить свои слова? Поскольку Hotmail утверждает обратное (к сожалению потерял ссылку на переписку Hotmail с Microsoft в момент перехода с FreeBSD на Windows).
Думаю делать fs в качестве базы только для поиска неразумно. Предполагаю, что имеет место попытка системного перехода от листинговой модели (папки/файлы) к поисковой.
Спор про Linux/FreeBSD продолжать не хочу в нём нет возможности оказаться правым на любой позиции. Спор о вкусах также бесполезен. Считаю, что видовое разнообразие лучше, чем "единая линия партии".
Лицензия GPL требует предоставлять открыто код любой программы, в которой использован код лицензированный под GPL. Там же написано, что любой, получивший от вас код, подпадающий под GPL вне зависимости от вашей воли может бесплатно отдать его третим лицам без соблюдения вашей коммерческой выгоды. И чётко указано, что использование в своих программах кода GPL обязывает вас распространять и ваш продукт под GPL (именно этот аспект Балмер называет проказой).
Лицензия BSD даёт право получать выгоду от использования BSD-кода в проперитарной программе без каких либо ограничений. Согласно лицензии BSD никто не обязан раздавать в открытом виде свой код, в котором используются части лицензированные под BSD, а также не обязан свою программу распространять под данной лицензией.
PS я даже рад, что Microsoft научил свой Windows менять IP-адреса без необходимости перезагрузки. И сделано это благодаря настойчивости коллектива Hotmail и коду IP-стека от FreeBSD.
Вы всё время нарываетесь на священные войны?
Поверьте, FreeBSD в хороших руках ничем не хуже Linux (а местами и получше будет). Другое дело, что вы пытаетесь спорить о вкусах, а это гнилое дело. Судя по вашим предыдущим постам у вас вряд ли даже найдётся достаточно аргументов в руках, но вы всё туда же лишь бы пободаться.
когда что-то работает, при чем работает удобно — это незаметно.
Вот именно. А если вспомнить как редко и по какой причине пользователю приходится смотреть на автоматически стартовавший scandisk то такое преимущество ntfs нельзя назвать таким уж преимуществом. Вы думаете имея возможность рубить питание компьютера пользователи не смогут обнаглев испортить-таки данные на винчестере? Смогут! И никакое журналирование не спасёт. =)
А вот смыслы обсуждения мы видим разные. Эта ветка пошла от Dreamveawer. Средств позволяющих визуально/параметрически разрабатывать html на Linux я пока не встречал. К таковым относятся FrontPage и Dreamveawer, но они не только платные, как вы заметили, но и под windows.
Я сам предпочитаю писать код руками, но приемлемого инструмента, позволяющего экономить время в таком же масштабе как это делают визуальщики с Dereamveawer я пока достичь не могу.
Чем мне действительно понравилась Aptana (какраз взялся разбираться) так это библиотеками Snippet. Eсли получится затолкнуть туда макросами прежние наработки, то возможно удастся достичь хорошей скорости написания кода. Надеюсь туда же получится подключить модули для автоматизации XSLT и Smarty.
=)
Zend Studio также на движке eclipce сделан и тоже эталоном высокой скорости реакции не является.
Мне нравится функционал eclipse но если сравнивать скорость реакции на действия и скорости отрисовки интерфейса то на одном и том же компьютере TopStyle субъективно работает быстрее, чем Eclipse. (Конечно надо попробовать и сравнить с Aptana)
То есть связь между найденным ранжиром словоформ и ссылками из них на закешированные документы вы отказываетесь называть реляционной? Вы уверены, что вам не стоит внимательно вчитаться в указанное вами определение и разобраться как работает "реляционная база данных"? Напомню что индексы являются неотъемлемой частью алгоритмов поиска по реляционной базе данных.
На чём основана уверенность, что движок базы, отданной в открытое пользование обязан быть тем же самым, какой используется в оригинале? Даже чисто теоретически, если Яндекс работает на Oracle, то отдавать его в открытое пользование они не имеют права, а заменить на менее производительную и более простую в обслуживании базу логично со всех сторон. Точно то же самое могу сказать про Google Desktop незачем пользователю на своём компе полностью повторять глобальную кластерную систему, поскольку ни потребностей ни возможностей для этого нет.
Вот теперь понятно откуда растут ноги у вашего заблуждения. Вы решили, что ограничения присущие Mysql (а именно их вы назвали) являются естественными ограничениями самой реляционной модели. Это я назову чушью, наравне с предыдущим заявлением о низкой скорости поиска. Попробуйте ознакомиться с другими СУБД. Уверяю вас скорости работы и возможности поиска у промышленных движков БД значительно выше, чем вы думаете. Кроме того простой индексный движок Google Desktop созданный для настольных ПК может удивить вас своей производительностью.
Это не нам с вами решать. Когда-то было невозможно иметь на домашнем компьютере глобус из спутниковых карт и такие как вы заклевали бы любого, кто пикнул такую дерзкую мысль. Но сейчас Google Earth есть наверняка и у вас и всё благодаря тем, кто посчитал для себя задачей то, что другие посчитали невозможным.
Вы никогда не делали базы из динамических справочников? Нет ничего сложного в том, чтобы задавать свойства и поля налету руководствуясь реляционной моделью. Для этого даже не нужно менять существующие таблицы связки из трёх таблиц достаточно для того, чтобы сделать расширяемым любой объект.
База данных никогда не знает что в ней находится. Это дело программ фронтэнда.
Точно то же самое я написал вам в прошлом комментарии. =) Вы непоследовательны.
Косвенно. Поскольку прямо запрещает требовать соответствия числа копий числу ваших продаж.
А если вы купили у картину знаменитого художника. Растиражировали её с нулевыми затратами и стали зарабатывать её продажей (напоминаю каждая копия и есть оригинал) не делясь с художником прибылью? Он создавал творение, а вы снимаете сливки?
Открытый софт является бесплатным хотя бы потому, что требовать за него оплату с третьих лиц вы не можете.
DRM защищает физически то, что защищено законом, а GPL препятствует защите коммерческих интересов автора в распространении его продукта.
Повторяю ещё раз "вы можете волноваться за судьбу отданного, но это не будет альтруизмом". точка.
Как странно у вас сочетается волнение за судьбу творения с невозможностью получения прибыли от непрямых продаж. Вы против лицензии для альтруистов, хотя можете просто не пользоваться ею. И вы против коммерческой лицензии, хотя за получение прибыли от продажи. И не нужно прикрываться Столменом он видит заработок не в продаже продукта, а в продаже услуг поддержки.
У гугла собственная распределённая база. Это факт. Но то, что она нереляционная притянуто за уши. "Прямой индекс содержит идентификаторы документов (docID), каждому из которых соответствует список идентификаторов слов (wordID). При поиске же используется инвертированный индекс. В нем, наоборот, каждому wordID соответствует docID-список. Хит-листы используются в обоих индексах." всё это полностью соответствует реляционной модели.
Насколько мне известно Яндекс построен на Oracle. Или это по-вашему тоже неряционная БД? =)
Oracle отлично кластеризуется. А кластеры Google выполняют не только роль распределённого поиска.
Ну что ж, это не так и плохо. Просто нужно понять какая идеология за этим стоит.
Чушь.
Кто вам сказал что эта идеология не может включать статических путей по индексам? Рановато вы делаете выводы на мой взгляд.
Но при этом сама структура fs останется иерархической? Так ведь именно жесткая иерархия и есть "пятое колесо" при хранении больших объёмов данных. Думаю именно от неё и пытаются избавиться при помощи реляционной модели. Кроме того создание отношений между объектами может сильно помочь в удобстве работы с fs. Наверно у вас в голове просто пока не укладывается как fs может быть гибкой и способ доступа к данным может зависить от их типа. Ну поживём увидим как это объяснят потребителю.
Я именно про это и говорю. Не вижу с чем вы тут спорите.
Она прямо разрешает распространение вашего кода третьими лицами без учёта вашей коммерческой выгоды. Т.е. вы не имеете право требовать оплаты каждой используемой копии. (Поскольку ваш покупатель имеет право передать программу без каких-либо согласований с вами)
Ваши права на продажу она ограничивает в части гарантий по выплатам третьих лиц. Для примера Microsoft является единственным получателем лицензионных платежей по своим программам, а посредники имеют лишь процент от сделки между пользователем и Microsoft. Такая ситуация невозможна с GPL и это не нравится Microsoft, что я и упомянул.
ПО не имеет никакого отношения к предметам материального мира. Слишком много различий, например покупатель предмета материального мира не имеет возможности воспроизвести сколько угодно точных копий этого объекта.
Это и есть осуждение альтруизма. Альтруист не руководствуется интересами "активности обмена кодом" его стремление лишь в том, чтобы без любых задних мыслей поделиться своим творением. Как только появилось хоть одно ответное условие или даже просто волнение за судьбу своего творения это уже не альтруизм.
Google тратит на поиск и воспроизведение искомого объекта в базе из десятка милиарда страниц менее секунды. База в качестве fs как раз идеально служит производительности и снимает ограничения на длинну пути к объекту (как и само понятие пути упраздняет). Налицо совершенно другая идеология, но она пока не всем понятна мало для кого очевидно, что нынешняя древовидная структура fs может уступить место тэгам, ключевым словам и реляционным связям между объектами.
Согласно пояснениям к GPL она предоставляет получателями программ право свободного распространения. Если это для вас не основание считать бесплатность достаточным усливием соблюдения лицензии, то даже не знаю как до вас достучаться.
Теоретически вы можете попытаться продать вашу программу, но первый же покупатель не несёт никакой ответственности перед вами, раздавая её бесплатно вместе с кодом. Что же до людей, способных собрать программу из исходных кодов, то с них вы деньги не можете требовать и подавно вы обязаны отдать им исходники без ограничений. Если библиотека, которую вы использовали в своей программе лицензирована под GPL, то ваша программа также попадает под GPL. Именно для того, чтобы разрешить коммерческое использование немодифицированных свободных библиотек и была придумана LGPL. Вы можете использовать LGPL-библиотеку в пропиетарной программе при условии, что не модифицируете её код.
Она придумана для тех, кто согласен делиться своими наработками полностью без каких либо условий. Никто не заставляет лицензировать код под этой лицензией. А осуждение альтруизма очень опасное занятие.
можете как-то подтвердить свои слова? Поскольку Hotmail утверждает обратное (к сожалению потерял ссылку на переписку Hotmail с Microsoft в момент перехода с FreeBSD на Windows).
Спор про Linux/FreeBSD продолжать не хочу в нём нет возможности оказаться правым на любой позиции. Спор о вкусах также бесполезен. Считаю, что видовое разнообразие лучше, чем "единая линия партии".
Лицензия GPL требует предоставлять открыто код любой программы, в которой использован код лицензированный под GPL. Там же написано, что любой, получивший от вас код, подпадающий под GPL вне зависимости от вашей воли может бесплатно отдать его третим лицам без соблюдения вашей коммерческой выгоды. И чётко указано, что использование в своих программах кода GPL обязывает вас распространять и ваш продукт под GPL (именно этот аспект Балмер называет проказой).
Лицензия BSD даёт право получать выгоду от использования BSD-кода в проперитарной программе без каких либо ограничений. Согласно лицензии BSD никто не обязан раздавать в открытом виде свой код, в котором используются части лицензированные под BSD, а также не обязан свою программу распространять под данной лицензией.
PS я даже рад, что Microsoft научил свой Windows менять IP-адреса без необходимости перезагрузки. И сделано это благодаря настойчивости коллектива Hotmail и коду IP-стека от FreeBSD.
Поверьте, FreeBSD в хороших руках ничем не хуже Linux (а местами и получше будет). Другое дело, что вы пытаетесь спорить о вкусах, а это гнилое дело. Судя по вашим предыдущим постам у вас вряд ли даже найдётся достаточно аргументов в руках, но вы всё туда же лишь бы пободаться.
Отчасти поможет Blogger. Он тоже умеет статику по ftp закачивать и настраивается очень гибко.
Вот именно. А если вспомнить как редко и по какой причине пользователю приходится смотреть на автоматически стартовавший scandisk то такое преимущество ntfs нельзя назвать таким уж преимуществом. Вы думаете имея возможность рубить питание компьютера пользователи не смогут обнаглев испортить-таки данные на винчестере? Смогут! И никакое журналирование не спасёт. =)
А вот смыслы обсуждения мы видим разные. Эта ветка пошла от Dreamveawer. Средств позволяющих визуально/параметрически разрабатывать html на Linux я пока не встречал. К таковым относятся FrontPage и Dreamveawer, но они не только платные, как вы заметили, но и под windows.
Я сам предпочитаю писать код руками, но приемлемого инструмента, позволяющего экономить время в таком же масштабе как это делают визуальщики с Dereamveawer я пока достичь не могу.
Чем мне действительно понравилась Aptana (какраз взялся разбираться) так это библиотеками Snippet. Eсли получится затолкнуть туда макросами прежние наработки, то возможно удастся достичь хорошей скорости написания кода. Надеюсь туда же получится подключить модули для автоматизации XSLT и Smarty.
Как часто вы наслаждаетесь тем, о чём не подозреваете? =)
Zend Studio также на движке eclipce сделан и тоже эталоном высокой скорости реакции не является.
Мне нравится функционал eclipse но если сравнивать скорость реакции на действия и скорости отрисовки интерфейса то на одном и том же компьютере TopStyle субъективно работает быстрее, чем Eclipse. (Конечно надо попробовать и сравнить с Aptana)