Pull to refresh
108
0
Kostja Osipov @kostja

Пользователь

Send message
Привет, я один из разработчиков Тарантула (до 2019г), и сейчас работаю в ScyllaDB директором по разработке. Могу сравнить эти два продукта изнутри. В первую очередь, Сцилла — это LSM, то есть база для больших объёмов данных на диске. В Тарантуле для этого используется Винил. По умолчанию в Тарантул используется memtx, который хранит все данные в оперативной памяти (но при этом они персистентны). Аэроспайк находится где-то посередине между Сциллой и Тарантулом, т.к. хранит индексы в оперативной памяти, а данные на диске.
На современных SSD и NVME Сцилла ведёт себя просто отлично — огромная производительность вставок, хорошая скорость чтений, если вам нужно просто большое хранилище для большого объёма данных выбор достаточно очевидный. Даже mail.ru использует Сциллу, несмотря на то что в Тарантуле есть Винил: www.scylladb.com/presentations/high-load-storage-of-users-actions-with-scylladb-and-hdds

При этом в Aerospike и особенно в Tarantool гораздо больше возможностей. В Тарантуле есть такие фишки как функциональные, частичные индексы, индексы по json, транзакции, встроенный сервер приложений. То есть получается что это инструменты для разных задач и с разными требованиями к железу (самая дешёвая стоимость хранения единицы информации в Сцилла, самая высокая — в Тарантул, Аэроспайк посередине), и сравнивать их по производительности в общем-то не очень корректно.

По субъективной оценке, операции по добавлению и удалению узлов, ребалансировке данных и т.д. наиболее зрелые в Сцилле.
Это, конечно, лучше чем erase/insert, т.к. экономит аллокацию памяти, но не избавляет от необходимости ребалансировки контейнера при вставке и удалении узла.
Ценность от гетерогенного поиска в set ограничена тем, что возвращается const reference. Поменять объект без const_cast невозможно. Представить себе сценарий при котором я хочу использовать гетерогенный поиск и не менять возвращаемый объект мне лично непросто. Ваш пример с хранением тредов из этой серии — красиво только на картинке.
olegrok я рад что получилось закончить прототип. Основное преимущество и назначение индекса — многокритериальный поиск, в приложениях типа yandex.market. Производительность з-кривой деградирует линейно с увеличением числа размерностей, в то время как производительность r-tree — полиномиально. Я бы попробовал протестировать на реальных данных и задачах — проиндексиров базу cian или продуктовый каталог yandex.market. В настоящее время в open source нет субд с хорошей поддержкой многокритериального поиска, связано это в первую очередь с тем что сложно завести транзакционный менеджер для таких индексов. Уверен, что это будет востребованно — вопрос просто доведения технологии до ума и популяризации.
Не советую id спейсов использовать явно указанные, да ещё < 512. Это легаси из 1.5. Может в поддержке очень больно получиться.
Подписываюсь двумя руками.
Tarantool был создан до моего прихода в компанию Mail.Ru, и Mail.Ru продолжает развивать его после моего ухода. Соответственно про акты и задания нужно спрашивать delamonpansie, который написал версию 0.1. Я ничего не подписывал, но не удивлюсь если окажется что я чего-то не знаю.
Паша,
мне бы в данной ситуации очень помогло если бы этот текст был гораздо более конкретным, и говорил не про ваш вклад в опен сорс, а про права в конкретных проектах которые вы отчуждаете сообществу. Лицензия Tarantool, как и лицензия Nginx, говорит о том что любой человек может воспользоваться исходным кодом для любых целей. Но что мешает Mail.Ru завтра сказать что код был опубликован под данной лицензией без одобрения компании, как это произошло в случае Nginx? К сожалению, мир в котором мы живём сильно изменился, и если позиция Mail.Ru действительно такая, как вы пишете, то ответ на эти изменения должен быть гораздо более определённым.
Я бы очень не хотел чтобы моя кодовая база разошлась с апстримом и всячески по-прежнему пытаюсь избежать форка.
Я продолжаю активно участвовать в проекте, несмотря на заявления мелй.ру об обратном.
Хотя всех прав мейнтейнера меня лишили и возвращать не собираются.
Безусловно, из 30 лет за компьютером я долгое время работал за стационарным монитором. Были и ViewSonic 14' и Eizo, последний монитор был Dell 24'. Пробовал работать за стационарным монитором уже после травмы. Я не сижу на одном месте достаточно долго, постоянно меняю позу, это удобнее делать с ноутом.
Вы всё правильно говорите, а теперь как быть тем кто вынужден работать много и долго? Плюс я же написал, не знаю прочитали ли вы статью, что стол для работы стола позволяет отрегулировать высоту и работать более удобно сидя или в кресле-седле.
не всегда нужно работать по 12-14 часов, но иногда приходится. мне кажется я в посте выглядел несколько надменно когда написал про это, поправка: я не считаю что работать по 12-14 часов — нормально.
никто. врачи горячо отговаривают. Но у врачей неслучайная выборка.
вместо планок могу рекомендовать упражнения Бубновского — помогает лучше.
Я делаю много упражнений на пресс и на длинные мышцы спины, для этого достаточно турника или станка для гиперэкстензий.
Если работаешь 12-14 часов — значит и во время обеда, в дороге, в другом городе, в массажном кресле и т.д. Монитор очень хорошая вещь если хочешь отделить рабочее время от нерабочего, у меня такой цели не стоит.
1
23 ...

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity