Search
Write a publication
Pull to refresh
117
0
Kostja Osipov @kostja

Управляющий директор, R&D, ПАО Аренадата

Send message

Я противопоставил два подхода чтобы подсветить насколько больно сегодня может быть разрабатывать хранимые процедуры. Если на одной чаше весов производительность, а на другой - удобство, то побеждает удобство, поэтому подходом IMDG и не пользуются.

Это типовая проприетарная лицензия (точнее её шаблон для ознакомления) на коммерческую, фстэк сертифицированную версию ПО. Мы обязательно должны иметь такой шаблон на сайте, т.к. состоим в реестре отечественного ПО. Мне кажется вы совсем мало знаете современную корпоративную практику если предполагаете что лицензия с сайта используется хотя бы в одном корпоративном договоре - обычно условия договора очень жёстко регламентируются заказчиком.

У нас открытая лицензия Simplified BSD - https://github.com/picodata/picodata/blob/master/LICENSE. Неясно что именно вы смотрите и где.

Про детали есть немало отдельных докладов, например на Database Internals Meetup, на нашем youtube канале; ну и в конечном итоге, есть https://github.com/picodata/picodata исходный код.
Мне сложно ответить на следующие тезисы, т.к. sqlite на rust переписывала не Picodata, а Turso, я это привёл в качестве примера того, что открытых компонентов становится больше.

Привет, я один из разработчиков Тарантула (до 2019г), и сейчас работаю в ScyllaDB директором по разработке. Могу сравнить эти два продукта изнутри. В первую очередь, Сцилла — это LSM, то есть база для больших объёмов данных на диске. В Тарантуле для этого используется Винил. По умолчанию в Тарантул используется memtx, который хранит все данные в оперативной памяти (но при этом они персистентны). Аэроспайк находится где-то посередине между Сциллой и Тарантулом, т.к. хранит индексы в оперативной памяти, а данные на диске.
На современных SSD и NVME Сцилла ведёт себя просто отлично — огромная производительность вставок, хорошая скорость чтений, если вам нужно просто большое хранилище для большого объёма данных выбор достаточно очевидный. Даже mail.ru использует Сциллу, несмотря на то что в Тарантуле есть Винил: www.scylladb.com/presentations/high-load-storage-of-users-actions-with-scylladb-and-hdds

При этом в Aerospike и особенно в Tarantool гораздо больше возможностей. В Тарантуле есть такие фишки как функциональные, частичные индексы, индексы по json, транзакции, встроенный сервер приложений. То есть получается что это инструменты для разных задач и с разными требованиями к железу (самая дешёвая стоимость хранения единицы информации в Сцилла, самая высокая — в Тарантул, Аэроспайк посередине), и сравнивать их по производительности в общем-то не очень корректно.

По субъективной оценке, операции по добавлению и удалению узлов, ребалансировке данных и т.д. наиболее зрелые в Сцилле.
Это, конечно, лучше чем erase/insert, т.к. экономит аллокацию памяти, но не избавляет от необходимости ребалансировки контейнера при вставке и удалении узла.
Ценность от гетерогенного поиска в set ограничена тем, что возвращается const reference. Поменять объект без const_cast невозможно. Представить себе сценарий при котором я хочу использовать гетерогенный поиск и не менять возвращаемый объект мне лично непросто. Ваш пример с хранением тредов из этой серии — красиво только на картинке.
olegrok я рад что получилось закончить прототип. Основное преимущество и назначение индекса — многокритериальный поиск, в приложениях типа yandex.market. Производительность з-кривой деградирует линейно с увеличением числа размерностей, в то время как производительность r-tree — полиномиально. Я бы попробовал протестировать на реальных данных и задачах — проиндексиров базу cian или продуктовый каталог yandex.market. В настоящее время в open source нет субд с хорошей поддержкой многокритериального поиска, связано это в первую очередь с тем что сложно завести транзакционный менеджер для таких индексов. Уверен, что это будет востребованно — вопрос просто доведения технологии до ума и популяризации.
Не советую id спейсов использовать явно указанные, да ещё < 512. Это легаси из 1.5. Может в поддержке очень больно получиться.
Подписываюсь двумя руками.
Tarantool был создан до моего прихода в компанию Mail.Ru, и Mail.Ru продолжает развивать его после моего ухода. Соответственно про акты и задания нужно спрашивать delamonpansie, который написал версию 0.1. Я ничего не подписывал, но не удивлюсь если окажется что я чего-то не знаю.
Паша,
мне бы в данной ситуации очень помогло если бы этот текст был гораздо более конкретным, и говорил не про ваш вклад в опен сорс, а про права в конкретных проектах которые вы отчуждаете сообществу. Лицензия Tarantool, как и лицензия Nginx, говорит о том что любой человек может воспользоваться исходным кодом для любых целей. Но что мешает Mail.Ru завтра сказать что код был опубликован под данной лицензией без одобрения компании, как это произошло в случае Nginx? К сожалению, мир в котором мы живём сильно изменился, и если позиция Mail.Ru действительно такая, как вы пишете, то ответ на эти изменения должен быть гораздо более определённым.
Я бы очень не хотел чтобы моя кодовая база разошлась с апстримом и всячески по-прежнему пытаюсь избежать форка.
Я продолжаю активно участвовать в проекте, несмотря на заявления мелй.ру об обратном.
Хотя всех прав мейнтейнера меня лишили и возвращать не собираются.
Безусловно, из 30 лет за компьютером я долгое время работал за стационарным монитором. Были и ViewSonic 14' и Eizo, последний монитор был Dell 24'. Пробовал работать за стационарным монитором уже после травмы. Я не сижу на одном месте достаточно долго, постоянно меняю позу, это удобнее делать с ноутом.
Вы всё правильно говорите, а теперь как быть тем кто вынужден работать много и долго? Плюс я же написал, не знаю прочитали ли вы статью, что стол для работы стола позволяет отрегулировать высоту и работать более удобно сидя или в кресле-седле.
не всегда нужно работать по 12-14 часов, но иногда приходится. мне кажется я в посте выглядел несколько надменно когда написал про это, поправка: я не считаю что работать по 12-14 часов — нормально.
1
23 ...

Information

Rating
279-th
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity

Specialization

Chief Technology Officer (CTO), Chief Product Officer (CPO)
SQL
Git
Python
PostgreSQL
Linux
OOP
MySQL
Database
C++
Algorithms and data structures