akalend Apr 24 2011 at 00:39

Tarantool Данные и Протокол

5 min

NoSQL*

+34

Comments 40

UFO just landed and posted this here

akalend Apr 24 2011 at 01:45

спасибо

-2

Talismanium Apr 24 2011 at 08:54

«в бэдграунде» чето новое :)

-7

arkady Apr 24 2011 at 09:28

исправьте: нативный клиент на любымом Вам языке

-7

akalend Apr 24 2011 at 19:14

поправил. спасибо

shogunkub Apr 24 2011 at 10:52

длинна => длина ещё

-7

akalend Apr 24 2011 at 19:14

ок — поправил

UFO just landed and posted this here

mark_ablov Apr 24 2011 at 16:22

а вам важен фикс или благодарность?

kmike Apr 24 2011 at 21:19

Тут не все так однозначно, публичность может не благодарность иметь своей целью: иногда пишу авторам в личку замечания по орфографии, пунктуации, переводу — исправляют не все, даже когда ошибки очевидные. Всем, кто исправляет — спасибо.

UFO just landed and posted this here

Nekuromento Apr 24 2011 at 01:39

Одна из причин популярности Redis — простота использования
Тут, судя по вашему описанию, до простоты API Redis очень далеко

akalend Apr 24 2011 at 01:47

если Вы поклонник Перла, то клиент Перла позволяет работать с пcевдо SQL, типа писать запросы:
SELECT * FROM t0 WHERE k0=124

-1

Shedal Apr 24 2011 at 02:12

А почему псевдо? Вы, наверное, имеете в виду, что это — не полностью реализованный SQL.

akalend Apr 24 2011 at 02:33

это SQL реализованный не по стандарту SQL'92, а адаптироанный применительно к key/value хранилищам, чтоб программистам было легче создавать свое творчество.
Примеры:
update t0 set k1 = 2, k2 = 3 where k0=1
insert into t0 values (4294967295)
insert into t0 values (1, 'I am a new tuple')

select * from t0 where k0=4294967295
Здесь нет обращения к конкретной таблице, так как нет понятия таблиц в принципе. Запрос идет в конкретный неймспейс t0 (в данном случае =0 ), В данном случае важна цифра 0, и с таким же успехом можно написать
select * from n0 where k0=4294967295 — результат будет одним и тем же.

akalend Apr 24 2011 at 02:35

то же самое относится и к ключам, важен номер а не имя:
select * from n0 where k0=4294967295
select * from n0 where m0=4294967295
дадут один и тот же результат.

akalend Apr 24 2011 at 02:38

и еще нельзя написатьконкретные поля: SELECT field1,field3 FROM t0 WHERE k0 = 0
можно выбрать все поля звездочкой.

AlexTikhonov Apr 24 2011 at 13:38

Ох плохая это идея.

Скажу как разработчик в свое время (2000-2002) довольно перспективной и очень необычной базы данных, основанной на связных множествах.

И одна из задач менеджмента была именно реализация под-множества возможностей SQL99. Типа чтоб кастомерам было легче переходить.

В результате это была имхо наиболее ошибочное решение, которое и привело к фейлу. Ошибка в том, что кастомеры искусившись SQL-языком стали писать почти обычные запросы, не воспользовавшись всей мощью entety-relations системы.

В общем мне кажется что если бд действительно необычна и дает какие-то существенные приемущества по сравнению с обычной SQL-бд, то не стоит давать возможность писать SQL-like запросы.

kolpak Apr 24 2011 at 19:55

не смог найти клиент Перла, пожалуйста, покажите его.

kolpak Apr 24 2011 at 20:16

вопрос снят
github.com/mailru/tarantool/tree/master/mod/box/client/perl

Shedal Apr 24 2011 at 02:41

Мне кажется, чтобы заинтересовать кого-то, нужно хотя бы привести сравнение производительности с существующими системами. А также показать примеры красивого использования, опять же, проводя какую-то параллель с тем же Redis.
А когда люди заинтересуются движком, то ли с точки зрения производительности, то ли с точки зрения возможностей, — тогда уже описывать протокол.

+11

akalend Apr 24 2011 at 10:33

сравнение производительности memcache & rdis можно найти в интернете
Я делапл замеры на 100 000 последовательных get/set memcache/redis результат, 16/19 сек
с tarantool замеры не делал, но маилрушники его сравнивали с мемкешом и у меня нет причин их замерам не верить.

-4

mixrin Apr 24 2011 at 15:08

А что с Tokyocabinet/Kyotocabinet?

akalend Apr 24 2011 at 18:13

я работаю над этим вопросом ;)
есть положительные результаты
и вот в процессе сравнения с аналогами рождаются такие вот посты

akalend Apr 24 2011 at 19:22

Я делапл замеры для treeDb основанной на Tokyocabinet
результаты см здесь www.slideshare.net/akalend/treedb-keyvalue-nosql-database

akalend Apr 24 2011 at 19:23

как видно из замеров — чуть-чуть обгоняем мемкеш

IPv6 Apr 24 2011 at 10:12

5 копеек: абзац про редис это, извините, не имеет отношение к реальности. не хочется холиварить но и видов данных там достаточно — там не только списки, но и аналогичные вашей структуре ассоциативные массивы и много другого полезного, не говоря уж о базовых вариациях «ключ-значение». клиенты под него есть на всем что шевелится :) и многое другое
по сравнению с тарантулом фокус немного другой, так что каждому инструменту своя область, но чем тарантул лучше редиса если честно не видно (производительность думается сравнимая — нового уж давно никто ничего не выдвигал...).
имхо!

akalend Apr 24 2011 at 10:35

и я про тоже но другими словами, что у редиса есть мгного клиентов, по этому он и популярен. У Тарантула их нет, по этому популярность этой БД в тени.

-1

kostja May 16 2011 at 19:32

Тарантул — имеет копию данных на диске (уже очень давно), и она не ломается, если сервер или машина падает.
Если Вы цените Ваши данные — думаю это важно.
То же самое с репликацией — в Tarantool она уже довольно давно.
Протокол в Tarantool бинарный, в Редисе текстовый — соотв. бинарный быстрее.
Хранимые процедуры в Tarantool пишутся один раз, компилируются один раз, выполняются много раз, в Redis'е только недавно появился eval, то есть каждый раз компилируется.

IPv6 May 16 2011 at 19:54

редис тоже имеет копию данных, репликация есть, протокол там *фактически* бинарный — оверхед порядка десятков байт (несеръезный), никакого ескейпинга данных не нужно. эвал в редисе компилируется не каждый раз (скомпиленные куски хранятся в кеше и дергать их можно по хешу не посылая весь скрипт — вообще эта часть активно развивается)

philpirj Apr 24 2011 at 10:46

На wiki проекта нашлись примеры на Ruby.

seriyPS Apr 24 2011 at 19:04

Да в общем-то вот и Ruby клиент github.com/mailru/tarantool/tree/master/mod/box/client/ruby

vit1251 Apr 25 2011 at 00:48

Хотелось бы bind-инг к популярным языкам программирования и ссылку на sourceforge с исходниками и собранными бинариками для популярных платформ. Тогда проще будет использовать.

akalend Apr 25 2011 at 10:04

согласен,
ссылкой выше клиент на руби.
Больше портов на другие языки нет из-за сравнительной молодости проекта.

Сишный клиент, входящий в состав дистрибутива как таковым не является. Маилрушники обещают его выпустить, но про сроки ничего не известно. стал разбираться с протоколом, чтоб сделать bind-инг к РНР — написал эту статью…

kostja Apr 25 2011 at 22:45

Клиенты в процессе, скачать можно с tarantool.org или github.com/mailru/tarantool.

Советую использовать ветку 'master-stable'

stolen Jan 29 2012 at 18:01

Я почитал код, и у меня возник вопрос:
Почему у вас LEB128 реализован в обратную сторону?

akalend Jan 29 2012 at 23:06

а какой код прочитали? уже столько воды утекло

stolen Jan 29 2012 at 23:17

Актуальный мастер на гитхабе

void
write_varint32(struct tbuf *b, u32 value)
{
    tbuf_ensure(b, 5);
    if (value >= (1 << 7)) {
        if (value >= (1 << 14)) {
            if (value >= (1 << 21)) {
                if (value >= (1 << 28))
                    append_byte(b, (u8)(value >> 28) | 0x80);
                append_byte(b, (u8)(value >> 21) | 0x80);
            }
            append_byte(b, (u8)((value >> 14) | 0x80));
        }
        append_byte(b, (u8)((value >> 7) | 0x80));
    }
    append_byte(b, (u8)((value) & 0x7F));
}

В обратную сторону:

u32
read_varint32(struct tbuf *buf)
{
    u8 *b = buf->data;
    int size = buf->size;

    if (size < 1) {
        tnt_raise(IllegalParams, :"packet too short (expected 1 byte)");
    }
    if (!(b[0] & 0x80)) {
        buf->data += 1;
        buf->capacity -= 1;
        buf->size -= 1;
        return (b[0] & 0x7f);
    }

    if (size < 2)
        tnt_raise(IllegalParams, :"packet too short (expected 2 bytes)");
    if (!(b[1] & 0x80)) {
        buf->data += 2;
        buf->capacity -= 2;
        buf->size -= 2;
        return (b[0] & 0x7f) << 7 | (b[1] & 0x7f);
    }
    if (size < 3)
        tnt_raise(IllegalParams, :"packet too short (expected 3 bytes)");
    if (!(b[2] & 0x80)) {
        buf->data += 3;
        buf->capacity -= 3;
        buf->size -= 3;
        return (b[0] & 0x7f) << 14 | (b[1] & 0x7f) << 7 | (b[2] & 0x7f);
    }

    if (size < 4)
        tnt_raise(IllegalParams, :"packet too short (expected 4 bytes)");
    if (!(b[3] & 0x80)) {
        buf->data += 4;
        buf->capacity -= 4;
        buf->size -= 4;
        return (b[0] & 0x7f) << 21 | (b[1] & 0x7f) << 14 |
            (b[2] & 0x7f) << 7 | (b[3] & 0x7f);
    }

    if (size < 5)
        tnt_raise(IllegalParams, :"packet too short (expected 5 bytes)");
    if (!(b[4] & 0x80)) {
        buf->data += 5;
        buf->capacity -= 5;
        buf->size -= 5;
        return (b[0] & 0x7f) << 28 | (b[1] & 0x7f) << 21 |
            (b[2] & 0x7f) << 14 | (b[3] & 0x7f) << 7 | (b[4] & 0x7f);
    }

    tnt_raise(IllegalParams, :"incorrect BER format");
    return 0;
}

stolen Jan 30 2012 at 03:09

Не смог уснуть, не разобравшись.
Да, кажется, что наличие слов «Little Endian» в названии протокола указывает на то, что первым в поток лезет старший фрагмент. Но если вчитаться в спецификацию DWARF, то на страницах 70 и 71 можно найти такой текст:

It is ‘‘little endian’’ only in the sense that it avoids using space to represent the
‘‘big’’ end of an unsigned integer, when the big end is all zeroes or sign extension bits).

DW_FORM_udata (unsigned LEB128) numbers are encoded as follows: start at the low order
end of an unsigned integer and chop it into 7-bit chunks. Place each chunk into the low order 7
bits of a byte. Typically, several of the high order bytes will be zero; discard them. Emit the
remaining bytes in a stream, starting with the low order byte; set the high order bit on each byte
except the last emitted byte. The high bit of zero on the last byte indicates to the decoder that it
has encountered the last byte.

Отсюда следует, что в статье Википедии, на которую вы ссылаетесь в документации для ознакомления с LEB128, примеры кода правильные, а вот у вас порядок октетов в бинарном потоке не тот.

akalend Jan 31 2012 at 21:33

спасибо — буду проверять

Show the best of all time