RPG18 Oct 17 2016 at 07:42

Задачка на std::multiset или поиск по полям структуры

6 min

12K

Comments 26

Elsedar Oct 17 2016 at 08:40

Вы делали сравнение с выборкой из БД? Если да, то с какой? Вы же понимаете, что просто создали кучу индексов на все нужные вам комбинации. А так же то, что всю БД вы держите в памяти. Поэтому, если выбрать in-memory БД, и создать так же много индексов, то, мне кажется, результат будет примерно таким же.

RPG18 Oct 17 2016 at 09:20

Обычно в таких ситуациях берут какой-нибудь SQLite, который можно сделать in-memory и заводят индексы. Такое проходил когда заставили переписывать приложение с C# и его linq на C++. Тут мне взяли и поставили задачку седлать без БД.

mad_god Oct 17 2016 at 09:44

Мой преподаватель по СУБД только фыркал, когда я упоминал про SQLite.

hd_keeper Oct 17 2016 at 10:03

И есть за что.

RomanArzumanyan Oct 17 2016 at 10:50

Задача на собеседование или рабочий проект?

RPG18 Oct 17 2016 at 11:01

Переписывание с C# на C++ был рабочим проектом. Грустное это дело переписывать что-либо с C#/Java на C++, в основном из-за поиска чем бы заменить ту или иную библиотеку.

RomanArzumanyan Oct 17 2016 at 11:02

Тогда отказ от СУБД придаёт проекту особый шарм.

RPG18 Oct 17 2016 at 11:06

Конкретно эта задачка, была как тестовое задание. Счел её интересной.

Dionis_mgn Oct 17 2016 at 09:16

Ребятам из фотостраны придется сочинять новое тестовое задание =)

Siemargl Oct 17 2016 at 09:44

Есть более-менее стандартное решение в виде Boost Multi-index Конечно, если огромный бюст вас не пугает в проекте.

RPG18 Oct 17 2016 at 10:09

Спасибо, не знал про Boost Multi-index. Вот за что люблю хабр, что в комментариях можно узнать что-то новое.

D_T Oct 17 2016 at 09:44

Еще есть boost::multi_index

k0t_begemot Oct 17 2016 at 09:46

Неплохо было бы выложить проект на github.

ProstoTyoma Oct 17 2016 at 10:49

del

Shamov Oct 17 2016 at 11:18

Если переделать BiCriterion таким образом, чтобы это была фабрика, то получится код на Java :)

ProstoTyoma Oct 17 2016 at 12:50

А зачем вам AbstractCriterion? Обязать производные классы иметь этот интерфейс?

RPG18 Oct 17 2016 at 12:58

На будущее. Можно сделать такую штуку:

class MultiCriterion: public AbstractCriterion
{
//
void add(const std::shared_ptr<AbstractCriterion>& cri)
{
    m_criteria.push_back(cri);
}
//...
std::vector<std::shared_ptr<AbstractCriterion>> m_criteria;
}

т.е. можно сделать по 3 и более условиям.

narick Oct 17 2016 at 14:00

А как же високосные года? =)

class AgeCriterion: public AbstractCriterion
{
public:

    static const unsigned int SECONDS_IN_YEAR = 31536000;
    ...

RPG18 Oct 17 2016 at 14:03

Тогда наверное проще использоваться localtime и работать с tm

UFO landed and left these words here

RPG18 Oct 17 2016 at 14:12

Я не знаю имеет ли задачка практического применения. Тут пишут, что:

Multisets are typically implemented as binary search trees.

Поэтому все будет зависеть от конкретной реализация дерева.

UFO landed and left these words here

gorodnev Oct 17 2016 at 17:36

Совершенно необязательно, STL говорит про интерфейс, а не реализацию. Может и AVL быть, или еще что. Но самые популярные реализации на красно-черном.

Videoman Oct 17 2016 at 19:04

Сдается мне, что ваше решение будет жутко расточительным по памяти. Дело в том что std::*set и std::*map очень активно используют кучу внутри себя.и из-за этого, относительно, медленно добавляют/удаляют такое большое количество элементов. Такое ощущение что у вас очень мощная 64-х битная операционка с большим количеством памяти. В 32-х битном процессе такая реализация легко может вызвать OutOfMemory.
Можно полюбопытствовать, сколько памяти занимает таким образом созданный индекс?

RPG18 Oct 17 2016 at 19:17

4 std::multiset на 10 000 000, плюс std::vector для хранения исходных данных отъели 2.4Gb. CLion отъел 735 Mb.
В условии задачки есть подсказка:

Нужно сделать быстрый поиск по базе, с учетом ее не частого обновления

Videoman Oct 18 2016 at 07:38

Условие я заметил. Но тут все зависит от того, как его трактовать. Если база совсем редко изменяется, то выгоднее использовать 5-ть отсортированных std::vector-ов (четыре для индекса и один для самих структур). Будет занимать 200 + 160 = 360 Мб, Примерно в два раза меньше памяти. Ну а вообще, тут, конечно, самым оптимальным будет использование B+Tree. У него плотность будет сравнима с векторами, а скорость поиска с двоичным деревом.