Comments / Profile of FIL

User

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 15:25

Потому что эта самая эфективная и простая организация массива. Вам не нужно высчитывать в каком блоке что находится, используете один индекс. Проблем с выделением не одним блоком нет — на х64 система отдавала 7,6 Гб при физических 4, дальше я пробовать не стал.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 15:20

Согласен, равными блоками мы разместим. Боюсь сортировка проиграет хеш-организации, но нужно пробовать.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 15:17

Ок, согласен — равными блоками получится. Мы потратим еще немного на их организацию. По сути это то же что и сейчас, только блоки неравные и соответсвуют хешу. Нужно экспериментировать, но боюсь сортировка 100 млн. обойдется гораздо дороже подсчета хеша и поиска в цепочке.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 15:11

Попробуйте выделить такой объем одним блоком.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 15:06

Возникает вопрос: как это все поддерживать, отлаживать и т.д. Тут много нюансов, например сборка AnyCPU будет работать и на х32 и на х64 в родном режиме, а для native кода прийдется делать уже две сборки.

Я не уверен, что готовое решение будет очень оптимальным, оно скорее всего универсально и в подобной задаче может проиграть. Я не использовал memcached, но мне просто интересно, сколько она займет памяти на таких объемах.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 14:54

Дико извиняюсь — я новичок тут у вас. Не осилил предмет. В помощи указано юзать тег source, но он не работает. В редакторе code, но без подсветки. Подскажите как правильно?

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 14:52

Да если б можно было. Проект большой и весь на С#. Решили не извращаться, а использовать то, что есть. Хотя по ходу работ мысли всякие возникали.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 14:48

Нам не нужно постоянно хранить. Хранятся они действительно в БД. Нужно было сравнивать новые вхождения с тем что в БД, на таких объемах Оракл задачу выполняет, но достаточно медленно. Поэтому перевели на память.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 14:46

Получается 6 интов * 4 * 100 млн. = 2,4 Гб, такой блок памяти выделить практически невозможно. Плюс они должны быть отсортированы.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 14:36

Мы не можем разместить все данные одним массивом. В этом вся проблема.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 14:34

По производительности и по распределению она нас полностью устроила. По сути это не было самим узким местом и мы не стали искать другие варианты. Спасибо, гляну ELF.

Обработка больших объемов данных в памяти на C#

FIL_ALEX Feb 25 2011 at 14:29

Тут возникает вопрос: сколько мы потратим памяти на организацию дерева?