Comments / Profile of walkor / Habr

@walkor

User

ProfileArticles1PostsNewsComments8

Чек-лист проверки анонимности сёрфинга

walkor Jul 30 2015 at 08:54

Утечка через ВКонтакте

Для соцсетей и разных трекеров есть удобный аддон — Ghostery, блочит такие следящие виджеты на странице.

Пора научиться пренебрегать гаджетами

walkor Jul 3 2014 at 08:36

А где ролик-то про зависимость? Там по ссылке только какая-то наркоманская веб страничка.

Под капотом у Dictionary и ConcurrentDictionary

walkor Oct 19 2013 at 10:28

Ну, тогда у меня больше нет идей из каких соображений в хэштаблицах предпочтение отдается простым числам.

Под капотом у Dictionary и ConcurrentDictionary

walkor Oct 19 2013 at 05:36

Да, действительно, не подходит такой вариант. Тогда так — предположим, что у нас хорошая хэш функция, которая возвращает не связанные хэшкоды — тут разницы простое число или нет скорее всего не будет. А теперь представим, что хэшкоды связаны, например х, 2х, 3х, 4х и т.д. Например если ваши хэши — 2,4,6,8,10,12,14,16,18,20, то и корзины в которые они попадут будут одними и теми же.

2 % 10 = 12 % 10 = 2 и т.д.

И простое чило, выбранное в качестве делителя здесь просто помогает компенсировать плохую работу хэш функции.

Под капотом у Dictionary и ConcurrentDictionary

walkor Oct 18 2013 at 19:40

Давайте я приведу пример. У вас есть словарик на 10 элементов (capacity = 10). При вычислении индекса корзины, в которую попадет элемент, мы берем остаток от деления на 10. Логично, что элемент, в зависимости от его хэша, попадет в 0..9 корзину. А теперь представьте что у хэша и размера словаря есть общие делители — например 2 (или 5). Тогда, элемент уже может попасть только в 0..4 (либо 0..1). А это значит что бОльшая часть корзин останется неиспользованными. А теперь возьмите простые числа — они делятся только на 1 и самих себя. Т.е. при емкости 11, элементы будут случайным образом всегда занимать 0..10 корзины.

Упрощенно, процент использования всех корзин можно представить как (GCD — наибольший общий делитель)

x% = capacity / GCD (capacity, hashcode)

Под капотом у Dictionary и ConcurrentDictionary

walkor Oct 18 2013 at 14:05

Тут я могу предложить вам поверить мне на слово, либо взять в руки рефлектор и убедиться самому.

Под капотом у Dictionary и ConcurrentDictionary

walkor Oct 18 2013 at 12:56

Ответ на 1 вопрос — ключа и его хэша на самом деле. Я не уверен зачем так сделано, учитывая, что хэш генерится по ключу, но проверка там выглядит так:

if ((this.entries[i].hashCode == hashcode) && this.comparer.Equals(this.entries[i].key, key))

По 2 вопросу — отредактировал пост. Вы правы, там не хэш, там индекс корзины который получился по формуле:

int bucketNum = (hashcode & 0x7fffffff) % capacity;

Тут, как вы понимаете результат может быть одинаковый для разных хэшей.

Под капотом у Dictionary и ConcurrentDictionary

walkor Oct 18 2013 at 12:50

Если эта тема кому-то интересно — конечно.