Pull to refresh
18
Константин@knstqq

Разработчик

1
Subscribers
Send message
Есть такое понятие, как рациональное мышление. Человек, который мыслит рационально, как раз не ведётся на внешние раздражители, принимает трезвые взвешенные решения, не делает ошибок связанных со стереотипами и тд. Есть множество когнитивных искажений, нужно и важно бороться со всеми. Более подробно можно почитать на lesswrong.ru, например
Насколько я понимаю, кривизну пространства невозможно задетектировать только одним «буйком», потому что это не даёт информации о изменении пространства. Точка не может сжаться или расшириться, а нескольких см между парой кубиков сильно недостаточно для полученной точности: нужно несколько км, а лучше больше. Или я ошибаюсь?
Больше 10^7 чего? Как измеряется чувствительность и в чём?
Прекрасно. Так же как и
int main() {
  cout << "input integers A and B" << endl;
  int a, b;
  cin >> a >> b;
  cout << "Sum of two = " << a + b << endl;
}


А вот
int main() {
  puts("input integer A and B");
  int a, b;
  cin >> a;
  scanf("%d", &b);
  cout << "sum of two = %d", a + b);
}

ваще никак, потому что кашу нельзя делать с выключенной синхронизацией.
А из-за свода в одну точку не падает сумарная мощность?
iostream работает не медленнее.
По умолчанию включена синхронизация буферов/кэшей в iostream и stdio, её можно (и нужно, если нет каши из scanf+printf/cin+cout) отключать вызовом sync_with_stdio(0). После этого скорости становятся одинаковыми. К сожалению, некоторые компиляторы/реализации STL не поддерживают её правильно и всё равно тормозят в iostream (некоторые версии от MS говорят страдают)

буду обновлять страницу перед отправкой комментария
Да, +4.5% итоговой точности. И это оказалось больше, чем потери из-за специфики генератора и словаря: я выиграл на этом 1-2%, а не 4.5, как хотелось бы. Даже если прирост составил бы 0.1% я бы использовал этот метод
Откуда числа 15, 18.5 и 0.07?

Вот так вычисляется вероятность ложно положительных срабатываний: image
При длине фильтра 500 000 бит и k = 1 это даёт примерно 63% для 500 000 слов против 72% для 630 000 слов. Разница существена.
Но если бы генератор треша был другой, то это улучшение могло бы стать ухудшением.
Да, конечно это даст гору неправильных true.
Но благодаря уменьшению количества слов возрастает точность блум фильтра настолько, что он даёт настолько меньше ложно положительных срабатываний, что суммарная точность увеличивается.

Разумеется, это подстройка под конкретный генератор. Если бы генератор генерировал не-слова с идеальным распределением частот биграм, идеальными длинами соответствующими словарю, морфологически правильные и никогда не ошибался, генерируя больше повторов, чем случайная выборка из словаря — я бы тогда использовал другие методы.

Но также это подстройка под конкретный выданный словарь из 600к+ слов: в нём словоформы 's встречаются достаточно часто, но не так много слов, которые есть с суффиксом 's, но не существуют без этого суффикса.

Почти каждая использованная мной эвристика (кроме блум-фильтра в чистом виде на весь словарь) дала мне какое количество ложных срабатываний и истинных. И я её оставлял только в том случае, если точность росла. Иногда приходилось удалять какие-то эвристики, потому что появились более крутые или соотношение ложных/верных срабатываний становилось меньше текущей точности
Я тоже сначала брал простые числа как длину фильтра, но перед сабмитом выяснил, что 502122 даёт на 0.2-0.3% больше точности, чем несколько соседних простых.

Что дала очистка редко используемых бит? Для сжатия данных?
Хотелось бы посмотреть на его решение. Идея с заменой групп суффиксов-префиксов очень хороша. Остальное всё примерно тоже самое: надо было коэффициенты всё же не вручную крутить.
Могу перефразировать. Если у меня два (три, пять) авто, то я бы пожелал оформить полис ОСАГО на каждое авто? Постойте, ведь так и есть сейчас. Так что привязка полиса именно к человеку не такая уж абсурдная идея
У всех орбит есть два важных параметра: высота и наклонение. Чтобы изменить эти два параметра нужно много топлива (особенно, наклонение). Поэтому если нужно чтобы спутник был выше, чем 200км или имел другое наклонение, то запуск с МКС нерентабелен (или невозможен)
Полураспад — значит количество сокращается в два раза.
Упал кусок весом в 1 тонну, через 2.6 млн лет осталось 500кг, через 5.2 млн лет осталось 250 кг, а за 8 — около 125 кг этого изотопа. По % содержанию можно вычислить примерное время падения
Вроде бы РЖД использует на вокзалах крупных (не только в здании, но и к путям)
Почта россии, видел в нескольких отделениях.
В сбербанке видел однажды.
«В 1996 году компьютер впервые выиграл в шахматы у чемпиона, а с 2005 года ни один чемпион уже не в состоянии выиграть у компьютера.»
Сейчас шахматисты используют компьютерные шахматы для анализа партий и тд
12 ...
26

Information

Rating
Does not participate
Location
Россия
Registered
Activity