Тут в том-то и дело, что в оригинальной статье фильтр мерился в мегабайтах, а набор данных в элементах.
Если элементы размером не меньше трёх битов, то набор всё-таки будет больше фильтра :)
В SQL необходимо изучить множество особенностей, чтобы добиться наивысшей производительности базы данных… Для краткости я не буду приводить конкретных примеров...
Чтобы кататься на велосипеде, надо научиться на нём кататься. Для краткости не буду рассказывать как это делается
И т.д.
Да вопрос-то был не в том, что вы что-то у кого-то украли без ссылок или не украли.
Вопрос в том, что перевод был сделан без понятия о предметной области.
Вот и получается логическая регрессия (вместо логистической — это азбука ML), и в методе k соседей «расстояние рассчитывается по двум измерениям», что попахивает бредом, хотя там и из формулы явно видно, что по всем (в оригинале написано, что так же как и по двум измерениям), и т.д. и т.п.
В общем ситуация в том, что люди прочтут Ваш опус и получат неправильные знания.
Хотя если статья преследует чисто рекламные цели, то для Вас это, конечно, не важно :)
Читал внимательно всю статью.
Но это слушатели Малого ШАДа — ЦА помощнее, чем в среднем здесь на хабре (пробовали решать их вступительные?).
Так что Ваш комментарий немного мимо.
Вам второй раз сказали про монетку, и второй раз Вы не поняли и ответили точно так же :)
Это к вопросу о качестве настроенной модели.
Имеется в виду, что имитацию выходов на Вашей модели можно получить просто подбрасывая монетку — слишком много шума.
Почитайте про ROC-AUC или т.п. вещи — будет очень полезно, без оценки качества модели далеко не пойти.
Товарищи… ну нельзя же так переводить…
У вас
«С помощью фильтра Блума 4.3MБ и 13 хэш-функции, вставляя элементы 1.8МБ приняли примерно 189 наносекунд для каждого элемента на средней производительности ноутбуке.»
Должно быть
«C 4.3-Мбайтным фильтром Блума и 13 хэш-функциями при добавлении 1.8 миллионов элементов среднее время вставки одного элемента составило приблизительно 189 наносекунд на моем ноутбуке.»
(Оригинал — With a 4.3MB Bloom filter and 13 hash functions, inserting 1.8M items took roughly 189 nanoseconds per element on my laptop.)
Я опять не понял что Вы подразумеваете :) исходя из фразы "сразу двух шестерок", кажется, что Вы говорите о случае "ровно одной шестерки на руке", а не "хотя бы одной шестерки". Кстати, вероятность ровно двух шестерок на руке выше, чем ровно одной.
Давайте сформулируем точно что хотим считать :)
Вы под "вероятность наличия хотя бы одной шестёрки в нашей колоде" подразумеваете, что на нашей руке есть от одной до четырёх шестёрок?
При решении задач по теории вероятностей очень важны формулировки :)
Всё понятно, спасибо.
Я просто по инерции (каламбурчик) после первых примеров подумал, что начальное состояние в покое.
Вот что-то мозги завернулись при попытке представить как всё это было.
Извините, я наверно не очень хорошо "идентифицировал".
Которая идёт сразу после строки "Я достаточно прокомментировал предыдущий код, этот не должен вызвать трудностей. Вот результат работы:"
Прокомментируйте, пожалуйста, графики, где показаны результаты работы.
Насколько я понял, сначала управляющее воздействие было направлено в сторону, противоположную координате цели?
Потом оно поменялось на "правильное", и потом ещё раз на "неправильное" для гашения скорости.
Если так, то почему не поехали сразу в "правильную" сторону?
Строго радиус-вектор откладывается всегда от начала координат.
По определению.
Радиус-вектор — это способ задания точки в пространстве.
Задаем параметры радиус-вектора — однозначно получаем точку в пространстве.
Вы о чём хотели сказать?
Если элементы размером не меньше трёх битов, то набор всё-таки будет больше фильтра :)
Чтобы кататься на велосипеде, надо научиться на нём кататься. Для краткости не буду рассказывать как это делается
И т.д.
Вопрос в том, что перевод был сделан без понятия о предметной области.
Вот и получается логическая регрессия (вместо логистической — это азбука ML), и в методе k соседей «расстояние рассчитывается по двум измерениям», что попахивает бредом, хотя там и из формулы явно видно, что по всем (в оригинале написано, что так же как и по двум измерениям), и т.д. и т.п.
В общем ситуация в том, что люди прочтут Ваш опус и получат неправильные знания.
Хотя если статья преследует чисто рекламные цели, то для Вас это, конечно, не важно :)
Но это слушатели Малого ШАДа — ЦА помощнее, чем в среднем здесь на хабре (пробовали решать их вступительные?).
Так что Ваш комментарий немного мимо.
Это к вопросу о качестве настроенной модели.
Имеется в виду, что имитацию выходов на Вашей модели можно получить просто подбрасывая монетку — слишком много шума.
Почитайте про ROC-AUC или т.п. вещи — будет очень полезно, без оценки качества модели далеко не пойти.
Больше популярно, чем научно.
Привык от Яндекса получать что-то более вкусное.
Ошибка на ошибке при переводе, и главное смысловые.
У тех, кто не знаком с ML, мозги однозначно будут запудрены.
Он там работает, использует её или что-то ещё?
У вас
«С помощью фильтра Блума 4.3MБ и 13 хэш-функции, вставляя элементы 1.8МБ приняли примерно 189 наносекунд для каждого элемента на средней производительности ноутбуке.»
Должно быть
«C 4.3-Мбайтным фильтром Блума и 13 хэш-функциями при добавлении 1.8 миллионов элементов среднее время вставки одного элемента составило приблизительно 189 наносекунд на моем ноутбуке.»
(Оригинал — With a 4.3MB Bloom filter and 13 hash functions, inserting 1.8M items took roughly 189 nanoseconds per element on my laptop.)
P.S. И всё равно за статью большое спасибо :)
Почему спрашиваю? Из-за логической регрессии.
Давайте сформулируем точно что хотим считать :)
При решении задач по теории вероятностей очень важны формулировки :)
И в этой статье очень сильный уклон туда (пассаж про существительные против глаголов).
Я просто по инерции (каламбурчик) после первых примеров подумал, что начальное состояние в покое.
Вот что-то мозги завернулись при попытке представить как всё это было.
Которая идёт сразу после строки "Я достаточно прокомментировал предыдущий код, этот не должен вызвать трудностей. Вот результат работы:"
Насколько я понял, сначала управляющее воздействие было направлено в сторону, противоположную координате цели?
Потом оно поменялось на "правильное", и потом ещё раз на "неправильное" для гашения скорости.
Если так, то почему не поехали сразу в "правильную" сторону?
По определению.
Радиус-вектор — это способ задания точки в пространстве.
Задаем параметры радиус-вектора — однозначно получаем точку в пространстве.
Вы о чём хотели сказать?