Обновить
256K+

Математика *

Царица всех наук

260,15
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Разбираемся в ML без воды: от базы до Attention. Часть 10: Бэггинг и случайный лес

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели5.5K

В предыдущей части мы изучали дерево решений и, несмотря на его замечательные свойства, наткнулись на один огромный недостаток — нестабильность. Казалось бы, это лечится достаточно просто: зафиксировать все, что отвечает за рандом и не модифицировать датасет.

Такой подход избавит нас от проблемы, но это даже не костыль, а полноценная инвалидная коляска, ведь данное решение буквально закрывает для нас все двери для развития данных. Например, мы в 2026 создадим идеальную модель, предсказывающую цены на квартиры, а в 2027 из-за изменение рынка наша идеальная модель полетит в мусорное ведро.

Следовательно, нужен совершенно другой подход, с другой философией: вместо ограничений, сделать что-то, благодаря чему нестабильность станет чем-то полезным. И в качестве такого подхода сегодня рассмотрим бэггинг и случайные леса.

Читать далее

Новости

Частица — не шарик, а тень чёрной дыры. Геометрическая альтернатива квантовой механике

Время на прочтение7 мин
Охват и читатели6K

Вы когда-нибудь задумывались, с чего это физики так уверены, что частицы летят строго по прямой? Ну, электрон там, фотон… Откуда взялась эта уверенность?

Я прочитал популярную статью про двухщелевой эксперимент. Автор писал: «Если свет — частицы, они должны лететь прямо и дать две полоски. А получился интерференционный узор — значит, свет — волна».

И меня зацепило не само противоречие (корпускулярно-волновой дуализм — это я уже слышал), а исходная посылка: «частицы летят прямо». Почему мы вообще так решили? Потому что так летят пули и бильярдные шары? Но зачем экстраполировать макромир на микромир?

Короче, я начал думать. И пришёл к альтернативной картине реальности. Она, конечно, спекулятивна, но довольно самосогласованна. И главное — в ней квантовая механика становится следствием геометрии, а не набором магических постулатов.

Если вам интересно, как из «частицы не летят прямо» родилась модель с чёрными дырами, слоёным пространством-временем и единым объяснением всех четырёх взаимодействий — добро пожаловать под кат.

Читать далее

Заметки на полях: изоморфизм геометрических алгебр

Уровень сложностиСложный
Время на прочтение4 мин
Охват и читатели11K

В процессе изучения возможностей использования геометрической алгебры в физике нашёл интересный изоморфизм между алгеброй четырёхмерного евклидова пространства и алгеброй времени-пространства.
Переписал уравнения Максвелла в “плоском” виде. Получилась любопытная картина - каждому закону соответствует свой грейд алгебры: (0) скалярный уровень - закон Гаусса для электрического поля, (1) векторы - закон Ампера-Максвелла, (2) бивекторы - закон Фарадея, (3) тривекторы - отсутствие магнитных зарядов.

Читать далее

Может ли Вселенная состоять из математики?

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели13K

Представьте, что вы идёте по парковке с ключами в руке. Вы замечаете свою машину — знакомый цвет, знакомая модель — но, подойдя ближе, чувствуете, что что-то не так. Ещё не успев попробовать открыть дверь, вы понимаете, что это не ваша машина. Бывает. Но что, если бы вы открыли своим ключом чужую машину? Что, если бы ваш ключ внезапно подошёл к следующей, а потом и ещё к одной машине? Что, если бы ваш единственный автомобильный ключ открывал абсолютно все машины на парковке? Это было бы похоже на волшебство.

В 1960 году физик Юджин Вигнер написал знаменитое эссе под названием «Необоснованная эффективность математики в естественных науках». Он не говорил об автомобильных ключах, но разговор мог бы идти, так сказать, и в таком ключе. Вигнер указал, что на протяжении последних четырёх столетий науки математика обладала удивительной способностью раскрывать секреты Вселенной. Это ключ, который открывает дверь за дверью. Он назвал это «чудом», «чудесным подарком, который мы не понимаем и не заслуживаем».

Читать далее

Разбираемся в ML без воды: от базы до Attention. Часть 9: Дерево решений

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели8.5K

В восьмой части мы завершили изучение SVM и разобрались с Kernel Trick. Теперь пришло время познакомиться с деревьями решений — одним из самых популярных и интуитивно понятных алгоритмов машинного обучения.

Идея дерева решений достаточно проста. Алгоритм последовательно задаёт вопросы о признаках объекта и, в зависимости от ответов, движется по ветвям дерева, пока не придёт к итоговому решению. Именно благодаря такой структуре деревья решений считаются одними из самых интерпретируемых моделей машинного обучения.

Читать далее

Выпрямление векторных полей и коммутирование потоков

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели12K

В этой статье подробно разбираются и доказываются две классические теоремы теории динамических систем: теорема о локальном выпрямлении векторного поля и критерий комму- тирования фазовых потоков. Эти утверждения стандартны; они входят в университетские программы и содержатся во многих учебниках по обыкновенным дифференциальным уравнениям и дифференциальной геометрии. Однако на практике полное формальное доказательство критерия коммутирования встречается редко. В продвинутой литературе (например, в учебниках В. И. Арнольда) авторы обычно используют геометрический подход через производную Ли, что требует привлечения аппарата дифференциальной геометрии, при этом аналитические детали зачастую оставляются за кадром. В более простых же курсах это доказательство часто и вовсе опускают. Методическая особенность предлагаемого текста заключается в том, что оба утверждения доказываются строго аналитически — в компонентах и без привлечения геометрических обра- зов. Все выкладки опираются исключительно на базовый математический анализ и классиче- скую теорему существования и единственности решения задачи Коши.

Читать далее

Я попробовал считать нейросетевой слой в конечном поле Галуа GF(137): 4x по памяти, ARM NEON и честные ограничения

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели7.1K

Я проверил маленький нейросетевой слой в арифметике GF(137): не через квантизацию готовой float32-модели, а сразу в байтовом конечнополевом представлении. В лучшем замере получилось около 4x по памяти и до 4.86x по времени относительно моей NumPy float32-реализации. Внутри — код нативного ядра, ARM NEON, таблица запусков и честный разбор, где результат не сработал.

Читать далее

Самый старый кирпич трансформера наконец переизобрели. DeepSeek взял матрицу из 1967 года

Уровень сложностиСложный
Время на прочтение5 мин
Охват и читатели11K

За attention-механизм с 2017 года брались сотни раз: sparse attention, linear attention, MoE, MLA, скользящие окна, что только не. А вот residual connection, остаточная связь, та самая x + F(x) из ResNet 2016 года, простояла почти десять лет нетронутой. Её просто унаследовали из résnet'ов, воткнули в трансформер и забыли.

31 декабря 2025-го DeepSeek выложил на arXiv препринт, где взялся именно за этот кирпич. И что показательно, загрузил его на arXiv лично основатель компании Liang Wenfeng, он же в соавторах. Когда основатель сам публикует статью, это обычно значит, что она ляжет в следующую флагманскую модель. Так и вышло: mHC поехал в DeepSeek V4, который выкатили 24 апреля 2026-го.

Разберём, что они сделали, почему это работает и при чём тут матрица из шестидесятых.

Читать далее

Как математика превращает пространство-время в кристалл, а затем в чёрную дыру

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели8.2K

Вода при температуре ровно ноль градусов не знает, чем ей быть. Добавьте к ней крошечный импульс энергии, и она останется в жидком состоянии; отнимите столько же, и она превратится в лёд, а молекулы зафиксируются в идеальной повторяющейся решётке. Сам переломный момент, этот тонкий момент нерешительности, представляет собой особое состояние объекта. На протяжении десятилетий физики подозревали, что нечто подобное может произойти и с пространством-временем. Не с молекулами воды, а с самой структурой Вселенной, организующейся в кристаллическую структуру прямо на пороге превращения в чёрную дыру. Теперь, впервые, команда из Вены и Франкфурта записала точное математическое описание того, как выглядит этот объект, используя не более чем бумагу и карандаш.

Результат, опубликованный в Physical Review Letters, решает задачу, которая оставалась открытой с 1993 года. Он также раскрывает нечто действительно странное о том, как могут образовываться чёрные дыры, и даёт намёк на то, как могла выглядеть самая ранняя Вселенная.

История начинается с физика по имени Мэтью Чоптуик, который в 1993 году проводил компьютерное моделирование коллапса материи. Он обнаружил, что если настроить энергию падающей оболочки частиц на критический порог — границу между «коллапсом в чёрную дыру» и «безопасным рассеиванием» — то получившееся пространство-время не просто остаётся в покое. Оно пульсирует. Оно колеблется с точным повторяющимся ритмом, с дискретной самоподобностью, как будто само пространство-время представляет собой кристалл с регулярной решётчатой структурой. Физики назвали это состояние критическим коллапсом и почти сразу поняли, что оно имеет признаки фазового перехода, что-то вроде момента, когда вода превращается в лёд. Аналогия была убедительной; математика, как оказалось, была чрезвычайно сложной.

Читать далее

Практическая сторона кватернионов для описания вращений

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели8.5K

Вращения в трёхмерном пространстве встречаются практически в любой задаче компьютерной графики, от игровых движков до WebGL‑приложений.

В статье разбираю, как описываются повороты с помощью матриц и кватернионов, почему оба подхода задают одни и те же преобразования и в чём заключаются преимущества кватернионов на практике.

На примере демонстрационного проекта на Rust, WebAssembly и ThreeJS рассматриваю связь между осью вращения, матрицами поворота, комплексными числами и кватернионами, а также показывается, как эти математические конструкции используются для вращения реальной 3D‑модели.

Читать далее

Основы информатики для всех

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели25K

Всем привет. Я сделал бесплатную обучающую платформу shlyk.tech с упором на визуализацию идей и структур. Графы, системы счисления, логику, комбинаторику, индукцию здесь можно потрогать, покрутить, прошагать и понять, почему оно так работает.

Читать далее

Торговля на отклонениях: почему мы вернулись к тесту Дики-Фуллера (ADF)

Время на прочтение8 мин
Охват и читатели13K

Как бы мы ни пытались отказаться от этого инструмента в поисках более изящных алгоритмических решений, каждый раз мы к нему возвращаемся.

В прошлой статье про Гамма-флип я вскользь касался механики работы с отклонениями, но не раскрыл тему до конца.

В этой статье мы углубимся в стохастический анализ и рассмотрим методы определения стационарности временных рядов в реальном времени. Разберем математический аппарат расширенного теста Дики-Фуллера (ADF), причины его интеграции в ядро нашей торговой системы и особенности реализации на Python при работе с большими массивами данных.

Читать далее

48-кубитный гибридный симулятор Гровера на домашней видеокарте: пробиваем стены памяти и времени

Уровень сложностиСложный
Время на прочтение5 мин
Охват и читатели6.6K

Вокруг квантовых вычислений много маркетингового шума. Если вы попытаетесь смоделировать честное 48-кубитное квантовое состояние в комплексном базисе complex128, то неизбежно упретесь в «стену памяти» в 4.5 Петабайта. Если же вы решите применить блочную декомпозицию пространства состояний для ее поочередного обсчета, то упретесь в «стену времени» длиною в несколько лет непрерывных вычислений на GPU.

В этой статье мы разберем проект гибридного симулятора, который обходит обе стены, удерживая потребление видеопамяти в пределах 268 МБ, а время симуляции сокращает в 400 раз.

Давайте сразу снимем маски: физически данный симулятор не удерживает 48 кубитов в единой суперпозиции. Между старшей и младшей половиной регистра полностью отсутствует квантовая запутанность (entanglement).

Вместо этого применена жесткая, но эффективная классическая блочная декомпозиция (принцип Space-Time Trade-off, то есть размен памяти на время):

Читать далее

Ближайшие события

Параллельность RNN?

Уровень сложностиСложный
Время на прочтение6 мин
Охват и читатели10K

Смотрели итоги прошедшего ICLR? Меня заинтересовала довольно провокационная статья от Эплов — ParaRNN. Казалось бы, параллельность РНН — это их главный недостаток, благодаря которому их заменили трансформеры (в большинстве задач).

Читать далее

Model Predictive Control для Kubernetes autoscaling: что получилось, где HPA оказался сильнее

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели7.1K

Я ожидал, что прогнозирующий контроллер обгонит HPA на коротком пике. Но в Kubernetes всё упёрлось не только в алгоритм: пик длился 30 секунд, а новые Pod становились Ready примерно через 40.

Почему Pod не успевают

Проблема 3x+1: Задача для школьника, которая сломала величайших математиков

Время на прочтение6 мин
Охват и читатели8.9K

Представьте себе задачу, условия которой можно объяснить восьмилетнему ребенку ровно за тридцать секунд. А теперь представьте, что эта же самая задача десятилетиями заставляет сдаваться величайших математиков современности. Гипотеза Коллатца (или проблема «3x+1») доказывает поразительную вещь: за самыми элементарными арифметическими правилами может скрываться абсолютно непредсказуемый хаос и бесконечная сложность. Разбираемся, в чем подвох этой задачи, почему Пауль Эрдёш предлагал за её решение деньги из своего кармана и как с ней справляются современные суперкомпьютеры.

Читать далее

Как мы получили p-value < 0.001 на 10 наблюдениях в группе: ультимативный гайд по A/B на малых выборках

Уровень сложностиСредний
Время на прочтение20 мин
Охват и читатели9.9K

Всем привет! Я Андрей Романов, тимлид команды аналитики Sales Tech в Авито, а также преподаватель и ментор по А/B-тестированию. 

В последние годы я регулярно работаю с A/B-тестами на малых выборках: когда в группе не тысячи пользователей, а 10–40 менеджеров, регионов или других экспериментальных единиц. На этом опыте я собрал практический гайд: что можно сделать до запуска, во время дизайна и после эксперимента, чтобы выжать максимум из ограниченных данных.

В A/B-тестах на малых выборках стандартные проблемы усиливаются: MDE выше ожидаемого эффекта, метрики шумят, а эффект трудно отделить от случайности. При этом страдает не только чувствительность, но и валидность: из-за небольшого числа наблюдений любая ошибка в дизайне, балансе групп или интерпретации результата становится гораздо опаснее.

В материале дам 26 шагов, которые помогут выжать максимум чувствительности и валидности из ограниченной выборки. Хотя фокус — на A/B-тестах с малыми выборками, 90% подходов применимы и к стандартным экспериментам.

Читать далее

Математическое обоснование оценки коэффициента шума сигнальным методом. Быстрая оценка

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели9K

В рамках данной статьи предлагается погрузиться в математику оценки коэффициента шума (КШ) сигнальным методом через отношение сигнал-шум (С/Ш или SNR), извлечь ряд интересных и полезных моментов, связанных с собственными шумами приемных устройств. Рассмотрены вытекающие методологии оценки КШ из основной методологии.

Читать далее

Разбираемся в ML без воды: от базы до Attention. Часть 8: Kernel Trick

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели6.3K

В предыдущей части мы затронули концептуальную идею Kernel Trick (ядерного трюка). Если говорить кратко: когда у нас нет возможности линейно разделить данные в текущем пространстве признаков, мы можем отобразить их в пространство более высокой размерности, где классы станут легко разделимы обычной гиперплоскостью.

В этой части мы глубоко изучим математическое устройство этого метода и разберемся, почему и как именно он работает "под капотом".

Читать далее

Царский путь к пониманию комплексных чисел. Часть II

Уровень сложностиСредний
Время на прочтение33 мин
Охват и читатели20K

В предыдущей части была рассмотрена предыстория комплексных чисел: от их первого открытия до понимания и умения их широко использовать в науке прошли сотни лет. Комплексные числа впервые возникли как артефакт вычислений в работе Кардано 1545-го года и вплоть до конца XVIII века их статус оставался нестабильным, шли научные дискуссии об уместности их употребления и интерпретации.

Современные изложения теории комплексных чисел выглядят «магически» и непонятно для многих людей именно потому, что, как правило, разрыв между непониманием XVIII века и теориями XIX века не покрыт. Сначала предлагается изучить основы теории комплексных чисел в том виде, в которой они были сформулированы в середине XVIII века, а потом сразу делается скачок к теориям, созданным в середине XIX века.

Ключевой шаг понимания мнимых единиц, сделанный человечеством в начале XIX века присутствует только в виде готовой векторной интерпретации комплексных чисел, которая дается пояснения, откуда и зачем она взялась, и что же она объясняет. Интерпретация есть, а смысла за ней нет. Концептуальные проблемы, связанные с комплексными числами, не только не решаются с помощью нее, но и даже не ставятся.

Изложение теории комплексных чисел и даже теории функций комплексного переменного, принятое в современных учебниках, логически противоречиво и содержит много парадоксов, которые современные студенты и их преподаватели обычно даже не замечают, а математики прошлого видели в них неразрешимые проблемы.

В этой статье мы разберемся, наконец, с геометрическим смыслом комплексных чисел, который разрешает все эти парадоксы, а в следующей — с самими парадоксами Эйлера: как их не могли решить великие математики и как их легко решила геометрия.

Читать далее
1
23 ...