Обновить
256K+

Математика *

Царица всех наук

182,61
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Разбираемся в ML без воды: от базы до Attention. Часть 2

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели11K

Итак, в предыдущей части мы остановились на поиске решения задачи линейной регрессии. Сформулировали в общем виде задачу машинного обучения, поняли суть параметров, рассмотрели функции ошибок и начали копать в сторону линейной регрессии.
Ещё раз повторю, что этот цикл статей является лишь взглядом на ML с моей колокольни, так что он не обязательно является истиной во всех редакциях в последней инстанции. Так что буду рад всякому, кто исправит меня, коли сверну не туда.

Читать далее

Новости

Мой универсальный код

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели9.2K

Как я улучшил универсальный код Элиаса 1975 года, заменив длину на popcount — и получил 36% экономии на метаданных. С бенчмарками! Картинка на обложке кринжовая, но тут вроде так принято? 😅

Читать далее

Сколько весит интернет: считаем массу данных и их хранилищ

Время на прочтение10 мин
Охват и читатели13K

Интернет — распределенная система, размер которой нельзя увидеть в окне «Свойства». Более того, ответ на вопрос «что считать интернетом?» существенно влияет на результат вычислений. Точных данных не найти, но отдельные исследования и статистика крупных интернет-ресурсов позволяют произвести примерные расчеты.

В этой статье вас ждет доступная в интернете информация об интернете, простые расчеты и, конечно же, статистика.

Читать далее

Разбираемся в ML без воды: от базы до Attention. Часть 1

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели11K

Сколько статей на хабре про машинное обучение? Обозначим их количество за N и напишем N+1‑ю.

Это попытка собрать цельное понимание: пройти путь от «что это вообще такое» до условных трансформеров и связать всё в одну логичную цепочку.

Попробую всё описать максимально простым языком, минимально опираясь на математическую терминологию.

Как говорится, буду разбирать так, как сам это вижу и понимаю — без лишней теории, но и без магии.

Читать далее

Шесть интересных логических задач

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели12K

Продолжаю публикацию интересных математических задач.

5 рациональных пиратов (А, Б, В, Г и Д) должны разделить 100 золотых монет. Иерархия: А — самый старший, Д — самый младший. Старший предлагает план дележа. Если за него проголосует хотя бы половина пиратов (включая его самого), план принимается. Если нет — старшего выбрасывают за борт, и право предложить план переходит к следующему. Как пират А должен разделить золото, чтобы остаться в живых и получить максимум?

Решение: Нужно рассуждать с конца. Если останутся только Г и Д, Г заберет всё (его голоса хватит для 50%). Чтобы этого не допустить, В должен предложить Д хотя бы 1 монету, чтобы тот поддержал его. Пират А знает это и предлагает: 98 — себе, 0 — Б, 1 — В, 0 — Г, 1 — Д. В и Д согласятся, так как при отказе и переходе хода к Б они могут не получить ничего или меньше.

Читать далее

Самовлюблённые числа: когда нарциссизм и бесполезность вдохновляют

Время на прочтение9 мин
Охват и читатели8.9K

Самовлюблённые числа (они же числа Армстронга, в оригинале Narcissistic numbers) — это числа, равные сумме своих цифр, возведённых в степень количества этих цифр. Например, 153 — самовлюблённое число, потому что 

153 = 1³ + 5³ + 3³

Известный математик Г. Харди отзывался об этом свойстве так: «Всё это забавные факты, весьма подходящие для газетных колонок с головоломками, способные позабавить любителей, но ничего в них не затронет сердце математика». 

Но действительно ли самовлюблённые числа настолько бесполезны? Чтобы узнать ответ, зайдите под кат.

Читать далее

Бесплатных опционов не бывает

Уровень сложностиСложный
Время на прочтение8 мин
Охват и читатели13K

Когда мы берем ипотеку или потребительский кредит, мы редко задумываемся о том, что банк, помимо денег, выдает нам сложный производный финансовый инструмент. Право в любой момент вернуть долг без штрафов — это классический call-опцион. Для заемщика это «бесплатная» страховка от падения ставок: если рынок пошел вниз, можно рефинансироваться и платить меньше.

Однако в финансах действует закон сохранения риска. Если у клиента есть право выбора, значит, у кого-то другого этого выбора нет. В структуре банка этим «кем-то» оказывается Казначейство (ALM).

Спустимся на уровень глубже в механику ценообразования банковских продуктов (Transfer Pricing, FTP) и попробуем оцифровать один из самых скрытых компонентов банковской маржи: Cost of Optionality.

Читать далее

Черную дыру фотографировали восемь телескопов. Фото собрал алгоритм

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели24K

10 апреля 2019 года человечеству показали оранжевый бублик. Журналисты назвали его «первой фотографией черной дыры». Через час картинка была у всех — мемы про глаз Саурона, шутки про пончик, антропоморфизация,  заголовки «ученые сфотографировали невидимое».

Проблема в том, что это не совсем фотография.Точнее сказать, это очень странная фотография: если бы вы использовали телескоп горизонта событий (англ. EHT — далее по тексту) «как камеру» и нажали кнопку, вы бы получили черный квадрат и никакого бублика. Потому что он делает измерения, из которых алгоритм уже собирает изображение…  которого нет.

Вот про этот алгоритм и про то, как 3,5 петабайта данных летели в Бостон самолетом, и пойдет речь.

Читать далее

Математическое моделирование непосредственно в 1С

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели6.9K

Сказ о том, как я воткнул в 1С модули математической оптимизации, а они оказались рабочими и расплодились до полноценной библиотеки. Теперь этот инфернальный софт пережевывает производственное планирование, маршрутизацию и прочие задачи комбинаторного космоса.

Читать далее

Рисуем с помощью закона Кулона. Как сделать генеративную модель на основе электростатики

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели6.9K

Привет, Хабр! Меня зовут Александр Колесов, я исследователь группы «Основы генеративного ИИ» AIRI. У себя в команде мы активно исследуем то, как устроена работа генеративных моделей, ищем новые методы, экспериментируем. Недавно мы обратили внимание на то, что те пути, которые проходят представления данных в диффузионных моделях, очень похожи на пучки силовых линий электрического поля. 

Это не только красивая метафора — мы предложили метод Electrostatic Field Matching (EFM), который позволять извлечь из такой аналогии пользу. Статью с подробным описанием мы недавно свозили на ICLR 2026, там все подробности, теоремы и эксперименты. Здесь же хотелось кратко пересказать основную идею и показать её реализацию на простых примерах.

Читать далее

Записки специалиста по математической оптимизации

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели7K

Что есть база в математической оптимизации и моделировании бизнес процессов? Целевая функция, ограничения, алгоритмы решения — безусловно, но есть ещё модели. Насмотренность, портфель типовых моделей и умение распознавать их в задаче придают дополнительный импульс процессу решения сложных задач.

Рассмотрим набор из шести классических постановок, которые нашли применение в решении широкого спектра задач. Материал будет полезен специалистам по математической оптимизации. Управленцы и менеджеры могут найти актуальные сценарии применения математической оптимизации для своих задач.

Читать далее

[ALM моделирование] На примере дефолта Silicon Valley Bank

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели15K

В условиях современного банковского надзора внезапный дефолт крупного банка — событие экстраординарное, особенно в США. Финансовые регуляторы выстроили глубоко эшелонированную систему защиты: Центральные банки непрерывно мониторят нормативы, проводят стресс-тесты и, как правило, действуют на упреждение.

В текущих реалиях довести банк до стихийного рыночного краха прежде чем регулятор превентивно вмешается и отзовет лицензию — задача со звездочкой, система спроектирована так, чтобы гасить пожары до их открытого возгорания.

В статье воссоздадим дефолт SVB в банковском ALM симуляторе: наберем тот самый портфель ценных бумаг, смоделируем изменение рыночной конъюнктуры и поведение вкладчиков.

Покажем, как невидимые банковские риски превращаются в реальную дыру в капитале, и убивают крупнейшие банки.

Читать далее

Как я доказал гипотезу Коллатца (3n+1) без математики

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели14K

Спойлер: только для себя.

Итак: Представьте себе бесконечную влево ленту, на которой записаны нули и единицы, но в любой момент справа идёт конечная часть числа, а левее — бесконечные нули (они не влияют на значение). Всё движение происходит у правого края.

На этой ленте живёт клеточный автомат со следующими правилами:

Читать далее

Ближайшие события

Метрика EICS — ищем у трансформера причинное место

Уровень сложностиСложный
Время на прочтение11 мин
Охват и читатели11K

У больших языковых моделей есть неприятное свойство: снаружи ответ может выглядеть одинаково уверенно и тогда, когда модель действительно «собрала» правильную причинную цепочку, и тогда, когда она просто выдала правдоподобный текст. Классические способы оценки неопределённости — энтропия распределения токенов, калибровка, ансамбли, conformal prediction — полезны, но обычно смотрят на модель как на чёрный ящик.

В этой статье я разберу другой подход: попробовать оценивать неопределённость не только по выходу модели, а по внутренней согласованности активной цепи трансформера. Речь пойдёт о метрике EICSEffective Information Consistency Score. Идея в том, чтобы за один прямой проход получить численную оценку того, насколько найденная трансформерная цепь ведёт себя согласованно и насколько её макроуровневое описание действительно несёт интегрированную информацию.

Статья основана на исследовательской работе об оценке неопределённости в трансформерных цепях на основе согласованности эффективной информации. Здесь я намеренно смягчил академическую подачу, оставив интуицию, формулы, алгоритм и практические ограничения.

Снять неопределённость

Семь раз посчитай — один раз урони: моделируем инциденты до деплоя

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели12K

Ракету не отправляют в космос только потому, что её двигатель и насос успешно прошли стендовые испытания по отдельности. Перед стартом инженеры рассчитывают траекторию, моделируют режимы работы и анализируют сценарии отказов. Расчёт не заменяет реальные тесты, но задаёт для них осмысленную рамку.

В софте всё обычно иначе. Распределённый пользовательский путь — например, оформление заказа — собирается из десятков микросервисов, баз и очередей. Разработчики добавляют новую зависимость, видят зелёные тесты, проверяют локальные метрики и выкатывают релиз. Считается, что если при сбое что-то пойдёт не так, настроенная система наблюдаемости обязательно это покажет.

Она, конечно, покажет. Но почему при проектировании микросервисов мы так спокойно относимся к тому, что узнаём о хрупкости архитектуры в основном по факту инцидента?

Эта статья о том, как получить грубый расчёт деградации системы ещё до релиза. Без отказа от хаос-инжиниринга или мониторинга, а как шаг перед ними. Я расскажу о двух экспериментах, в которых топологическая модель автоматически извлекалась из распределённых трейсов, после чего на ней просчитывались сценарии отказов методом Монте-Карло. Результаты моделирования я затем сравнивал с реальными инъекциями отказов на стендах DeathStarBench и OpenTelemetry Demo.

Два эксперимента, результаты и код

Логическая головоломка из университетского квеста

Время на прочтение9 мин
Охват и читатели12K

Создай свое собственное судоку — одна из интересных головоломок игры MIT Mystery Hunt 2014 года. Головоломка представляла собой пустое поле судоку, к которому прилагались 4 набора подсказок. Первые 3 набора были необходимы для того, чтобы вписать в пустое поле исходные цифры головоломки: они относились к секторам, строкам и столбцам поля соответственно. Последний набор относился к цифрам поля и служил для получения ответа на задание после решения судоку.

Читать далее

Когда теорема Коши — Ковалевской «отказывает», а решение всё равно есть

Уровень сложностиСложный
Время на прочтение2 мин
Охват и читатели13K

Пример Ковалевской заключается в следующем. Рассмотрим задачу Коши для уравнения в частных производных:

Читать далее

Законы лобового сопротивления воздуха

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели11K

Продолжим наш цикл статей по задаче внешней баллистики исследованием лобового сопротивления воздуха. Предложенная задача является очень непростой , но важной с практической точки зрения, поскольку точный расчёт траекторий снарядов без учёта сопротивления воздуха невозможен. Работа очень актуальна, особенно в военное время

для артиллеристов, миномётчиков, расчётов САУ и ПВО.

В этой статье мы разберём несколько вариантов зависимости силы лобового сопротивления воздуха от скорости летящего тела, а также поймём, какой вариант является наиболее практически применимым при расчётах траекторий спутников, артиллерийских снарядов, баллистических ракет.

Первый случай: При небольших скоростях (0-40 м/с) и тяжёлых снарядах сопротивлением воздуха можно пренебречь: Fc=0. Такой вариант, конечно, сильно облегчает все расчёты, но при больших скоростях расхождение получается чудовищным: в 4-5 раза больше, чем в реальности. Поэтому этот вариант отпадает и применим только в школьных задачах по механике, а все расчёты для него были сделаны ещё до нашей эры.

Второй случай: Закон сопротивления Стокса. В 1851 году английский математик Джордж Стокс получил для закона сопротивления выражение

Читать далее

Почему ИИ решает математические задачи, если не умеет думать

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели18K

На утверждение, что большие языковые модели не мыслят, есть простой встречный вопрос : “Если это так, как ИИ выполняет арифметические операции?”

Действительно, сложение, вычитание и умножение кажутся точными и алгоритмизированными процессами. Кажется логичным предположить, что внутри модели должен быть некий “калькулятор” или хотя бы его подобие. Но это не так.

Читать далее

Математический анализ для разработчика: что действительно нужно понимать

Время на прочтение13 мин
Охват и читатели16K

Когда разработчик слышит слова “математический анализ”, в голове часто всплывает что-то из университета: пределы, производные, интегралы, бесконечные ряды, многостраничные доказательства и ощущение, что все это находится очень далеко от реальной работы. На практике все устроено иначе.

Большая часть разработчиков действительно не сидит каждый день и не вычисляет производные вручную. Но идеи матанализа при этом встречаются постоянно. Они проявляются в производительности, машинном обучении, графике, обработке сигналов, численных вычислениях, аналитике, моделировании и даже в обычной инженерной привычке понимать, как система ведет себя при изменении входных данных.

Проблема обычно не в том, что матан бесполезен. Проблема в другом: его часто преподают как отдельный мир формальных конструкций, а разработчику нужен другой взгляд, более инженерный. Не “докажите теорему по Коши”, а “объясните, как изменяется функция, почему вычисления могут быть нестабильны и как это связано с кодом”.

В этой статье разберем, что из математического анализа действительно полезно разработчику, где это применяется, что можно знать на уровне понимания, а что стоит изучить глубже, если вы идете в более математические направления.

Читать далее
1
23 ...