Обновить
256K+

Математика *

Царица всех наук

186,63
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

4 интересных парадокса, рождающих жаркие дискуссии

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели1.1K

Парадокс Протагора и Эватла

Знаменитый философ и учитель софистики Протагор обучил юношу Эватла юриспруденции. Ученик обещал заплатить за обучение, но только если выиграет свой первый судебный процесс. Однако после окончания учебы Эватл не стал браться за дела и платить отказался. Тогда учитель подал на него в суд.

Спор:

Аргументация Протагора: Если Эватл проиграет суд, то он обязан заплатить по решению суда. Если Эватл выиграет суд, он выиграет свой первый процесс, а значит, обязан заплатить по условиям их изначального договора. Вывод учителя: при любом исходе ученик должен отдать деньги. Контраргументация Эватла: Если я выиграю суд, то по решению суда я ничего не должен платить. Если я проиграю суд, то я не выполнил условие договора (не выиграл свой первый процесс), а значит, по контракту я тоже ничего не должен платить. Вывод ученика: я не должен платить ни при каком исходе.

Рассуждения:

Логическая ошибка кроется в интерпретации фразы «выиграл процесс». У Протагора: «выиграть процесс» — это просто сам факт победы в суде (успешный исход дела). У Эватла: «выиграть процесс» — это значит освободиться от уплаты. Эватл подменяет понятия. Он считает, что если он выиграл суд, значит, он не должен платить по договору. Но одно не исключает другое: он может выиграть суд и при этом быть обязанным выплатить гонорар, потому что суд доказал его статус выигравшего дело (тем самым активировав договор).

Если рассматривать парадокс с точки зрения судебного права, то он возникает из-за смешения двух разных юрисдикций: условий частного контракта (договора) и власти судебного решения (закона). В логике этот софизм решается так:

Читать далее

Новости

3 известные интересные задачи на логику

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели4K

У вас есть две веревки и коробок спичек. Каждая веревка сгорает ровно за 1 час. При этом они горят неравномерно (например, первая половина может сгореть за 5 минут, а остаток — за 55 минут). Как с помощью этих веревок отмерить ровно 45 минут?

Решение: Поджигаем первую веревку с обоих концов одновременно, а вторую веревку — только с одного конца. Первая веревка полностью сгорит ровно через 30 минут (так как пламя встретится). В этот самый момент поджигаем второй конец второй веревки. Ей оставалось гореть 30 минут с одного конца, но с двух концов она сгорит в два раза быстрее — за 15 минут. Итого: 30 + 15 = 45 минут.

Читать далее

Неожиданная встреча: теория графов вновь помогла решить проблему в анализе Фурье

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели4.3K

Математики до сих пор пытаются понять фундаментальные свойства преобразования Фурье, одного из самых распространённых и мощных инструментов в математике. Новый результат стал важным шагом к достижению этой цели. 

Два столетия назад Жозеф Фурье подарил математикам волшебный метод. Он предположил, что почти любую функцию можно представить в виде суммы простых волн — этот приём теперь называется преобразованием Фурье. В наши дни преобразование Фурье используется для понимания всего, от химического состава далёких звёзд до процессов, происходящих глубоко под земной корой.

Читать далее

Математика кластеров: разбираемся в умной кластеризации данных на примере нашей системы поиска аномалий в логах. Часть 1

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели4.5K

Привет, Хабр! Меня зовут Андрей Басов, я руководитель команды технической поддержки стрима корпоративных продуктов и сервисов в MWS, занимаюсь технической поддержкой и сопровождением продуктов линейки Partner Experience Platform.

В прошлом материале я рассказал о том, как мы с коллегами попробовали искать аномалии в логах наших систем с помощью методов машинного обучения. Сейчас мы провели работу над ошибками, все переработали (архитектуру, математический аппарат), внедрили генеративную LLM и Principal Component Analysis — и в итоге создали новую систему анализа жизни продуктов, которая самостоятельно балансирует, обучается, выявляет аномалии, паттерны и даже заглядывает в будущее.

Но не только сама разработка этой «живой» системы стала для меня в проекте вызовом. Мы столкнулись с тем, что некоторые коллеги из разных подразделений не всегда понимают, чем конкретно мы занимаемся и как это все работает. Не всегда разделяют границы ИИ между машинным обучением и генеративным интеллектом.

Поэтому я открываю серию материалов о том, как математика способна превратить пассивную кластеризацию в активную и самосознающую систему: от основ байесовской адаптации, динамических границ и топологического анализа до внедрения в практику. Разбираться будем на примере нашей новой архитектуры.

Читать дальше

Speech-to-LaTeX: распознавание математических выражений и предложений в LaTeX

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4.9K

Представьте семинар у физиков или математиков. Идёт автоматическая запись лекции, а затем распознавание речи в аккуратный текст. В большинстве мест современные ASR-системы справятся неплохо. Но значительная часть такой записи будет состоять из фраз вроде «интеграл от икс в квадрате до бесконечности», «сумма по i от единицы до n» или «производная по t от функции f».

Формально голос может быть распознан правильно. В расшифровке даже могут появляться отдельные символы вроде +, π или x. Но если человек произносит длинную формулу, результат почти всегда превращается в линейную фразу, читать которую физически больно. Хочется другого: чтобы система сразу понимала, где обычный текст, где математическое выражение, и выдавала не «один делить на икс плюс два», а корректный LaTeX-код, например, \frac{1}{x+2} или \frac{1}{x}+2, в зависимости от смысла.

Эта задача называется Speech-to-LaTeX или S2L: преобразование озвученных математических выражений и предложений в формальную LaTeX-запись. В отличие от обычного speech-to-text, здесь нужно распознать не только слова, но и структуру: дроби, индексы, степени, пределы, суммы, интегралы, скобки, вложенные выражения и границы формул.

Например, фраза «два делить на пи» в обычной расшифровке может остаться как «2 делить на π». Но в LaTeX она должна стать \frac{2}{\pi}. Именно такой формат нужен для статей, учебников, конспектов, Overleaf и других LaTeX-редакторов.

Несмотря на прогресс в automatic speech recognition (ASR), задача прямого преобразования озвученной математики в LaTeX долго оставалась почти неразработанной. Более того, нормальных открытых датасетов с человеческими аудиозаписями для такой задачи практически не было. В нашей работе мы попытались закрыть этот пробел: собрали открытый двуязычный датасет и сравнили несколько подходов к Speech-to-LaTeX. В статье, которую мы представили на ICLR 2026, описан датасет из более чем 66 тысяч человеческих аудиозаписей и 571 тысячи синтетических аудиозаписей на английском и русском языках. 

Читать далее

Разбираемся в ML без воды: от базы до Attention. Часть 3

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели12K

Во второй части мы рассмотрели аналитическое решение задачи линейной регрессии и наткнулись на ряд неприятностей — сингулярность, плохая обусловленность, вычислительная сложность и т.д.

Логическим продолжением будет изучение (не побоюсь этого слова) сердца машинного обучения: градиентного спуска.

Читать далее

Разбираемся в ML без воды: от базы до Attention. Часть 2

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели11K

Итак, в предыдущей части мы остановились на поиске решения задачи линейной регрессии. Сформулировали в общем виде задачу машинного обучения, поняли суть параметров, рассмотрели функции ошибок и начали копать в сторону линейной регрессии.
Ещё раз повторю, что этот цикл статей является лишь взглядом на ML с моей колокольни, так что он не обязательно является истиной во всех редакциях в последней инстанции. Так что буду рад всякому, кто исправит меня, коли сверну не туда.

Читать далее

Мой универсальный код

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели9.5K

Как я улучшил универсальный код Элиаса 1975 года, заменив длину на popcount — и получил 36% экономии на метаданных. С бенчмарками! Картинка на обложке кринжовая, но тут вроде так принято? 😅

Читать далее

Сколько весит интернет: считаем массу данных и их хранилищ

Время на прочтение10 мин
Охват и читатели13K

Интернет — распределенная система, размер которой нельзя увидеть в окне «Свойства». Более того, ответ на вопрос «что считать интернетом?» существенно влияет на результат вычислений. Точных данных не найти, но отдельные исследования и статистика крупных интернет-ресурсов позволяют произвести примерные расчеты.

В этой статье вас ждет доступная в интернете информация об интернете, простые расчеты и, конечно же, статистика.

Читать далее

Разбираемся в ML без воды: от базы до Attention. Часть 1

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели11K

Сколько статей на хабре про машинное обучение? Обозначим их количество за N и напишем N+1‑ю.

Это попытка собрать цельное понимание: пройти путь от «что это вообще такое» до условных трансформеров и связать всё в одну логичную цепочку.

Попробую всё описать максимально простым языком, минимально опираясь на математическую терминологию.

Как говорится, буду разбирать так, как сам это вижу и понимаю — без лишней теории, но и без магии.

Читать далее

Шесть интересных логических задач

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели13K

Продолжаю публикацию интересных математических задач.

5 рациональных пиратов (А, Б, В, Г и Д) должны разделить 100 золотых монет. Иерархия: А — самый старший, Д — самый младший. Старший предлагает план дележа. Если за него проголосует хотя бы половина пиратов (включая его самого), план принимается. Если нет — старшего выбрасывают за борт, и право предложить план переходит к следующему. Как пират А должен разделить золото, чтобы остаться в живых и получить максимум?

Решение: Нужно рассуждать с конца. Если останутся только Г и Д, Г заберет всё (его голоса хватит для 50%). Чтобы этого не допустить, В должен предложить Д хотя бы 1 монету, чтобы тот поддержал его. Пират А знает это и предлагает: 98 — себе, 0 — Б, 1 — В, 0 — Г, 1 — Д. В и Д согласятся, так как при отказе и переходе хода к Б они могут не получить ничего или меньше.

Читать далее

Самовлюблённые числа: когда нарциссизм и бесполезность вдохновляют

Время на прочтение9 мин
Охват и читатели9.1K

Самовлюблённые числа (они же числа Армстронга, в оригинале Narcissistic numbers) — это числа, равные сумме своих цифр, возведённых в степень количества этих цифр. Например, 153 — самовлюблённое число, потому что 

153 = 1³ + 5³ + 3³

Известный математик Г. Харди отзывался об этом свойстве так: «Всё это забавные факты, весьма подходящие для газетных колонок с головоломками, способные позабавить любителей, но ничего в них не затронет сердце математика». 

Но действительно ли самовлюблённые числа настолько бесполезны? Чтобы узнать ответ, зайдите под кат.

Читать далее

Бесплатных опционов не бывает

Уровень сложностиСложный
Время на прочтение8 мин
Охват и читатели14K

Когда мы берем ипотеку или потребительский кредит, мы редко задумываемся о том, что банк, помимо денег, выдает нам сложный производный финансовый инструмент. Право в любой момент вернуть долг без штрафов — это классический call-опцион. Для заемщика это «бесплатная» страховка от падения ставок: если рынок пошел вниз, можно рефинансироваться и платить меньше.

Однако в финансах действует закон сохранения риска. Если у клиента есть право выбора, значит, у кого-то другого этого выбора нет. В структуре банка этим «кем-то» оказывается Казначейство (ALM).

Спустимся на уровень глубже в механику ценообразования банковских продуктов (Transfer Pricing, FTP) и попробуем оцифровать один из самых скрытых компонентов банковской маржи: Cost of Optionality.

Читать далее

Ближайшие события

Черную дыру фотографировали восемь телескопов. Фото собрал алгоритм

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели25K

10 апреля 2019 года человечеству показали оранжевый бублик. Журналисты назвали его «первой фотографией черной дыры». Через час картинка была у всех — мемы про глаз Саурона, шутки про пончик, антропоморфизация,  заголовки «ученые сфотографировали невидимое».

Проблема в том, что это не совсем фотография.Точнее сказать, это очень странная фотография: если бы вы использовали телескоп горизонта событий (англ. EHT — далее по тексту) «как камеру» и нажали кнопку, вы бы получили черный квадрат и никакого бублика. Потому что он делает измерения, из которых алгоритм уже собирает изображение…  которого нет.

Вот про этот алгоритм и про то, как 3,5 петабайта данных летели в Бостон самолетом, и пойдет речь.

Читать далее

Математическое моделирование непосредственно в 1С

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели7.1K

Сказ о том, как я воткнул в 1С модули математической оптимизации, а они оказались рабочими и расплодились до полноценной библиотеки. Теперь этот инфернальный софт пережевывает производственное планирование, маршрутизацию и прочие задачи комбинаторного космоса.

Читать далее

Рисуем с помощью закона Кулона. Как сделать генеративную модель на основе электростатики

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели7K

Привет, Хабр! Меня зовут Александр Колесов, я исследователь группы «Основы генеративного ИИ» AIRI. У себя в команде мы активно исследуем то, как устроена работа генеративных моделей, ищем новые методы, экспериментируем. Недавно мы обратили внимание на то, что те пути, которые проходят представления данных в диффузионных моделях, очень похожи на пучки силовых линий электрического поля. 

Это не только красивая метафора — мы предложили метод Electrostatic Field Matching (EFM), который позволять извлечь из такой аналогии пользу. Статью с подробным описанием мы недавно свозили на ICLR 2026, там все подробности, теоремы и эксперименты. Здесь же хотелось кратко пересказать основную идею и показать её реализацию на простых примерах.

Читать далее

Записки специалиста по математической оптимизации

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели7K

Что есть база в математической оптимизации и моделировании бизнес процессов? Целевая функция, ограничения, алгоритмы решения — безусловно, но есть ещё модели. Насмотренность, портфель типовых моделей и умение распознавать их в задаче придают дополнительный импульс процессу решения сложных задач.

Рассмотрим набор из шести классических постановок, которые нашли применение в решении широкого спектра задач. Материал будет полезен специалистам по математической оптимизации. Управленцы и менеджеры могут найти актуальные сценарии применения математической оптимизации для своих задач.

Читать далее

[ALM моделирование] На примере дефолта Silicon Valley Bank

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели15K

В условиях современного банковского надзора внезапный дефолт крупного банка — событие экстраординарное, особенно в США. Финансовые регуляторы выстроили глубоко эшелонированную систему защиты: Центральные банки непрерывно мониторят нормативы, проводят стресс-тесты и, как правило, действуют на упреждение.

В текущих реалиях довести банк до стихийного рыночного краха прежде чем регулятор превентивно вмешается и отзовет лицензию — задача со звездочкой, система спроектирована так, чтобы гасить пожары до их открытого возгорания.

В статье воссоздадим дефолт SVB в банковском ALM симуляторе: наберем тот самый портфель ценных бумаг, смоделируем изменение рыночной конъюнктуры и поведение вкладчиков.

Покажем, как невидимые банковские риски превращаются в реальную дыру в капитале, и убивают крупнейшие банки.

Читать далее

Как я доказал гипотезу Коллатца (3n+1) без математики

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели14K

Спойлер: только для себя.

Итак: Представьте себе бесконечную влево ленту, на которой записаны нули и единицы, но в любой момент справа идёт конечная часть числа, а левее — бесконечные нули (они не влияют на значение). Всё движение происходит у правого края.

На этой ленте живёт клеточный автомат со следующими правилами:

Читать далее

Метрика EICS — ищем у трансформера причинное место

Уровень сложностиСложный
Время на прочтение11 мин
Охват и читатели11K

У больших языковых моделей есть неприятное свойство: снаружи ответ может выглядеть одинаково уверенно и тогда, когда модель действительно «собрала» правильную причинную цепочку, и тогда, когда она просто выдала правдоподобный текст. Классические способы оценки неопределённости — энтропия распределения токенов, калибровка, ансамбли, conformal prediction — полезны, но обычно смотрят на модель как на чёрный ящик.

В этой статье я разберу другой подход: попробовать оценивать неопределённость не только по выходу модели, а по внутренней согласованности активной цепи трансформера. Речь пойдёт о метрике EICSEffective Information Consistency Score. Идея в том, чтобы за один прямой проход получить численную оценку того, насколько найденная трансформерная цепь ведёт себя согласованно и насколько её макроуровневое описание действительно несёт интегрированную информацию.

Статья основана на исследовательской работе об оценке неопределённости в трансформерных цепях на основе согласованности эффективной информации. Здесь я намеренно смягчил академическую подачу, оставив интуицию, формулы, алгоритм и практические ограничения.

Снять неопределённость
1
23 ...