Как стать автором
Поиск
Написать публикацию
Обновить
204.09

Математика *

Царица всех наук

Сначала показывать
Порог рейтинга
Уровень сложности

Правда ли KAN лучше MLP? Свойство разделения глубины между двумя архитектурами

Уровень сложностиСложный
Время на прочтение9 мин
Количество просмотров945

Прошлым летом в свет вышла новая архитектура нейронных сетей под названием Kolmogorov-Arnold Networks (KAN). На момент выхода статьи про KAN эта новость произвела фурор в мире машинного обучение, так как KAN показывала существенный прирост в качестве аппроксимации различных сложных функций. Ошибка новых сетей падает значительно быстрее при увеличении числа параметров. Однако, за все приходится платить, и цена таких маленьких значений функции ошибки - медленное обучение: KAN обучается примерно в 10 раз медленнее, чем старый добрый MLP. Из всего этого возникает вопрос: насколько все же уместно использование новой архитектуры вместо привычных всем MLP?

В данной статье будет найдена функция, которая может быть реализована с помощью двухслойного KAN полиномиальной ширины, но не может быть приближена никакой двухслойной ReLU MLP сетью с полиномиальной шириной

Читать далее

Новости

Как я написал покер‑бот за 4 недели, используя Cursor + GPT

Уровень сложностиСредний
Время на прочтение22 мин
Количество просмотров4.1K

Мой первый опыт публикации и рассказ о том, как я за четыре недели сделал рабочую альфа-версию покер-бота. В проекте использованы методы Монте-Карло, компьютерное зрение (YOLO), Python и инструменты вроде Cursor и Roboflow.

Текст будет полезен новичкам в машинном обучении и компьютерном зрении, тем, кто хочет понять, как связать ИИ, детекцию объектов и покерную математику в одном проекте, а также всем, кто интересуется практическим применением ИИ для создания собственных инструментов.

Читать далее

Как измеряли расстояние до Луны без компьютера и калькулятора? Открытия древних математиков

Время на прочтение5 мин
Количество просмотров10K

Привет, Хабр! Сегодня вычислительные мощности растут экспоненциально. Это значит, что каждый год удваивается количество транзисторов на чипе, с помощью которых можно решать все более сложные задачи, создавать продвинутые нейросети и технологии. 

Но человечество совершало масштабные открытия, меняющие мир, задолго до появления компьютеров: древние ученые определяли радиус Земли и расстояние до Луны, вычисляли число пи и закладывали основы математической логики. Разбираемся, как они это делали без калькуляторов, процессоров и алгоритмов. 

Читать далее

Галлюцинации и многообразия. Зачем искусственному интеллекту многомерные миры

Время на прочтение11 мин
Количество просмотров1.8K

Сейчас на Хабре много пишут о галлюцинировании нейронных сетей и больших языковых моделей в частности. Хорошим введением в эту тему, написанным с философских позиций, мне представляется текст уважаемого Дэна Рычковского @DZRobo «Когда ИИ закрывает глаза: путешествие между воображением и галлюцинациями». Базовое техническое погружение в тему вы найдёте в статье уважаемой @toppal «Причины возникновения галлюцинаций LLM», это перевод академической статьи специалистов Харбинского технологического института, опубликованной в конце 2024 года. Действительно, в большинстве источников галлюцинации ИИ рассматривают либо в негативном ключе, либо как неизбежный побочный эффект, связанный с попытками «вшить» синтетический аналог воображения в вычислительную сеть.

Я же хочу остановиться на менее известном аспекте работы нейронок, в котором галлюцинации могут восприниматься как положительная и даже необходимая часть работы алгоритма. Речь пойдёт об искусственном повышении размерности данных, подаваемых на вход в нейросеть, и о том, к чему такая практика может приводить. Наиболее известное проявление такого эффекта известно в англоязычных источниках под названием «проклятие размерности» (curse of dimensionality).

Читать далее

Исчисление геометрии 3. Проективная внешняя алгебра

Уровень сложностиСредний
Время на прочтение20 мин
Количество просмотров3.5K

Продолжаю серию статейсерию статей, в которой даётся мягкое, но последовательное введение в принципы построения геометрических алгебр.

Внешняя алгебра, рассмотренная во второй части, позволила нам получить алгебраическую модель аффинного векторного пространства. Однако геометрией, даже школьной, в таком пространстве заниматься не получится. Когда все имеющиеся в нашем распоряжении подпространства привязаны к одной общей точке, особо содержательной геометрии не построить. Прямых и плоскостей в ней может быть навалом, но даже элементарного треугольника соорудить не получится, потому что точка во всей такой геометрии одна единственная, и всё без исключения прямые проходят через неё.

В этой части мы превратим аффинную геометрию в гораздо более содержательную проективную геометрию, оставаясь в пределах внешней алгебры. Рассмотрим как алгебраически представляются базовые элементы такой геометрии и основные операции с ними, познакомимся с идеальными объектами, а также выясним какие ограничения накладывает алгебра на наши геометрические возможности.

На картинке для привлечения внимания вращается четырёхмерная сфера, построенная средствами внешней алгебры.

Читать далее

Как выбрать оффер? Задача о разборчивой невесте и правило 37%

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров11K

В течение месяца вы проходите собеседования, получаете офферы — и хотите выбрать лучший. Но каждый оффер живёт недолго: если не согласитесь вовремя, к нему уже не вернуться. Как действовать, чтобы выбрать самый лучший?


Это версия классической задачи о разборчивой невесте. У неё есть красивая оптимальная стратегия — правило 37\%. Возможно, вы о нём слышали. Но знаете ли вы, почему оно работает? И как вообще до него додуматься?


Часто алгоритмы — это эвристики, без гарантии оптимальности. Но в этой задаче всё иначе. Мы шаг за шагом переоткроем правило  37 \% и докажем, что он действительно лучший

Недавно я узнал о Теореме о Шансах — более общем подходе, который, неожиданно, работает гораздо проще, чем классическое доказательство. По-русски о ней еще никто не писал

В статье мы разберём эту теорему, выведем правило 37\% и увидим, как в задаче естественно появляется число e — и какой у него смысл на самом деле

Эта задача стоит того, чтобы пройти её до конца. Будет понятно, красиво и интересно

К правилу 37%

Топ-5 сервисов для решения школьных задач по математике: лучшие нейросети 2025 года

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров4.7K

Когда я учился в школе, самым передовым способом разбирать темы, которые плохо дались на уроке, был сайт с ГДЗ. Ну или, если повезло, — «Знания», где добрые души пытались объяснить, откуда берётся загадочный икс. Но как же было бы здорово, если бы там быстро отвечали на все вопросы и разбирали каждый шаг — ещё и на другие шаги!

Теперь, с появлением нейросетей, достаточно сфотографировать задачу — и алгоритм не только решит её, но и подробно объяснит всё, что вы спросите. Понятное дело, что со стандартной школьной программой они справляются неплохо. Но сегодня мы решили пойти чуть дальше: протестировать нейросети не только на типовом задании, но и на олимпиадной задаче.

Мы взглянем на пятерых цифровых математиков. Посмотрим, на что они действительно способны. И пришло ли время, когда эра ГДЗ остался в прошлом, а его место заняли алгоритмы?

Приятного чтения!

Читать далее

Задача Византийских Генералов

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров5K

Представьте: 1453 год, стены Константинополя.

Несколько армий окружили последний оплот Византийской империи. Генералы должны атаковать одновременно – иначе провал. Но среди них есть предатели, готовые сорвать операцию. Связь только через гонцов, которые могут не дойти или солгать.

Как в таких условиях принять единое решение?

Эта задача казалась чисто академической, когда в 1982 году ее впервые сформулировали в научном журнале. Тогда никто не мог предположить, что через несколько десятилетий ее решение станет основой революции, которая изменит представление о деньгах, доверии и власти.

Сегодня эта же проблема решается каждые несколько секунд в блокчейне TON. Валидаторы сети – это те самые византийские генералы, которые должны договориться о том, какие транзакции подтвердить. И среди них тоже могут быть "предатели" – мошенники, пытающиеся обмануть систему.

Без понимания этой связи невозможно разобраться в работе любого современного блокчейна. Ведь в основе каждого из них лежит ответ на простой вопрос:

Как группе незнакомцев договориться о чем-то важном, не доверяя друг другу?

Читать далее

Matrix Reloaded: зачем дата-сайентисту линейная алгебра

Время на прочтение9 мин
Количество просмотров2.9K

Зачем дата-сайентисту векторы, матрицы и собственные значения? В статье Марии Жаровой, ML-инженера Wildberries и автора канала Easy Data, — простое объяснение, как линейная алгебра помогает понимать, что происходит внутри моделей машинного обучения. Без доказательств и зубрежки: только визуализации, реальные кейсы и примеры из практики.

Читать далее

Как информатики научились разоблачать ложь

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.9K

На протяжении десятилетий криптографическое сообщество опиралось на преобразование Фиата — Шамира как на надёжный инструмент для построения неинтерактивных доказательств. Эта техника позволила компьютерам "доказывать истину" без диалога, обеспечив безопасность блокчейнов, систем аутентификации и протоколов обмена ключами. Но что если сама логика этой схемы уязвима?

В новом исследовании международная группа криптографов — Рон Ротблум, Дмитрий Ховратович и Лев Суханов — вскрыла неожиданный изъян в фундаменте цифрового доверия.

Читать далее

Новый рекорд по упаковке сфер неожиданно пришёл из геометрии

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров5.1K

В математике поиск оптимальных моделей никогда не заканчивается. Не является исключением и задача упаковки шаров — как максимально эффективно запихнуть шары в коробку (с большим числом измерений). Она привлекает математиков уже несколько столетий и имеет важные приложения в криптографии, дальней связи и многом другом.

Это обманчиво простая задача оборачивается чрезвычайно сложной. В начале XVII века физик Иоганн Кеплер показал, что, укладывая трёхмерные сферы так, как укладывают апельсины в продуктовом магазине, можно заполнить около 74% пространства. Он предположил, что это наилучшее возможное расположение. Но математикам потребовалось почти 400 лет, чтобы доказать это.

Читать далее

Конечный автомат, машина Тьюринга, порождающая грамматика и компьютер: в чём разница

Уровень сложностиСложный
Время на прочтение12 мин
Количество просмотров2.5K

В данной статье мы разъясним вопрос, который, находясь в самой основе теоретического программирования, при этом парадоксальным образом очень часто объясняется неправильно или неполно, причём эти неправильные объяснения даже иногда входят в учебные пособия (по крайней мере, известный китайский чатбот не смог мне правильно ответить на вопрос об отличии машины Тьюринга от конечного автомата, хотя, казалось бы, они приходятся чатботу ближайшими родственниками, и он мог бы изучить область деятельности своих создателей в обучающей выборке).

А в конце мы немного пофилософствуем на тему, что же такое программа и что такое семантика.

Читать далее

В решение этой математической задачи с укладкой блоков сложно поверить

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров23K

Вот удивительный эксперимент, который вы можете попробовать провести у себя дома: соберите несколько игрушечных блоков и положите их на стол. Возьмите один блок и медленно, сантиметр за сантиметром, продвигайте его за край стола, пока он не окажется на грани падения. Если у вас есть терпение и твёрдая рука, у вас должно получиться сбалансировать его так, чтобы ровно половина свисала с края. Стоит сдвинуть его ещё дальше, и гравитация победит. Теперь возьмите два блока и начните сначала. Укладывая один блок на другой, как далеко вы сможете завести конец верхнего блока, чтобы он высунулся за край стола?

Читать далее

Ближайшие события

Реализм против платонизма. Неполнота Гёделя, неразрешимость Тьюринга и физические основания математики

Уровень сложностиСредний
Время на прочтение56 мин
Количество просмотров7.4K

Многие интеллектуалы склонны называть математику «царицей наук» и преподносить её теоремы как абсолютную истину, полученную чисто логическим дедуктивным выводом безотносительно физической реальности, не опираясь на эмпирические данные. Якобы математические объекты существуют вне пространства-времени, в разуме Бога или в платоновском мире идей, а мы лишь открываем вечные истины: числа и арифметические операции, геометрические фигуры, аксиомы и теоремы, а также правила вывода и доказательства истинности или ложности любых математических утверждений. Говорят, наше сознание имеет прямой доступ к этому миру математических абстракций посредством интуиции – не иначе, как божественного откровения или снисхождения самой истины, открывающейся только тем, кто её достоин.

Но в данной статье я собираюсь обосновать прямо противоположную и достаточно крамольную идею, что всё наше математическое знание производно от физического знания, а не наоборот. Знание не имеет гарантий, его невозможно получить одной логикой или интуицией. Знание экспериментально, подвержено ошибкам и не является абсолютной истиной, так как мы изучаем математику на опыте, взаимодействуя с физическими объектами. Поэтому математика ничем не лучше и не «точнее» естественных наук. За такую ересь инквизиторы уже могут приговорить меня к сожжению на костре, но пока этого не произошло, позвольте объяснить и обосновать свою позицию.

Читать далее

Странная физика, которая дала жизнь искусственному интеллекту

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров8.8K

Современные «мыслящие» машины возникли благодаря открытиям в области физики сложных материалов.

Спиновые стекла могут оказаться самыми полезными из бесполезных вещей, когда-либо обнаруженных. 

Эти материалы — обычно состоящие из металла, а не стекла — демонстрируют загадочное поведение, которое заинтересовало небольшое сообщество физиков в середине 20-го века. Спиновые стекла сами по себе не имеют какого-либо практического применения, но теории, разработанные для объяснения их странностей, в конечном итоге вызвали сегодняшнюю революцию в области искусственного интеллекта. 

В 1982 году учёный, изучающий физику конденсированного состояния, Джон Хопфилд, позаимствовал теорию спиновых стёкол, чтобы построить простые сети, которые могли учиться и иметь воспоминания. Сделав это, он оживил изучение запутанных сетей цифровых нейронов, которые были в значительной степени заброшены исследователями искусственного интеллекта, — и вывел физику в новую область: изучение разума, как биологического, так и механического. 

Читать далее

Лучшие алгоритмы 20 века по версии SIAM

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров7.5K

На рубеже веков SIAM опубликовали список из 10 алгоритмов, оказавших наибольшее влияние на науку и индустрию в 20 веке (по мнению редакции), четверть века спустя по меньшей половина из этого списка до сих пор используется повсеместно. В статье вспомним что это за алгоритмы и за что они получили такое признание. Обсудим и алгоритмы, которые в этот список не вошли, но вполне могли бы, о чем читатели хабра написали в комментариях к статье "10 лучших алгоритмов 20 века". В конце статьи опрос, пожалуйста, не проходите мимо и отметьте или напишите в комментариях, какие алгоритмы на ваш взгляд должны были оказаться в этом списке!

Читать далее

Всё, что нужно знать о своих планах, случайностях и стохастическом программировании

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров3.2K
Все мы прекрасно знаем, что очень часто наши планы идут не по плану именно из-за случайностей. В такие моменты очень трудно обойтись без жаргонизмов, нецензурной брани и отборного трехэтажного. Но все же есть способ сделать наши планы более устойчивыми и состоятельными — это стохастическое программирование (далее SP — stochastic programming).


Читать дальше →

Ещё один множительный прибор, связанный с теоремой Слонимского (который я «восстановил», не видя его)

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.6K

На Хабре была опубликована статья [1], в которой описывался прибор для умножения многозначного числа сразу на все множители от 2 до 9 – так называемые «бруски Иофе», предложенные в 1881 году Гиршем Залмановичем Иофе. В статье говорилось, что это был один из двух вычислительных приборов, в основе устройства и работы которых лежит теорема Слонимского. Сразу же замечу, что если быть точным, то речь должна идти не о теореме Слонимского, а о следствии из неё – так называемой «полной таблице Слонимского» (о ней – ниже).

Мне стало известно, что в Музее науки в Лондоне имеется экспонат «Filipowski's calculating rods (56)»/«Счётные стержни Филиповского (56)» (рис. 1) (https://collection.sciencemuseumgroup.org.uk/objects/co60566/filipowskis-calculating-rods-56),

который, как выяснилось, также связан с указанной таблицей:

 

Читать далее

Аспирант решил классическую задачу о пределах сложения

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров7.4K

Самые простые идеи в математике одновременно могут быть и самыми сложными.

Возьмём, к примеру, сложение. Это простая операция: одна из первых математических истин, которую мы узнаем, гласит, что 1 плюс 1 равно 2. Но у математиков до сих пор остаётся много вопросов о том, к каким закономерностям может привести сложение. «Это одна из самых простых вещей, которые можно сделать», — говорит Бенджамин Бедерт, аспирант Оксфордского университета. «Но почему-то она до сих пор остаётся во многом загадочной».

Исследуя эту загадку, математики также надеются понять пределы возможностей сложения. С начала XX века они изучают природу «свободных от сумм» множеств — наборов чисел, в которых сумма никаких двух чисел не окажется равным третьему числу из этого множества. Например, сложите любые два нечётных числа и получите чётное число. Таким образом, множество нечётных чисел свободно от сумм.

Читать далее

Винтик и Шпунтик, часть 3: лемма Бернсайда и генерация орбит

Уровень сложностиСредний
Время на прочтение26 мин
Количество просмотров1.5K

Это третья часть моих наработок по решению задачи Винтика и Шпунтика в рамках челленджа @vvvphoenix. В прошлой части мы хорошо так свернули формулу включений-исключений для ускорения вычисления ответа. В этой части мы дополнительно ускорим вычисление, разбив слагаемые формулы на классы эквивалентности, где в каждом классе слагаемые одинаковые и их надо будет вычислять только один раз. В этом нам поможет комбинаторная теория групп и её применение в задачах о раскрасках. По большей части эта статья содержит общую теорию решения подобных задач, так что эта информация может быть полезна и вне контекста задачи про Винтика и Шпунтика.

Читать далее
1
23 ...

Вклад авторов