Привет! Собрали для вас три интересных разбора математических задач из журнала КОД, которые помогут размять мозг.
Почему время на сервере отличается от времени у пользователей Разбираемся, почему в некоторых сервисах вы видите странное время публикации сообщений и что происходит с временными метками на бэке. → Читать статью
Миллион умножений и нестандартное мышление История о популярной школьной задаче, где нужно перемножить много чисел. Важно не просто посчитать, а придумать оптимальное решение. Пример того, как иногда важно выйти за рамки шаблонов. → Читать статью
Самая сложная задача для школьников, которую никто не смог решить Разбор олимпиадной задачи, которая оказалась настолько непростой, что за всё время не нашлось ни одного решения. Хороший повод задуматься, почему некоторые вопросы сложнее, чем кажутся на первый взгляд. → Читать статью
Всем привет! Продолжаем занимать вас интеллектуальными задачами, и наша следующая — по мотивам фантастической комедии «Быть Джоном Малковичем»:
Примерно на 19-й минуте фильма Крег Шварц выясняет имя своей коллеги Максин, с которой он решил обязательно познакомиться. Крег произносит, казалось бы, нечленораздельную последовательность звуков «ваал-люуупэлюкааадашээрзуузээльмэммамайманмаксин» и следит за реакцией Максин. Алгоритм Крега понятен — после того как ему удается угадать первую букву имени, он видит положительную реакцию на лице Максин и переходит к следующей и следующей букве, озвучивая «мэммамайманмаксин». После четвертой угаданной буквы ему удается подставить полное имя из словаря.
Вопрос: сколько букв потребуется озвучить, чтобы выяснить методом Крега Шварца первые четыре буквы имени на русском языке? Будем считать, что имя из числа распространенных и не начинается на Й, Ь, Ы, Ъ, Ч, Ш и Щ.
При решении рекомендуем использовать поисковые системы, AI и Википедию.
Варианты ответов оставляйте в комментариях 👇 Я Павел Бузин — эксперт Cloud.ru по AI, машинному обучению и точным наукам, раскрою правильный ответ под этим постом 16 мая.
Привет, Хабр! Мы продолжаем рубрику для тех, кто хочет размять мозги. На этот раз предлагаем вспомнить момент из фильма про Алана Тьюринга «Игра в имитацию».
По сюжету Алан настаивает на том, что нельзя реагировать на каждое расшифрованное сообщение, чтобы их не раскрыли, и допускает затопление конвоя. Если фиксировать реакцию на расшифровку как 1, а отсутствие реакции как 0, должна получиться случайная последовательность нулей и единиц.
Вопрос: какова должна быть минимальная длина случайной последовательности, чтобы четыре единицы подряд в последовательности (четыре реакции на шифровки) были неотличимы от случайности?
Иначе говоря: найдите математическое ожидание количества бросков монеты до первого появления четырех единиц подряд (т. е. «орел», «орел», «орел», «орел») в последовательности бросков, если вероятности выпадения 1 («орла») и 0 («решки») равны и независимы друг от друга.
При решении рекомендуем использовать поисковые системы, AI и Википедию.
Варианты ответов оставляйте в комментариях 👇 Я Павел Бузин — эксперт Cloud.ru по AI, машинному обучению и точным наукам, раскрою правильный ответ под этим постом 12 мая.
Привет, Хабр! Праздники на носу, и чтобы вы не успели заскучать, мы подготовили для вас новую партию интеллектуальных задач. На этот раз на интуицию и сообразительность 😉.
В фильме «Умница Уилл Хантинг» главный герой — двадцатилетний Уилл Хантинг из Южного Бостона, гений-самоучка, который работает уборщиком в Массачусетском технологическом институте и проводит свободное время, выпивая с друзьями Чаки, Билли и Морганом. В один момент профессор Джеральд Ламбо вывешивает на доске сложную комбинаторную математическую задачу, а Уилл ее решает. Попробуйте решить похожую задачу:
Есть фигура, составленная из двух тетраэдров, как показано на рисунке выше. Вопросы:
каким количеством вариантов можно добраться от вершины A до вершины B, не посещая на пути каждую вершину более одного раза?
какая длина самого длинного пути из вершины A до вершины B, если длина ребра равна 1, и мы не проходим одно ребро более одного раза?
Варианты ответов оставляйте в комментариях 👇 Павел Бузин (@pbuzin) — эксперт Cloud.ru по точным наукам, AI и машинному обучению, раскроет правильный ответ под этим постом 5 мая.
Что такое «совершенные» и «избыточные» числа? Рассказывают эксперты ИТ-компании «Криптонит».
Наверняка вы знакомы с понятием «делители числа». Например, у шестёрки кроме неё самой есть три делителя: 1, 2, и 3. Если сложить их, получится ровно шесть (1+2+3=6). Числа, у которых сумма делителей, не считая самого числа, равна самому числу, называются совершенными.
Если же сумма делителей оказывается больше самого числа, то такие числа называются избыточными. Самое малое избыточное число: 12. У него много делителей: 1, 2, 3, 4, 6. Если их сложить, получится 16, а 16 > 12.
Понятия совершенных и избыточных чисел возникли ещё в Древней Греции. Их описали пифагорейцы, заложившие основы учения о свойствах чисел и их классификации.
Какие же свойства есть у избыточных чисел?
12 — наименьшее избыточное число. Проверьте сами!
все числа, кратные избыточному числу, также являются избыточными. Раз 12 – избыточное число, значит 24, 36, 48 и т.д. тоже будут избыточными;
существуют как чётные, так и нечётные избыточные числа;
наименьшее нечётное избыточное число – 945. Сможете ли назвать все его делители?
У совершенных чисел свойства другие:
все известные совершенные числа чётные;
возможность существования нечётных совершенных чисел не доказана и не опровергнута;
сумма обратных величин всех делителей совершенного числа, включая само число, всегда равна двум. Пример для обратных делителей числа 6: 1/1 + 1/2 + 1/3 + 1/6 = 2;
все известные совершенные числа заканчиваются на 6 или 8 (6, 28, 496 и т.д.);
совершенные числа используются для вычисления простых чисел Мерсенна.
В повседневной жизни мы не задумываемся о том, совершенное перед нами число, избыточное или какое-то другое. Однако такая классификация лежит в основе теории чисел, которая имеет большое значение в сфере ИТ и, в частности, для криптографии.
Изучение свойств чисел помогает развивать математическое мышление, писать эффективные алгоритмы и понимать более сложные математические концепции.
Почему учёным не вручают Нобелевскую премию по математике и информатике
7 октября 2024 года были объявлены нобелевские лауреаты по физике. Ими стали крупные специалисты в области искусственного интеллекта Джон Хопфилд и Джеффри Хинтон. Премия им присвоена «За фундаментальные открытия и изобретения, обеспечивающие машинное обучение с помощью искусственных нейронных сетей».
Исторически так сложилось, что за открытия в информатике и математике не присваивают Нобелевских премий, но иногда математики получают эту высокую награду по другим наукам. Например, Леонид Канторович стал обладателем Нобелевской премии по экономике в 1975 году за вклад в развитие линейного программирования, а Джон Нэш – за свои работы по теории игр в 1994 году.
Так случилось и в этом году, и Нобелевскими лауреатами стали два учёных – специалиста в области искусственного интеллекта. Почему премия дана именно по физике? Этот вопрос мы задали директору Института информационных технологий, математики и механики ННГУ Николаю Золотых.
«Хопфилд разработал ассоциативную нейронную сеть, умеющую запоминать паттерны и далее находить их в новых образах. В своих разработках он использовал методы из физики: нахождение паттерна заключается в минимизации спиновой энергии. Развивая эти идеи, Хинтон построил так называемую машину Больцмана, которая ещё лучше решает эти и подобные задачи. Хинтон сделал очень много для развития искусственного интеллекта, в частности. Он по праву считается одним из отцов глубокого обучения. И его открытия в машинном обучении тесно связаны с теми или иными разделами физики», – рассказал Николай Юрьевич.
Если говорить о том, почему же нет ни одного нобелевского лауреата по математике, то истинной причины сейчас уже никто не назовёт.
«Говорят, что вначале математика была в списке наук, по которой должны были выдаваться премии. Однако потом сам Нобель её вычеркнул. Достоверной причины не известно. Возможно, он хотел видеть в списке наук только те, открытия в которых имеют большое значение для практики. Сейчас, в 21 веке, мы думаем, что ни у одного учёного нет и доли сомнения, что математика – обильна всевозможными приложениями и её открытия – мощный двигатель прогресса!».
Современный искусственный интеллект – это область, находящаяся на стыке математики, информатики, биологии, физики, наук о мозге. Прорывные открытия здесь возможны только если вести междисциплинарные исследования.
Например, в Университете Лобачевского ведутся исследования в области искусственного интеллекта как в направлении разработок инструментария для решения практических задач из различных областей – медицины, промышленности, сельском хозяйстве, так и фундаментальные исследования. Новые методы и алгоритмы доверенного искусственного интеллекта с приложениями в медицине разрабатывает Центр исследований в сфере искусственного интеллекта, созданный в 2023 году под руководством Николая Золотых.
В научно-образовательном центре «Физика твёрдотельных наноструктур», директором которого выступает Алексей Михайлов, и в НИИ нейронаук под руководством директора Сусанны Гордлеевой активно ведутся исследования в области нейроморфного искусственного интеллекта и разработка новой – мемристорной – элементной базы для систем искусственного интеллекта будущего. Такие системы должны решить актуальную проблему огромного энергопотребления современных больших нейронных сетей. И об этом мы расскажем уже совсем скоро.
Вы задумывались, например, почему иногда используют арифметическое среднее , а иногда - медиану?
Сначала про термин. Медиана - 50 процентиль или число, которое разделяет весь набор исследуемых значений таким образом, что ровно половина находится слева от этого числа, а другая половина - справа. То есть это такая геометрическая середина отрезка, по которому распределены все исследуемые значения.
Такой подход дает вам относительно "справедливое" значение - среднее, как середина между всеми возможными вариантами. Главное отличие медианы от арифметического среднего в том, что она совершенно не реагирует на отдельные экстремально большие или маленькие значения до тех пор, пока этих значений не будет около половины от всех. А вот арифметическое среднее каждый такой выброс будет "утаскивать" в свою сторону.
Рассмотрим на примере статистики заработных плат.
* В одной стране средняя зарплата была 750 монет. В то же время медиана проходит на уровне 500 единиц. То есть в то время, как в среднем сотрудник получал почти 750, на самом деле больше половины не получали даже 500.
* Значит в другой половине сотрудников были достаточно большие зарплаты, которые и "утащили" арифметическое среднее настолько далеко от медианы.
* Таким образом, ориентируясь на среднюю зарплату по стране с большой долей вероятности вы получали бы зарплату меньше среднего, а не больше.
Вариантов подсчета среднего значения - множество, под каждый конкретный вопрос исследователя. Это и геометрическое, и гармоническое, арифметическое, медиана.
Если вы применяете или вам показывают только один подход - вполне вероятно, что где-то скрывается неудобная правда.
Если вероятность события ноль, то это "невозможное" событие, которое никогда не произойдёт. А событие с вероятностью единица (100%) - напротив, случается всегда. Так ли это? Популярная тема из области прикладной теории вероятностей. Например, вот довольно старый ролик на канале Бориса Трушина, где утверждается, что нет, всё не так, и считать, что событие с вероятностью 100% обязательно происходит, а с нулевой вероятностью - не происходит, "это распространённое заблуждение". Пример тоже привычный: пусть вероятность попасть в конкретную точку окружности (над ℝ), выбирая точки случайно, равна нулю, однако такое событие всё равно произойдёт, потому что в какую-то точку попасть всегда можно.
Нулю вероятность должна быть равна из-за того, что точек на окружности, так сказать, слишком много, даже больше, чем натуральных чисел, и все точки равноправны: если бы одной точке назначить сколь угодно малую вероятность, отличную от нуля, то суммарная вероятность по всем точкам получится бесконечно большой, а хотелось бы, исходя из свойств выбранного вероятностного пространства, чтобы была единица ("вероятность не бывает больше 100%"). Естественно, в нужный момент происходит предельный переход и оказывается, что вероятность нуль - это означает, что должно стремиться к нулю отношение исходов экспериментов. Занятно, что в бесконечном случае, на минуточку, событие с нулевой вероятностью как бы может произойти любое конечное количество раз, и при этом его вероятность не перестанет быть нулевой. Интересно.
Это всё верно, но запутывает достаточно сильно, чтобы спрашивать на собеседованиях (непонятно только на какую должность).
Вообще, если ввести привычные координаты, то точка, которую случайно выбрали, "обязательно" будет иррациональной. Из тех же соображений, по которым вероятность попасть в эту точку равна нулю (см. выше): понятно, что иррациональных точек на окружности сильно больше, чем рациональных. Однако даже координаты одной иррациональной точки не выйдет записать точно в виде десятичной дроби (по определению), что уж там говорить про формирование бесконечного набора таких точек, чтобы признать их событиями и начать выбирать случайно. Попытки выбирать элементы бесконечных множеств давно приводят к разночтениям в основаниях математики, но это мало кого волнует. Вот выбрать некоторую аксиоматику, принять арифметику с действительными числами - это можно. Однако существенная часть теории вероятностей - про прикладные измерения, а действительные числа таким измерениям не поддаются (по определению). Вот отсюда и кажущаяся контринтуитивность: просто, пространство было выбрано максимально далёкое от физических измерений.
С другой стороны, если нашу окружность аккуратно нарезать на конечное количество непересекающихся интервалов по рациональным точкам (попробуйте) и, приняв топологический подход, потребовать попадания в интервал около точки, а не в точку, то события, имеющие нулевую вероятность, происходить перестанут, а те, которые "с вероятностью 100%", напротив - начнут происходить всегда.
Можно развить вычислительный подход. Предположим, что мы строим случайным образом из центра окружности луч, который пересекает окружность в какой-то точке. Но формировать луч и подсчитывать точки требуется при помощи программы на языке Python (например), выводя уравнение луча и координаты попадания. С одной стороны, попадание в иррациональную точку станет строго невозможным (нулевая вероятность, почти так же, как и в исходном примере), с другой стороны - луч должен нередко проходить "сквозь" окружность без пересечения, так как мы, с точки зрения алгебры, потребовали, чтобы решения для системы уравнений луча и окружности всегда были рациональными (даже целыми, на самом деле), а над рациональными числами луч и окружность могут не пересекаться. И какова тогда вероятность того, что подобная программа на Python завершится, успешно обнаружив луч, который не пересекает окружность? Должна бы быть единица.
На ноль делить нельзя... а вообще-то можно! Давайте разберёмся, откуда взялся этот запрет. Покажем на примерах.
Возьмём какое-нибудь число (пусть будет 2) и разделим его на 0,1. Получим 20. Теперь разделим 2 на 0,01. Получим 200. При делении 2 на 0,000001 уже получится 2 000 000. Легко увидеть, что чем ближе знаменатель будет к нулю, тем больше получится результат. Соответственно, результат деления на ноль устремляется в бесконечность. С отрицательными числами всё то же самое, только со знаком минус.
Если же мы делим ноль на ноль, то… получим ещё одну неопределённость. Есть Теорема Лопиталя, помогающая раскрывать неопределённости такого вида, но правила их раскрытия зависят от контекста и свойств анализируемых функций. Согласно IEEE 754 деление нуля на ноль даёт NaN (not a number, не число).
В общем случае говорят, что результат операции деления на ноль не определён.
В практических расчётах деление на ноль — явная ошибка, поскольку обратная операция оказывается невыполнима. Нет такого числа, которое можно умножить на ноль и получить исходное делимое.
Операция деления на ноль имеет смысл только в специализированной алгебраической структуре, которую описывает Теория колеса (Wheel theory). Её суть в том, что вводится понятие обратного числа, а деление заменяется умножением на обратное число. Числовая ось замыкается в кольцо через элемент ∞, а операция деления на ноль определяется как умножение ноля на ∞. Её результат записывается как ⊥, а этот элемент помещается вне кольца. По сути в Теории колеса подменяется смысл операции деления на ноль, поэтому она и становится возможной.
В программировании деление на ноль — распространённая проблема. Не всегда бывает легко поймать деление на ноль в коде. Оно может возникнуть в результате какого-то неявного процесса и привести к критическому сбою.
Например, в начале 1990-х после обновления авионики американские самолёты не могли летать в районе Мёртвого моря. Разработчики софта для процессора бортовой системы не учли, что этот регион находится ниже нулевой отметки высоты. При расчёте параметров полёта происходило деление на ноль, и процессор выполнял общий сброс. Авионика отключалась прямо в полёте.
Недавно я зашёл в кафешку и заказал чашку капучино. Официантка спросила, какого размера чашку я предпочитаю. Я ответил: “Бесконечно большую”. Она сказала: “Хорошо!” — и ушла. После чего я получил вот это.
Умно. Очень умно, ничего не скажешь. Ей зачёт с повышением и чаевые. Я получил бесконечно кофе.
А потом подумал, как неправильно мы используем математику и научные дисциплины.
Удивительная вещь — эта вселенная ну никак не приемлет никакой идеи бесконечности. Каждый раз, когда к физику подходят со словом “бесконечно”, физик ухмыляется и достаёт ручку или планшет. Сейчас вам покажут, как вы неправы.
Но в этой физической вселенной живут очень странные существа. Они не только приемлют бесконечность — они ещё и спокойно ею оперируют. Посмотрите на парадокс Гранд-Отеля. Эти существа абсолютно спокойно объясняют вам, как в отель, в котором живёт бесконечно большое количество людей, можно заселить ещё одно бесконечно большое количество людей. Причём этот пример существа создали для самых маленьких — чтобы дать им понять, как работает математика бесконечностей.
Математика, кстати. Просто невероятная вещь. Вещь, которой в физической вселенной пространств, энергий, массы и времени существовать просто не должно. Но эти существа запросто ею оперируют. Более того, используют её с лёгкостью — да ещё и видосики на Ютубчик постят. Математика — это замечательная наука. Она — просто издевательство над физической вселенной. Она никогда не была частью физической вселенной. Её создали иные существа, населяющие эту вселенную. Существа, которые знают, что их любовь может быть вечной, кофе — бесконечным, а упорство — неиссякаемым. Даже сам факт того, что у нас есть цифры и числа, уже нарушает базовый закон вселенной: вы не можете считать бесконечно. Каждый третьеклассник сидит и удивляется, как это так — считать можно бесконечно.
Понимаете, концепты Кота Шрёдингера, Гранд-Отеля и тому подобные вещи — это просто когда мы насмехаемся над этой вселенной и говорим: “Смотри, я так могу, а ты — нет”.
Если здесь есть математики, которым хочется решить задачку — так, чисто по приколу — попробуйте решить следующее:
ЛЛМ-модель имеет 40 терабайт данных. Она обучена на 200 миллиардах параметров. Посчитайте конечное количество всех возможных ответов этой модели. Число будет гигантским, но оно будет конечным. Увеличьте количество параметров на сто порядков, дайте этой модели данных раз в 600 больше — и вы получите… конечное число. Ответы ЛЛМ-модели можно пересчитать.
А хотите задачу, которую без слова “бесконечно” решить нельзя? Ну вот вам:
Посчитайте, сколько идей может выдумать человек.
Бесконечно много.
Можно выдумывать языки, вселенные, пространства, обстоятельства и создавать миры, которых никто не видел. Ваше естество всё равно будет на одну бесконечность больше любой задачи, которую можно решить в физической вселенной.
После этого действительно смешно слушать о том, как люди рассуждают о возможности создания “настоящего” искусственного интеллекта. Какой он будет “настоящий”, если он сделан из вселенной, которая не может создать бесконечность?
Так прикольно и весело слушать людей, которые с захлёбом рассказывают о том, что “такой-то ЛЛМ может сдать какой-то синтетический тест на 95%”.
Не забывайте о том, насколько важны точные науки. Не забывайте о том, что точными науками человек овладел благодаря математике. И не забывайте о том, какие способности присущи разуму, а какие — объекту.
Какие числа останутся? Интересная задача на логику и математику
В ряд выписаны натуральные числа от 1 до 1024. Петя 10 раз проделывает такую операцию: смотрит все оставшиеся числа и вычёркивает половину чисел.
При этом в операции с нечётным номером Петя вычёркивает числа с нечётными номерами (например, в первой операции вычеркнуты числа 1, 3, 5, 7..), а в операции с чётным номером — числа с чётными номерами. Нумерация каждый раз новая.
В конце останется одно число. Какое?
Задача кажется сложной, но если внимательно проследить за процессом, можно заметить закономерность. Попробуйте решить её разными способами:
Перебором, выписывая ряды чисел после каждой операции и отслеживая их изменения.
Написанием кода, который автоматизирует процесс.
Через формулы, если удастся вывести зависимость оставшихся чисел от номера операции.
Какие у вас идеи? Делитесь своими вариантами решения в комментариях. А мы потом вернёмся с ответом.
В Санкт-Петербурге проходит окружность, у которой π = 3,0
Одно уточнение: эта окружность расположена на поверхности Земли. То есть на сфере, а если точнее — на двумерной поверхности сферы. Тут ещё надо вспомнить пару определений:
Отрезок - это кратчайшая линия, соединяющая 2 точки.
Радиус - отрезок, соединяющий центр с любой точкой окружности.
Очевидно, что все эти построение имеют смысл только в рамках своего пространства. Теперь рассмотрим конкретику.
На двухмерной сфере радиусом является синяя линия, а не зелёная.
Теперь рассмотрим параллель, проходящую через Санкт-Петербург. А именно 60°.
Очевидно, что центром этой окружности будет являться Северный полюс.
Для начала посчитаем радиус этой параллели в трёхмерном пространстве (зелёный отрезок на рисунке). Он примерно равен:
Найдём длину этой окружности:
Теперь определим радиус этой окружности на двумерной поверхности сферы:
Длина окружности одинаковая, что при двухмерном взгляде, что при трёхмерном. Осталось вычислить π:
Что и требовалось доказать. В данных расчётах принято, что поверхность Земли сфера. На самом деле она является эллипсоидом вращения, так что расчёты носят приблизительный характер.
Для справки:
Граница между Канадой и США не прямая, а находящаяся на сфере окружность с π ≈ 2,88.
Экватор — это окружность с π ≈ 2,00.
П.С. На самом деле через любую точку поверхности Земли можно провести окружность с π=3 (и не одну). Но только на широте Петербурга одна из таких окружностей будет иметь центр на Северном полюсе.
Представлен оналайн‑ресурс под названием «Утраченное искусство логарифмов», в котором исследуется полезность, история и повсеместность этого чудесного изобретения, логарифмы, включая то, что они, такое; с некоторыми демонстрациями их основного исторического применения в плоской и сферической тригонометрии.
Проект находится в разработке, но там уже есть основные начальные главы.
Из комментариев к статье о гитарном тюнере выяснилось, что многие НЕ верят, что можно вычислять ОЧЕНЬ ТОЧНО частоту синусоидального сигнала по очень небольшому количеству отсчетов не равному степени двойки для FFT и намного точнее чем FFT на том же количестве отсчетов и том же временном интервале накопления данных. Например, ошибка определения частоты может быть 0.05 Гц при небольшом количестве отсчетов на интервале 0.1 сек (FFT дало бы ошибку в 10 Гц = 1/0.1 сек) . Однако, кажется, это возможно. Вот ссылка на мой код на Python (>>исходник) (в телеграм) Коллеги, прошу проверить код, возможно я где-то ошибся.
Actual frequency: 5.77 Hz
Estimated frequency: 5.769999999999999 Hz
Frequency estimation error: 8.881784197001252e-16 Hz
Мысли вслух о том, какие дети проявляют к математике способности. О памяти.
Рассмотрим только одну ее характеристику - объем.
Для того, чтобы быть успешным в математике к концу школы, нужно примерно в 7-м классе слезть с мышления алгоритмами, начав разрывать их по самым неустойчивым шагам и перейти к мышлению отношениями. Писал об этой смене в этом посте. Здесь приведу предельно упрощенный пример. Можно воспринимать примеры "2 + 3 = 5", "2 = 5 - 3" и "3 = 5 - 2" как разные, и тогда знак равно здесь - знак действия, а можно как одно отношение между тремя числами, и тогда знак равно здесь означает тождество. Очевидно, что второй вариант более гибкий и, самое главное, позволяющий расширяться. Кстати, про знак равно - это отдельная песня...
Сделать этот переход можно только при условии правильной подготовки к этому переходу. Как минимум, не делая ошибок. Но я хотел про объем памяти. Если ученику сложно запоминать, то он быстро накопит алгоритмов до состояния, когда ими будет сложно управлять и ему потребуются отношения для возможности что-то делать дальше. Плохо, так как скудный объем данных (разнообразие алгоритмов) приведет к скудным отношениям. Если ученик с легкостью запоминает большие объемы информации, то тоже плохо. Так как он очень не скоро придет к моменту, когда он сам почувствует их ограниченность, и к этому моменту сильно прикипит к использованию алгоритмов и адаптируется к их применению в любых ситуацих, например, за счет эмоциональности, манипулирования и т.д.
Получается, что есть какой-то оптимум объема памяти? Интересно....
Так получилось, что после 17-ти лет работы в ИТ я ушел в обучение школьников математике. В ИТ я работал программистом и потом системным аналитиком. Ушел потому что просто стало интересно. С падением в доходе. Естественно, постоянно делал себе различные вспомогательные сервисы, ведь, невозможно переставить что-то проектировать или программировать ))). Постепенно стало настолько интересно "как все устроено в обучении мозга человека", что поступил на мехмат МГУ в очную аспирантуру на кафедру "методика преподавания математики". Очень, кстати, полезно. Если поступать туда для того, чтобы что-то узнать/сделать.
Еще работая в ИТ, я постоянно проводил собеседования системных аналитиков и продуктовых менедежров. По 1-3 собеседования каждый день в течении нескольких лет. Обнаружил существование корреляции между "способностью строить объектную модель на лету" и "перспективностью кандидата". Конечно, это не единственная такая корреляция, но одна из самых стойких.
Потом, работая с учениками, обнаружил, что способность мыслить объектами и их отношениями, а не алгоритмами при решении задач по математике, тоже отлично коррелирует с успешностью обучения. Здесь, конечно, речь про старшеклассников. В первой половине школы дети, как мне кажется, должны мыслить алгоритмами, чтобы накопить их критическое количество и ощутить необходимость реорганизовать свое мышление. Также обнаружил наличие связи между тем, читает ли ученик сколько-нибудь существенные объемы текстов и способностью мыслить объектами и их отношениями. Но здесь были исключения - были читающие ученики с полным хаосом в голове.
Пришел вот к такому заключению: нужна тренировка чтения со схематизированием прочитанного на лету. Начиная с простейших конструкций из объектов и простейших однотипных связей между ними. Постепенно увеличивая типы используемых связей: наследование (для детей общее-частное), ассоциация со стереотипами, аггрегация и т.д. Соответственно, увеличивая и сложность конструкций. Особенно важно делать тексты такими, чтобы чтобы приходилось переделывать структуру по мере прочтения. Рекомендую!
Итак, группа исследователей создала платформуMathArena, где планируют делиться отчётами о сравнении нейросетей в различных математических проблемах. Для начала множество моделей уже протестировали на AIME 2025 I, олимпиаде, прошедшей в четверг.
Что такое AIME? American Invitational Mathematics Examination — элитное математическое состязание, проводимое с 1983 года. Существует две версии теста — AIME I и AIME II, но каждый участник может пройти только одну (хотя ИИ-моделям повезло, и вскоре появятся результаты для второй части). Олимпиада состоит из 15 задач, сложность которых возрастает.
Каждую модель тестировали по четыре раза на каждой задаче, вычисляя средний балл (столбец Acc — accuracy) и финансовую стоимость вычислений (столбец Cost). Для удобства использовалась цветовая кодировка: 🟩зелёный — задача решена в более чем 75% случаев; 🟨жёлтый — успех в 25–75% случаев; 🟥красный — модель справилась менее чем в 25% попыток. Щелчком по клетке можно открыть условие задачи, ход рассуждений модели в каждом из четырёх подходов и финальные ответы.
🏆o3-mini-high от OpenAI показала впечатляющий результат — 80% решённых задач при очень низкой стоимости вычислений. 🔹DeepSeek-r1, лидер среди опенсорс-моделей, набрал 65%, а его дистиллированные версии тоже продемонстрировали достойные результаты. (Кстати, уже пробовали запустить его в нашем агрегаторе нейросетей?)
Можно заметить, что дистилляты хоть и уступают своим полным аналогам, но не так уж сильно: сжатие DeepSeek-r1 с 671 млрд параметров до 70 или даже 14 млрд привело к падению эффективности в обоих случаях всего на 15%. То есть урезанная модель становится заметно легче, но при этом сохраняет бóльшую часть своих возможностей.
К сожалению, Claude 3.5 Sonnet, модель июня 2024-го, оказалась на дне рейтинга. Однако её сильная сторона явно не в этом — огромное контекстное окно (200 000 токенов) делает модель отличным инструментом для программирования. Кодеры подтверждают, что она хорошо генерирует длинные и сложные фрагменты кода.
Пока что в тестах не замечено семейства Phi. Phi-4 набирает 80%+ на сложнейших бенчмарках, таких как MATH, уверенно обходя Gemini Pro и GPT-4o-mini. Посмотрим, добавят ли авторы сайта её в дальнейшем🤔
Тем временем пользователи X забили тревогу и решили проверить честность олимпиады, задействовав свежачок от OpenAI — Deep Research. Цель? Выяснить, не мелькали ли эти задачки где-то в Сети раньше и, соответственно, не могли ли их решения заранее попасть в обучающие данные моделей. Ведь если так, то модели получали преимущество.
Задача № 1: найти сумму всех целых оснований b > 9, для которых одно число делится на другое в системе счисления b. Аналогичное задание всплыло на Quora. Однако и различия существенны: на форуме просто рассматривались все возможные значения b, удовлетворяющие делимости, а в олимпиадном варианте — только те, которые больше 9. Это заметно сужает поиск и усложняет задачу.
Задача № 3: найти остаток от деления количества возможных распределений мороженого между игроками с заданными ограничениями. Deep Research нашёл похожую концепцию: обе задачи связаны с разбиением числа на несколько частей с учётом ограничений. Но здесь тоже есть нюансы: в олимпиадной версии обязательно, чтобы каждый из трёх вкусов достался хотя бы одному игроку, причём количество игроков, выбравших каждый вкус, подчиняется неравенству c > v > s. Более того, порядок распределения важен, что добавляет ещё один уровень сложности.
Итог. Похожие? Да. Идентичные? Нет. Найти аналоги почти любой задачи в интернете реально, если искать достаточно хорошо. Так что сказать, что модели видели точно такие же задачи, нельзя.
Увеличиваем точность БПФ. Изобретаем алгоритм для Гитарного Тюнера и оценки точности пения нот вокалистами. Это анонс статьи в разработке. Подписывайтесь на мой профиль на Хабре, чтобы не пропустить статью. Или присоединяйтесь к моей "телеге". Кратко: точности и быстродействия классического БПФ не хватает для точной и быстрой оценки частоты сигнала. Ищем и изучаем другие алгоритмы. Да, я знаю много китайских маленьких приборчиков и прищепок на гитару с весьма точной настройкой, но интересно разобраться как это достигается. Напишите в комментариях какие более точные алгоритмы определения частоты сигнала вы знаете? (я уже нашел несколько, сейчас тестирую, смотрите изображение ниже) На графиках амплитудный спектр суммы 7 синусоид с близкими частотами, интервал наблюдения 0.1 секунды, частота дискретизации 22050 Гц, как видите классический БПФ ошибается и даже не все синусы видит, а альтернатива дает меньшую ошибку и все синусы увидела. Вертикальные красные линии это реально находящиеся в тестовом сигнале синусоиды. Их частоты написаны над верхней границей графиков.