Обновить
8K+
27

Пользователь

41
Подписчики
Отправить сообщение

Пробный экзамен в ШАД

Время на прочтение6 мин
Охват и читатели8.4K

Каждый год на экзамене в ШАД происходит одна и та же история.

Сильные студенты, которые хорошо знают математику, не добирают баллы. И дело часто не в знаниях. Кто-то «умирает» на второй задаче, потратив на неё три часа. Кто-то не успевает даже открыть последние задачи. Кто-то начинает паниковать, когда что-то идёт не по плану. В итоге результат оказывается сильно ниже реального уровня.

Читать далее

Просто о циркулянтах и их связи с дискретным преобразованием Фурье

Время на прочтение4 мин
Охват и читатели8.4K

В линейной алгебре и приложениях важную роль играют циркулянты — квадратные матрицы, в которых каждая строка, начиная со второй получается циклическим сдвигом вправо из предыдущей. Вот общий вид цикрулянта порядка n:

В этой статье мы устно найдём собственные значения матрицы её определитель (который тоже называется циркулянтом), ортонормированный базис из собственных векторов, выведем отсюда простую структуру алгебры циркулянтов, а также покажем их связь с гауссовыми суммами, дискретным преобразованием Фурье и приложениями.

Читать далее

У врат проективной геометрии, или как возникает двойное отношение

Время на прочтение5 мин
Охват и читатели9.4K

Мы придём к фундаментальному инварианту проективной геометрии — двойному отношению — решая задачу классификации конфигураций четырёх прямых на плоскости. Это своего рода миниатюра, в которой видно, насколько классификация четвёрок подпространств сложнее классификации троек. Именно, взаимное положение трёх подпространств определяется дискретными инвариантами — размерностями сумм и пересечений, а для четырёх подпространств таких инвариантов недостаточно — нужны непрерывные инваринаты, что видно уже на примере прямых.

Подчеркнём, что мы будем рассматривать только линейную структуру на плоскости, то есть:

1. начало координат фиксировано;

2. про длины и углы забудьте.

Читать далее

Готовимся к экзамену в ШАД: разбор задач по линейной алгебре последних лет

Время на прочтение5 мин
Охват и читатели7.7K

Тематика задач на вступительных экзаменах в Школу Анализа Данных (ШАД) Яндекса год от года несколько меняется. Отчасти это связано с появившейся возможностью использовать СhatGPT. Из важных изменений: в последние год-два стали появляться задачи на жорданову нормальную форму, хотя в программу экзамена она не входит (когда-то составленные программы редко обновляют). Мы разберём одну из таких задач с письменного экзамена. Кстати, на устном собеседовании встречались вопросы типа: сколько может существовать корней из данной матрицы A, то есть решений уравнения X^2=A. Или при каком условии хотя бы один корень можно извлечь. Тут жорданова форма очень сильно поможет. Для решения задач, как правило, достаточно формулировки основной теоремы. А если вы хотите понять логически простой способ найти жорданов базис, порекомендую учебное пособие Кряквина. Изложенный там метод мне показался гораздо проще, чем доказательства из известных университетских учебников.

Приступим к разбор задач письменных экзаменов.

Читать далее

Семинар в ШАД Хелпер: экстремальные задачи на графы

Время на прочтение5 мин
Охват и читатели7.1K

В теории графов, как и в других разделах математики, есть экстремальные проблемы. Они происходят как из практических задач, так и из эстетических соображений: найти оптимальное значение той или иной величины может быть и на практике необходимо, и просто любопытно. Многие из таких задач можно встретить на олимпиадах, кружках и экзаменах.

Вот подборка задач, предлагавшихся в разные годы в ШАД. Решения этих и других задач ШАД есть в нашем задачнике.

Задача 1. Дан граф без кратных ребер и петель с 40 вершинами. Известно, что у любого ребра хотя бы одним из концов является вершина, из которой выходит не более 4 других ребер. Какое наибольшее количество ребер может быть в этом графе?

Задача 2. (Усиление теоремы Мантеля 8.) В графе 2n вершин и n^2+1 рёбер, n\geq 2. Докажите, что в этом графе найдутся два треугольника с общим ребром.

Задача 3. В стране городов. Некоторые пары городов соединены авиалиниями. Оказалось, что любые города соединены друг с другом не более чем четырьмя авиалиниями. Какое наибольшее количество авиалиний может быть в этой стране?

Задача 4. В графе 40 вершин. Среди любых пяти найдётся одна, соединённая с четырьмя остальными. Какое наименьшее число рёбер в таком графе?

В этой статье мы покажем очень красивое решение следующей задачи теории графов XX столетия. Некоторые задачи из ШАД являются её вариациями или просто близки по духу.

Читать далее

ChatGPT на экзамене в ШАД 2025

Время на прочтение8 мин
Охват и читатели7.2K

В статье мы разберём задачи с онлайн-экзамена в ШАД в 2025 году. Посмотрим как решал этот экзамен искусственный интеллект.

По традиции экзамены в ШАД в 2025 году начались в мае. Первый этап - онлайн-тестирование. Прошедших онлайн-тестирование приглашают на второй этап - онлайн-экзамен. Особо отличившихся на онлайн-тестировании приглашают на олимпиаду. После онлайн-экзамена ожидается серия собеседований.

Организаторы разрешили пользоваться чем угодно кроме мессенджеров. Даже использование LLM не запрещалось.

Вот сводная таблица результатов различных LLM по задачам с онлайн-экзамена:

Читать далее

Может ли сумма НЕ ВСЕХ векторов, выходящих из центра правильного p -угольника, в его вершины, быть равна нулю?

Время на прочтение2 мин
Охват и читатели1.7K

Условие: Может ли сумма НЕ ВСЕХ векторов, выходящих из центра правильного p -угольника, в его вершины, быть равна нулю? p - простое.

Решение:

Читать далее

Три шага в ШАД: как пройти вступительные и не сойти с дистанции

Время на прочтение6 мин
Охват и читатели17K

В статье мы опишем этапы вступительного экзамена в ШАД в прошедшем 2024 году. Сформулируем рекомендации по подготовке к каждому этапу и в конце разберём интересную задачу с письменного экзамена.

Вступительный экзамен состоит из трёх этапов: онлайн-тестирование, письменный экзамен, собеседование. Все этапы можно было проходить онлайн. Отличившимся на онлайн-тестировании студентам предлагали написать олимпиаду. Её нужно было писать очно и в случае успеха этап с письменным экзаменом отменялся.

На всех этапах проверялись знания по математике, алгоритмам и программировании. На этапе собеседования дополнительно обсуждалась мотивация студента (подробнее чуть ниже). Время на всех этапах, кроме собеседования, 5 часов.

В таблице ниже мы собрали данные по задачам и проходным баллам.

Читать далее

AutoML и NAS

Время на прочтение12 мин
Охват и читатели2.7K

Автоматическое машинное обучение (AutoML) – это область исследований, целью которой является автоматизация ручных процессов настройки ML-пайплайнов, то есть полных циклов обработки данных при помощи ML-алгоритмов. Можно выделить основные этапы работы с данными в рамках стандартных подходов ML: сбор данных, их первичный анализ, предобработка (нормализация, кодирование признаков, оценка их важности и фильтрация, заполнение пропусков, поиск шумных признаков и выбросов в данных), выбор оптимальных моделей для решения задачи, возможные варианты комбинирования и ансамблирования моделей, оценка и внедрение итогового решения. Каждый элемент этой последовательности представляет из себя отдельную сложную задачу, требующую вложения труда специалистов. При этом та часть этих задач, которая представляет из себя подбор взаимозаменяемых элементов и оценку их производительности, может быть автоматизирована. Речь не идет об автоматизации сбора данных в широком смысле слова – слишком уж сложна и неоднородна эта задача – но автоматизация выбора наиболее оптимального набора моделей классического машинного обучения среди стандартного набора с учетом заранее поставленных ограничений кажется вполне решаемой проблемой.  Методы оптимального поиска таких пайплайнов и решения ряда сложностей, возникающих в связи с такой широкой постановкой, называются автоматическим машинным обучением.

Читать далее

Квантизация

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.3K

Если вы кликнули на данную статью, то скорее всего вы знаете, что в последнее время появляется огромное количество нейронных сетей. Они находят применение везде: и в задачах компьютерного зрения (Computer Vision, CV), и в обработке естественного языка (Natural Language Processing, NLP), распознавания и генерации речи (Speech-To-Text, STT; Text-To-Speech, TTS). Но есть что-то, что объединяет их все: у любой нейронной сети есть веса. И нам их, очевидно, нужно хранить и применять. Так как мы это делаем?

Если вы хорошо слушали и не забыли школьную информатику, вы скажете: в битах! И будете абсолютно правы. А сколько бит надо на хранение? Если мы возьмем какую-то стандартную библиотеку для обучения нейронных сетей (например PyTorch) и будем обучать модель самым простым образом, мы будем использовать тип данных FP32, он же Single precision. На каждое число мы будем выделять 32 бита. Тем не менее, сейчас стремительно набрали популярность большие языковые модели (Large Language Model, LLM), и в них огромное количество параметров. Недавно вышедшая модель от DeepSeek содержит порядка 671 млрд параметров. Можно оценить количество памяти, которая нам понадобится, если хранить все эти числа в FP32:

Читать далее

ChatGPT решает гробы с экзаменов в ШАД

Время на прочтение3 мин
Охват и читатели26K

Автор: Лыков А., к.ф.-м.н., академический руководитель Школы Высшей Математики и ШАДХелпера.

В статье мы посмотрим как справляется большая языковая модель o3-mini от OpenAI со вступительными задачами из школы анализа данных Яндекса.

В другой нашей статье мы выделили список достаточно сложных задач со вступительных экзаменов в ШАД (https://habr.com/ru/articles/869224/ ). На этих задачах и будем тестировать o3-mini.

Сразу скажем результат: из шести сложных задач o3-mini справилась с четырьмя. Переходим к самим задачам.

Задача 1. При каких натуральных  существует квадратная матрица порядка  с элементами  такая, что ее квадрат — это матрица из одних единиц?

Читать далее

Машинный перевод

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели4.6K

Автор статьи: Сергей Артамонов - DS Wildberries, Research Engineer Skoltech, аспирант мехмата МГУ, преподаватель Школы Высшей Математики

Машинный перевод - одна из самых старых и проработанных задач обработки естественного языка. Машинный перевод выделяется на фоне всего многообразия задач этой дисциплины, и для этого есть несколько причин. Во-первых, машинный перевод – одна из наиболее практически значимых задач всей индустрии: машинный перевод применим повсеместно, и едва ли найдётся область, в которой не требовалось бы автоматически переводить тексты с одного языка на другой. Во-вторых, история развития машинного перевода олицетворяет историю развития NLP в целом – в машинном переводе, как в зеркале, отражались популярные подходы к обработке языка своего времени. Наконец, машинный перевод уникален тем, что в определённом смысле в последние 70 лет был локомотивом ключевых изменений, происходивших не только в NLP, но и в AI в целом: огромное количество идей и разработок, составляющих сегодня техническую повседневность, были впервые опробованы в качестве методов улучшения задачи машинного перевода. Сегодня мы поговорим о том, как развивались методы машинного перевода, как машинный перевод двигал вперёд NLP, что он представляет из себя сегодня и как понять, хороший ли перевод перед нами.

Читать далее

Красивая задача на центр масс

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели7K

Разберём одну красивую задачу, подводящую к важному понятию аффинной геометрии —центру масс.

Пират зарыл клад на острове среди 20 деревьев и написал, как его искать: надо встать к первому дереву, пройти половину расстояния до второго, затем повернуть к третьему и пройти треть расстояния до него, и т. д., наконец, повернуть к двадцатому и пройти двадцатую часть расстояния до него. Увы, пират забыл указать, как занумерованы деревья! Сколько разных ям придётся выкопать кладоискателям, чтобы гарантированно найти клад?

Решим задачу для любого числа деревьев. Для двух деревьев надо вырыть одну яму посередине между ними. В случае трёх деревьев в вершинах треугольника мы пойдём по стороне, свернём на медиану и пройдём треть её длины, а значит, окажемся в точке пересечения медиан, независимо от нумерации деревьев. Снова достаточно одной ямы. "По законам жанра" так должно быть всегда. Докажем это.

Читать далее

Гробы на экзаменах в ШАД

Время на прочтение4 мин
Охват и читатели27K

Автор: Лыков А., к.ф.-м.н., академический руководитель Школы Высшей Математики и ШАДХелпера.

Гробом принято называть задачу на экзамене или олимпиаде, которую почти невозможно решить.В статье мы приведём несколько примеров из вступительных экзаменов в ШАД и классифицируем гробы на три типа.

В контексте экзаменов в ШАД, гробы появляются на экзаменах не каждый год и, как правило, находятся среди последних задач письменного экзамена. Выделим следующие типы гробов.

I) ''Классический'' — решение у задачи существует, полностью опирается на программу, использует необычные приёмы в решении, сложная даже для специалистов. Примеры:

Читать далее

Избранные задачи по алгебре с экзаменов в ШАД

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели19K

В этой статье мы разберём несколько важных идей, которые неоднократно применялись в задачах по алгебре на вступительных экзаменах в ШАД. Мы намеренно выбрали далеко не самые сложные задачи, ведь за гробовые задачи мало кто берётся на экзаменах в условиях ограниченного времени. Наша задача — обратить внимание на важные идеи линейной алгебры, знание которых составители нередко ожидают от поступающих. Зная эти идеи, решить задачи будет совсем легко. В противном случае придётся снова "изобретать велосипед" или искать какие-то обходные пути.

Читать далее

Альтернативная математика или математика собеседований

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели18K

Устройство в крупную IT компанию — непростой и порой длительный процесс. Работода‑ тели в ходе многочисленных собеседований проверяют кандидата со всех сторон. В частности, оценивают его способности решать задач и технические навыки. В статье мы расскажем о том, как готовиться к прохождению технических собеседований по математике и алгоритмам в IT компании, как в целом проходит процесс устройства на работу. (1)

При устройстве в иностранный хедж‑фонд XQuant на среднюю позицию у вас будет два тестирования по математике и программированию, одно hr собеседование, шесть технических собеседований, три интервью с биг боссами, одно интервью на сошиал фит, часть интервью на английском языке. При устройстве аналитиком в российские IT‑компании (Яндекс, Авито, Тинькофф,...) количество технических собеседований может варьироваться (по нашим оценкам от 2 до 7), но минимум два по алгоритмам и математике пройти придётся.

Для оценки IQ кандидата (2) или того, насколько быстро, оригинально и глубоко он может мыслить, ему предлагают решить задачи по математике, алгоритмам, а также брейнтизеры — головоломки на общую сообразительность. Некоторые задачи стандартные, из школьных и вузов‑ ских учебников, но часто на собеседованиях предлагают нестандартные задачи. Такие, которые не встречались ни в школе, ни в вузе (и даже ни в баре и ни на дискотеке). Например, такого характера (3):

Читать далее

Матрицы помогают в олимпиадных задачах

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8.2K

Мы разберём несколько красивых комбинаторных задач, которые решаются элементарно – стоит перевести их условие на матричный язык. А как решать без матриц – непонятно. Вообще, теория матриц имеет огромную сферу применения в том числе в комбинаторике, теории графов.

Задача 1 (ШАД). В ШАД поступили всего 10 студентов. Кураторы решили ограничить число доступных курсов и придумали набор простых правил:

Читать далее

Как трудно быть абитуриентом мех-мат МГУ

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели13K

Авторы делятся своими воспоминаниями о поступлении и учебе на механико ‑математическом факультете МГУ. На всякий случай: Ильичев Виталий — окончил кафедру «Математической логики и теории алгоритмов», доктор технических наук, Южный Научный Центр РАН; Маринин Андрей — окончил кафедру «Дифференциальных уравнений», преподаватель Нижегородского госуниверситета.

Эти реальные события произошли много лет тому назад, кажется, в 1967 году. В этот раз на первом экзамене — по письменной математике — предлагались четыре задачи. С точки зрения психологии не совсем ясно какой стратегии на данном экзамене лучше придерживаться. Так, первая «параллельная» стратегия заключается в беглом просмотре всех задач, чтобы примерно оценить их трудность, а затем уже приступить к аккуратному изложению решений. Хорошо, если быстро удается убедиться, что все задачи «вполне решаемы». Это вдохновляет, и позволяет быстро оформить работу. Разумеется, это рискованная стратегия, поскольку можно потратить много времени на поиске решения одной из трудных задач. И тогда не хватит времени на аккуратное оформление остальных. Вторая стратегия — последовательное решении предлагаемых задач. Если решить какую‑то задачу сразу не получается, то переходим к следующей.

Читать далее

Как выбирать онлайн-школу

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели3K

В настоящий момент онлайн-обучение очень популярно. В хорошей онлайн школе вы можете получить необходимые для работы и карьеры навыки. Особенно это актуально для технических специальностей и особенно датасаенса. Однако возникает проблема как определить является ли онлайн школа хорошей или нет. Статистика и отзывы являются хорошими показателями, но не единственными и не исчерпывающими. В настоящей статье мы рассмотрим, как правильно выбирать онлайн школу по программированию/высшей математике/анализу данных. 

Определяющими факторами для любого человека являются:

Читать далее

Знак перестановки: транспозиции vs инверсии

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели19K

В этой статье мы обсудим с разных сторон такое важное понятие, как знак перестановки. Перестановки играют важную роль в разных разделах математики, прежде всего в алгебре и комбинаторике. Знак (чётность) перестановки — это её важнейшая характеристика. На ней, в частности, основана теория определителей.

Перестановкой конечного множества называется любое его биективное (т. е. взаимно однозначное) соответствие на себя. Перестановку часто записывают в виде таблицы: в верхней строке — аргументы, в нижней — значения функции. Например,

Читать далее
1

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность