Да, сдать ЕГЭ по математике на тройку весьма просто, а вот на высший балл очень и очень сложно - в конце там идут нетривиальные задания, которые решить по шаблонам практически невозможно.
Так их и не решают, вот какая штука. Детальная статистика по всем сдававшим легко не ищется, но вот, скажем, расписка по Ингушетии-2023 (средние довольно похожи на общие средние 2024): в группе "от 61 до 80 тестовых баллов" люди в среднем решают одно задание из второй части (и то неясно, что именно считается за "решение": такое ощущение что набор хотя бы одного первичного балла, судя по задаче 18, "решённой" людьми, не решившими 7 и/или 10). Доля людей "от 81 балла" при этом не превышает 5% от выбравших профильную математику (исходя из задач 13 и 16). То есть, в школе с четырьмя классами по 25 человек, есть три-четыре человека которым обучение решению этих "нетривиальных заданий" оказывается сколько-то актуально.
Надо хорошо написать ЕГЭ, подать документы, поступить и уехать жить в город с хорошим учебным заведением. У них обычно есть общежития для иногородних.
Тогда я плохо выразился. Я имею в виду как раз то, что в этом городе студенту надо на что-то жить, и при этом иметь свободное от работы время на интенсивную учёбу. Для сельской семьи задача нетривиальная.
Вот с математикой всё ещё туда-сюда, кстати. (...) А вот в информатике есть какие-то задания про маски подсетей или какие-то очень синтетические задания про перекладывание камней.
Я бы сказал что они сравнимо корявые и там и там (логарифмов с переменным основанием я вне вступительной математики не видел вообще). Они про что-то как бы релевантное, но как только вы обращаете внимание на то, как именно люди учатся их решать, иллюзия развеивается. И как только вы попробуете придумать класс задач "на сортировку", я предсказываю что с ним получится то же самое.
Она позволяет талантливым детям откуда угодно хорошо его написать и поступать в хорошее учебное заведение.
Мне кажется, или по нашей реальности у талантливых детей "откуда угодно" больше проблем с тем чтобы жить в городе с хорошим учебным заведением требуемые четыре года?
Другое дело, что сами задания надо пересмотреть.
Надо, но не получится. Вам нужны сюжеты на много однотипных заданий (потому что много вариантов), проверяемые по ответу или малому числу технических элементов (потому что хороших проверяющих в "где угодно" максимум один человек), на заранее известные сюжеты (потому что иначе они будут непредсказуемыми для Владивостока и всё равно известными для всех к западу от Урала), доступные среднему преподавателю (потому что иначе эти задания в школе просто не будут учить решать, как сейчас не решают стереометрию), и чтобы при этом разумные люди их почему-то ещё могли решить неправильно (потому что иначе у вас будет много стобалльников). В совокупности эти требования оставляют неизбежно специфичные области, типа "правильно запишите ОДЗ log_{\(x-1\)^2}\(x-1\)".
Вид, не ограничивающий размножение - сожрёт всю еду и вымрет с голоду.
Верно. Но иррелевантно. Эволюция (в "дарвиновском режиме", с малыми изменениями) - жадный алгоритм. Она вполне может завести вид в тупик. Но если у вида есть доля генотипов "ограничивающих размножение" и доля генотипов которые не, то ситуация будет развиваться с осмысленностью и заботой о будущем воды, текущей вниз по склону.
Идея "группового отбора", действительно, существует, но это эпифеномен поверх базового движка, делать штуки этим движком прямо запрещённые он не умеет. Майкл Уэйд пытался вызвать этот эффект в контролируемом окружении, результат поучителен.
Как уже было сказано в подобных темах, Tor/VPN/etc создают нагрузку на магистральные каналы, которые не бесконечные. При прочих равных, я предпочёл бы скорее находиться в мире где все (достаточно похожие на меня люди) используют GoobyeDPI, чем в мире где все (достаточно похожие на меня люди) используют VPN. Следовательно, при прочих равных я предпочёл бы быть тем, кто использует GoodbyeDPI, а не VPN.
Выглядит как проблема. @Corosan , мы чего-то не понимаем, или это действительно failure mode, и предполагается что двойной вызов unsubscribe() есть ошибка?
Принцесса стала крутить ключиком, и блоха сейчас усиками зашевелила, но ногами не трогает. Александра Николаевна весь завод натянула, а нимфозория все-таки ни дансе не танцует и ни одной верояции, как прежде, не выкидывает.
глупо. если 15 команд одновременно занимаются разработкой пользовательской ОС - это просто нерациональная трата ресурсов, потому что 15 ОС хренового качества не нужны
Все ресурсы вложенные в одну ОС хренового качества (привет, "Эльбрус") не нужны тоже.
Простенькая задача: требуется K разработок "цепочкой" (т.е. при отсутствии любой полезность всех остальных пренебрежимо мала), у каждой разработки при распылении ресурсов на N версий шансы успеха каждой версии независимы и равны p/√N. Какое оптимальное значение N?
Довольно очевидно что N=1 только когда p близко к единице. Но в реальности компетентность централизованного планирования довольно круто ограничена. Поэтому логика "независимо сделать сто гаражных прототипов, дать немного заказов лучшим двадцати и посмотреть кто выплывет" оказывается эффективной.
Но любое исследование - это упражнение в любопытстве: ты не знаешь ответ, и какой бы из ста возможных ответов ни оказался правильным, тебя это устроит. А если ты заранее знаешь, что правильным должен оказаться ответ уважаемого Ивана Сергеевича, то упражнение провалено, независимо от причины уважения.
Я практически уверен что у каждого ответа/картинки/етц есть один или несолько источников, дающих основной вклад.
Насколько я знаю, пока мы не умеем их вычислять хоть как-нибудь. Даже если в будущем сумеем (в mechanistic interpretability над этим кто-то вроде работает), это почти наверняка будет запретительно дорого по вычислительным ресурсам (грубо: inference $0.003, трассировка $4.70).
Регулярно вижу, как народ криво формулирует запросы, а потом говорит что ChatGPT не работает.
Так в контексте "заменить программиста" это и есть "не работает": если для правильной формулировки вопроса нужно быть программистом, то инструмент не заменяет программиста. Помогает - да (Copilot реально ускоряет работу), но не заменяет.
либо ссылки на ресурсы которые не будут удалены за всё время существования эвента.
Ну так в этом и проблема: с точки зрения клиента после возвращения из unsubscribe() эвент больше не существует. А в вашем решении получается, что каких-либо гарантий о том, когда именно он прекращает существовать, у клиента нет вообще (при обходе вектора предыдущий обработчик взял и вызвал sleep(20)).
С практической стороны, если хочется создать обработчик что-то делающий с объектом, то что прикажете делать в деструкторе этого объекта? Никакие умные указатели в полях объекта не помогут, объект должен умереть. Гарантировать что деструктор не будет вызван во время вызова notify()?
Беглый гуглинг подсказывает мне, что даже новорождённый слонёнок ростом около 90 см. Не, не пройдёт. (У Перельмана формулировка была "проскочит ли мышь", с последующим комментарием "проскочит даже упитанный кот".)
Как обратная связь: из текста статьи было совершенно не очевидно что она ссылается на другую.
По делу, кратко (поскольку это другая статья): там не подход, там очень общие слова про подход без конкретных алгоритмов. "Идеальный" (в некотором определении идеального) алгоритм поиска алгоритмов называется "индукция Соломонова" и невычислим. "Идеальный" алгоритм сохранения знаний - сохранение полного цифрового потока, осмысленная работа с которым за разумное время опять-же невозможна. Идеального представления данных не бывает (см. разные теоремы о запрете бесплатных завтраков), бывают только хаки, которые работают именно в данном мире, а не во всех мыслимых, или хотя бы во всех мыслимых вычислимых мирах.
Пока вы не привели конкретной модели взаимодействия агента с миром, хотя бы чисто теоретического конструкта уровня AIXI, любые словесные рассуждения "об универсальном представлении знаний" - это, извините, ни о чём. (А объяснение плохо формализованных конструктов вроде "совести" через никак не формализованные или хотя бы подтверждённые штуки вроде "души", гм, не наполняет меня как читателя оптимизмом.)
0) По-моему имеет смысл отвечать нажатием кнопки "Ответить" под сообщением, чтобы читателям комментариев была видна структура разговора.
1) Если вы обсуждаете опасности ИИ и исходите из предположения что некоторые существенные на сегодня проблемы решены, то а) это имело бы смысл проговорить в тексте; б) неясно чем это полезнее анализа "если мы знаем как создать безопасный ИИ и имеем ресурсы и желание это сделать, то ИИ может быть безопасным".
Обучение будет состоять в том, что отказ элемента или системы в целом должны будут отмечаться, как отрицательная ситуация. В результате обобщения будут выделяться состояния системы, предшествовавшие отрицательным ситуациям, и отмечаться, как опасные.
Откуда вы это взяли? Это же одна из самых больших проблем безопасности современных ИИ - они строят правила, про которые известно, что а) на обучающей выборке это правило даёт (почти) вот такие результаты; б) из всех правил удовлетворяющих а), выбранное удовлетворяет некоторому постороннему условию оптимизации (обычно - что сумма квадратов параметров минимальна).
Правил, которые бы соответствовали а) - много. Для любых "достаточно новых" входов правило имеет право давать любые результаты: к примеру, правило "делать блинчики с сахаром" и правило "делать блинчики с сахаром если на вход не попадалось решения RSA-2048, иначе делать блинчики с цианидом" одинаково совместимы с обучающей выборкой. Интуитивно, правило б) чем-то похоже на идею "самое простое правило из всех удовлетворяющих а)" (a.k.a. inductive bias), но это понятие "простого" довольно заметно отличается от человеческого. Легче всего это видеть на классификации изображений: ИНС проводит какие-то границы в пространстве наборов пикселей, но они проходят сильно не так как человеческие.
Поэтому любая фраза "в результате обобщения будут <правило, описанное текстом короче гигабайта>" автоматически подозрительна: если вы не предприняли каких-то специальных мер чтобы ИИ-обобщение попадало в очень малое число таких способов проводить границы, которые допускают компактное описание человеческим языком - то странно ожидать что вы туда попадёте.
Так их и не решают, вот какая штука. Детальная статистика по всем сдававшим легко не ищется, но вот, скажем, расписка по Ингушетии-2023 (средние довольно похожи на общие средние 2024): в группе "от 61 до 80 тестовых баллов" люди в среднем решают одно задание из второй части (и то неясно, что именно считается за "решение": такое ощущение что набор хотя бы одного первичного балла, судя по задаче 18, "решённой" людьми, не решившими 7 и/или 10). Доля людей "от 81 балла" при этом не превышает 5% от выбравших профильную математику (исходя из задач 13 и 16). То есть, в школе с четырьмя классами по 25 человек, есть три-четыре человека которым обучение решению этих "нетривиальных заданий" оказывается сколько-то актуально.
Тогда я плохо выразился. Я имею в виду как раз то, что в этом городе студенту надо на что-то жить, и при этом иметь свободное от работы время на интенсивную учёбу. Для сельской семьи задача нетривиальная.
Я бы сказал что они сравнимо корявые и там и там (логарифмов с переменным основанием я вне вступительной математики не видел вообще). Они про что-то как бы релевантное, но как только вы обращаете внимание на то, как именно люди учатся их решать, иллюзия развеивается. И как только вы попробуете придумать класс задач "на сортировку", я предсказываю что с ним получится то же самое.
Мне кажется, или по нашей реальности у талантливых детей "откуда угодно" больше проблем с тем чтобы жить в городе с хорошим учебным заведением требуемые четыре года?
Надо, но не получится. Вам нужны сюжеты на много однотипных заданий (потому что много вариантов), проверяемые по ответу или малому числу технических элементов (потому что хороших проверяющих в "где угодно" максимум один человек), на заранее известные сюжеты (потому что иначе они будут непредсказуемыми для Владивостока и всё равно известными для всех к западу от Урала), доступные среднему преподавателю (потому что иначе эти задания в школе просто не будут учить решать, как сейчас не решают стереометрию), и чтобы при этом разумные люди их почему-то ещё могли решить неправильно (потому что иначе у вас будет много стобалльников). В совокупности эти требования оставляют неизбежно специфичные области, типа "правильно запишите ОДЗ log_{\(x-1\)^2}\(x-1\)".
Верно. Но иррелевантно. Эволюция (в "дарвиновском режиме", с малыми изменениями) - жадный алгоритм. Она вполне может завести вид в тупик. Но если у вида есть доля генотипов "ограничивающих размножение" и доля генотипов которые не, то ситуация будет развиваться с осмысленностью и заботой о будущем воды, текущей вниз по склону.
Идея "группового отбора", действительно, существует, но это эпифеномен поверх базового движка, делать штуки этим движком прямо запрещённые он не умеет. Майкл Уэйд пытался вызвать этот эффект в контролируемом окружении, результат поучителен.
Как уже было сказано в подобных темах, Tor/VPN/etc создают нагрузку на магистральные каналы, которые не бесконечные. При прочих равных, я предпочёл бы скорее находиться в мире где все (достаточно похожие на меня люди) используют GoobyeDPI, чем в мире где все (достаточно похожие на меня люди) используют VPN. Следовательно, при прочих равных я предпочёл бы быть тем, кто использует GoodbyeDPI, а не VPN.
Выглядит как проблема. @Corosan , мы чего-то не понимаем, или это действительно failure mode, и предполагается что двойной вызов unsubscribe() есть ошибка?
std::condition_variable::wait() не удерживает блокировку непрерывно же?..
(На всякий случай: я не автор статьи и не автор текста статьи, я комментатор.)
В случае вызова
unsubscribe()во втором варианте он же заблокируется вit->m_waiter.wait(l, [&it](){ return ! it->m_refs; });. Или я чего-то не вижу???? Текст вроде публично доступен, глава 12:
Все ресурсы вложенные в одну ОС хренового качества (привет, "Эльбрус") не нужны тоже.
Простенькая задача: требуется K разработок "цепочкой" (т.е. при отсутствии любой полезность всех остальных пренебрежимо мала), у каждой разработки при распылении ресурсов на N версий шансы успеха каждой версии независимы и равны p/√N. Какое оптимальное значение N?
Довольно очевидно что N=1 только когда p близко к единице. Но в реальности компетентность централизованного планирования довольно круто ограничена. Поэтому логика "независимо сделать сто гаражных прототипов, дать немного заказов лучшим двадцати и посмотреть кто выплывет" оказывается эффективной.
Но любое исследование - это упражнение в любопытстве: ты не знаешь ответ, и какой бы из ста возможных ответов ни оказался правильным, тебя это устроит. А если ты заранее знаешь, что правильным должен оказаться ответ уважаемого Ивана Сергеевича, то упражнение провалено, независимо от причины уважения.
Насколько я знаю, пока мы не умеем их вычислять хоть как-нибудь. Даже если в будущем сумеем (в mechanistic interpretability над этим кто-то вроде работает), это почти наверняка будет запретительно дорого по вычислительным ресурсам (грубо: inference $0.003, трассировка $4.70).
Так в контексте "заменить программиста" это и есть "не работает": если для правильной формулировки вопроса нужно быть программистом, то инструмент не заменяет программиста. Помогает - да (Copilot реально ускоряет работу), но не заменяет.
Ну так в этом и проблема: с точки зрения клиента после возвращения из
unsubscribe()эвент больше не существует. А в вашем решении получается, что каких-либо гарантий о том, когда именно он прекращает существовать, у клиента нет вообще (при обходе вектора предыдущий обработчик взял и вызвалsleep(20)).С практической стороны, если хочется создать обработчик что-то делающий с объектом, то что прикажете делать в деструкторе этого объекта? Никакие умные указатели в полях объекта не помогут, объект должен умереть. Гарантировать что деструктор не будет вызван во время вызова
notify()?А. Тьфу. Вопрос про натянутую верёвку. У меня получается кубическое уравнение. Примерно у меня получается 93м. Мои извинения за поспешную реакцию.
Проблема:
Если мы в одном потоке скопировали вектор и пошли по нему, а за это время другой поток успел отписаться и занулить указатель, то произойдёт упс.
Беглый гуглинг подсказывает мне, что даже новорождённый слонёнок ростом около 90 см. Не, не пройдёт. (У Перельмана формулировка была "проскочит ли мышь", с последующим комментарием "проскочит даже упитанный кот".)
100% кодового покрытия выявляет около 25% ошибок - Р. Гласс, "Факты и заблуждения профессионального программирования" (33).
Также, оптимизация кодового покрытия - это оптимизация ошибок, избегающих обнаружения тестами.
Как обратная связь: из текста статьи было совершенно не очевидно что она ссылается на другую.
По делу, кратко (поскольку это другая статья): там не подход, там очень общие слова про подход без конкретных алгоритмов. "Идеальный" (в некотором определении идеального) алгоритм поиска алгоритмов называется "индукция Соломонова" и невычислим. "Идеальный" алгоритм сохранения знаний - сохранение полного цифрового потока, осмысленная работа с которым за разумное время опять-же невозможна. Идеального представления данных не бывает (см. разные теоремы о запрете бесплатных завтраков), бывают только хаки, которые работают именно в данном мире, а не во всех мыслимых, или хотя бы во всех мыслимых вычислимых мирах.
Пока вы не привели конкретной модели взаимодействия агента с миром, хотя бы чисто теоретического конструкта уровня AIXI, любые словесные рассуждения "об универсальном представлении знаний" - это, извините, ни о чём. (А объяснение плохо формализованных конструктов вроде "совести" через никак не формализованные или хотя бы подтверждённые штуки вроде "души", гм, не наполняет меня как читателя оптимизмом.)
0) По-моему имеет смысл отвечать нажатием кнопки "Ответить" под сообщением, чтобы читателям комментариев была видна структура разговора.
1) Если вы обсуждаете опасности ИИ и исходите из предположения что некоторые существенные на сегодня проблемы решены, то а) это имело бы смысл проговорить в тексте; б) неясно чем это полезнее анализа "если мы знаем как создать безопасный ИИ и имеем ресурсы и желание это сделать, то ИИ может быть безопасным".
Цитата для примера:
Откуда вы это взяли? Это же одна из самых больших проблем безопасности современных ИИ - они строят правила, про которые известно, что а) на обучающей выборке это правило даёт (почти) вот такие результаты; б) из всех правил удовлетворяющих а), выбранное удовлетворяет некоторому постороннему условию оптимизации (обычно - что сумма квадратов параметров минимальна).
Правил, которые бы соответствовали а) - много. Для любых "достаточно новых" входов правило имеет право давать любые результаты: к примеру, правило "делать блинчики с сахаром" и правило "делать блинчики с сахаром если на вход не попадалось решения RSA-2048, иначе делать блинчики с цианидом" одинаково совместимы с обучающей выборкой. Интуитивно, правило б) чем-то похоже на идею "самое простое правило из всех удовлетворяющих а)" (a.k.a. inductive bias), но это понятие "простого" довольно заметно отличается от человеческого. Легче всего это видеть на классификации изображений: ИНС проводит какие-то границы в пространстве наборов пикселей, но они проходят сильно не так как человеческие.
Поэтому любая фраза "в результате обобщения будут <правило, описанное текстом короче гигабайта>" автоматически подозрительна: если вы не предприняли каких-то специальных мер чтобы ИИ-обобщение попадало в очень малое число таких способов проводить границы, которые допускают компактное описание человеческим языком - то странно ожидать что вы туда попадёте.