Игорь Воронцов @master_program
Преподаватель МФТИ и ВШЭ, физик, Data Scientist
Information
- Rating
- 66-th
- Location
- Москва, Москва и Московская обл., Россия
- Date of birth
- Registered
- Activity
Specialization
Data Scientist
Intern
Преподаватель МФТИ и ВШЭ, физик, Data Scientist
Потому что они оценивали скорость поиска минимума конкретных видов функций. RLHF всё-таки другая область науки, хотя тут и есть пересечение.
Но в целом это вопрос к авторам, почему они только это сравнение делали.
Один из авторов статьи работал над стартапом по созданию "умной" кофемашины. Клиент, пробуя два напитка с разным составом, выступает в роли оракула, говоря, какой из них ему нравится больше. Оценка клиента "какой из напитков лучше" - играет роль порядкового оракула. Умная кофемашина, используя оценки клиента, оптимизирует состав кофе.
Определение порядкового оракула из статьи
φ(x, y) = sign [f(x) − f(y) + δ(x,y)]
f(x) и f(y) — это значения целевой функции в точках x и y, которые мы хотим сравнить. Сами эти значения нам неизвестны.
sign[...] — это математическая функция знака. Она возвращает:
+1, если выражение в скобках больше нуля (означает, что f(x) > f(y)).
-1, если выражение меньше нуля (означает, что f(x) < f(y)).
0, если выражение равно нулю (означает, что f(x) = f(y)).
δ(x,y) — это ограниченный шум. Шум означает, что сравнение может быть неточным, но ошибка этого сравнения (δ) не превышает некоторого известного предела.
Таким образом, порядковый оракул — это механизм (черный ящик), который на вход получает две точки x и y и сообщает, какая из них "лучше" (где значение функции меньше или больше), возможно, с небольшой погрешностью.
У Нестерова есть похожий алгоритм, так в этой работе они его обогнали по скорости, написано же.
Нет, оракул возвращает результат сравнения двух значений функции. Значения самой функции он не возвращает.
А в этой работе оракул - это чёрный ящик. Там не важно, как он это делает, важна оценка количества таких операций сравнения.
При моделировании абстрактного алгоритма они обычно этого не делают. А так много разных случаев есть, тут в комментариях описаны некоторые примеры. Например, можно приближенно вычислять значение с точностью, достаточной для сравнения, но не большей.
Аналог формулы 3 в документе работает для любых матриц 2 на 2. Можно от нее двигаться в обратном направлении. Напишу статью на Хабр
Например, в сложных климатических или физических моделях полный расчет одного набора параметров может занимать недели. Иногда проще запустить два укороченных расчета и по промежуточным результатам определить, какой из них "более перспективный", не дожидаясь финального значения.
Или, к примеру, для AB-тестирования, мы сравниваем качество вариантов между собой, но обычно нет простого показателя качества.
Дегустация вкуса, как тут было отмечено - отличный пример.
Пусть, например, есть точки x = a и x = b. Мы не знаем и не можем узнать, чему равны f(a) и f(b), но порядковый оракул дает ответ на вопрос, верно ли, что f(a) > f(b) или f(a) < f(b).
В практических задачах редко бывает, когда значение совсем никак узнать нельзя, но часто бывает ситуация, когда вычисление значения функции гораздо дороже, чем вычисление сравнения двух значений. В таких случаях актуально использование алгоритмов, которые используют порядковые оракулы.
Всё объяснение тут заключено здесь "позволяют сравнивать значения функции, не обращаясь к ее значениям непосредственно".
Значения вычислять не можем, а сравнивать два значения можем между собой.
Аналитические функции довольно легко считать от произвольных матриц 2 на 2 с комплексными коэффициентами, там общая процедура для всех таких матриц. С интегральной теоремой Коши для таких матриц аналогично.
А кватернионы - это всего лишь частный случай этих матриц.
Ну да, примерно так оно и есть. Развитие КТП для новых классов полей, которое, возможно, подойдет для описания квантовой гравитации.
Во-первых очень сложно. Потому что это практически чистая математика, исследование касается математических объектов с абстрактными названиями. Фейнману было проще объяснять, потому что его физика всё-таки привязана к объектам реального мира.
Во-вторых, если попробовать проще написать, что авторы статьи под этим не подпишутся (они любят точность формулировок) и не получится публиковать текст с оригинальной цитатой.
Конкретно этот релиз менее года назад писал совместно с одним из автором статьи, Никитой Заиграевым, он в моем черновике правил и обсуждал со мной каждый мой абзац, чтобы информация была корректно написана.
Ну тут у него грубые ошибки. В первую очередь про коллимацию потока. Джет летит с очень малым углом рассеяния, практически прямой, описывается это уравнением Грэда-Шафранова. Я сам на втором курсе МФТИ делал проектную работу по информатике, взял сделать такую модель как раз, потому что был на астрофизической кафедре. Ширина этого пучка с течением времени растёт, но очень медленно, так что даже за миллион лет не разваливается. В течение достаточно долгого времени расхождение можно считать линейным с очень малым углом, но дальше конечно быстрее, я рисовал графики - сначала линией граница джета долго идёт, потом в параболу превращается и джет быстро разваливается.
Кроме того, джет не из фотонов состоит, а в основном из протонов. Высокая плотность там только где-то у основания, а через всю Галактику бьёт уже довольно разреженный пучок. И хотя его плотность очень низкая, частицы летят со скоростью, близкой к скорости света, и опасны. Например, в литературе есть сравнение, если джет через нашу планету будет лететь, то через несколько месяцев на ней не останется атмосферы, он её сметет.
Насчёт чёрных дыр, они то как раз мощнейшие источники излучения, потому что излучают объекты, которые на них падают. В центре нашей Галактики находится сверхмассивная чёрная дыра, в области вокруг нее постоянно происходят мощнейшие взрывы, которые убили бы всю жизнь на земле, если бы наша планета не находилась где-то на окраине Галактики, защищенная пылевым рукавом как скафандром.
Эффективный объем зависит от степени загрязнения. Каждая частица очищает столько, сколько органики может прилипнуть на её поверхности.
Проблемы с количеством титана решаются тем, что использовать одни и те же наночастицы можно неограниченное число раз.
Да, изначально они должны быть промыты. Но потом их можно использовать неограниченное число раз без промытия. Для очищения от органики достаточно отжига
Там написано
"Наночастицы TiN могут быть использованы повторно. Для этого нужно отжигать наночастицы при температуре горения органических примесей. В большинстве случаев достаточно нагревать до 300 градусов по Цельсию"
Она на архиве есть Gate-controlled proximity effect in superconductor/ferromagnet van der Waals heterostructures
Я написал вам личное сообщение с дополнительной информацией.
Ну в первом абзаце
"Оказалось, что первая модель может быть согласована с наблюдениями, а остальные две нет. "