Search
Write a publication
Pull to refresh

Comments 6

На мой взгляд, эта статья замечательна не столько своим содержанием, сколько размышлениями, которые она «индуцирует» у читателя.

Я думаю, что со временем наука придумает или подберёт подходящий термин для описываемого феномена, поскольку «размерность» здесь используется скорее как метафора, а не как строгое понятие.

Очевидно, что классическая «физическая размерность» и миллиарды параметров нейросетей - вещи очень разные.

Спасибо за интересную статью, заставляющую задуматься!

Да, я такого термина действительно не нашёл, но надеюсь, что в целом понятная аналогия получилась

Очевидно, что классическая «физическая размерность» и миллиарды параметров нейросетей - вещи очень разные.

Почему же? Это наше восприятие ограничено трёхмерным миром ( и нет, время - это не четвёртое измерение). Если параметры действительно независимы - они вполне себе измерения. А если они всё же зависимы, но проще напихать их в модель и пожечь побольше энергии, чем сводить к меньшей размерности - ну что ж..

Если же клумба будет из нашего мира, то пусть её размеры составят 100 x 100 метров. В таком случае, чтобы засадить её по периметру, понадобится уже 10 000 (100 x 100) растений

Нет. чтобы засадить её по периметру, понадобится всего лишь 400 растений. А вот чтобы засадить по площади, понадобится 10000.

В то же время, если во всех трёх случаях мы не будем стремиться к равномерному заполнению всего доступного пространства, а оставим те же 100 цветов, что и в первом варианте мысленного эксперимента, то расстояние между цветами (точками данных) в последнем случае неимоверно увеличится.

Это "неимоверно" - всего лишь

\sqrt( (x_2-x_1)^2+(y_2-y_1)^2+(z_2-z_1)^2 )

В данных примерах, если максимальное расстояние на прямой составляло 100 метров, то в кубе это лишь 100 * \sqrt(3), увеличение меньше, чем в 2 раза.

Таким образом, важнейшее проявление закона больших чисел — это независимость от случайных переменных. Геометрически в высших измерениях это выражается в том, что почти всегда любые два вектора будут ортогональны друг другу.

Независимость результата от случайных переменных. Поэтому второе утверждение выглядит крайне сомнительно; исходя из описанного выше, я бы допустил утверждение "расстояние между векторами будет почти всегда выражаться одним и тем же значением". Но это не имеет ни малейшего отношения к ортогональности. Следующая пара предложений:

Более того, понятия «далеко» и «близко» постепенно теряют смысл. Из-за этого перестают работать алгоритмы, основанные на сходстве или кластеризации.

как раз об этом: каждое новое измерение вносит всё меньший вклад в расстояние, а само расстояние для пары произвольных элементов становится всё более "средним".

такими подмножествами вершин в графе, где через все вершины одной клики проходит минимум одно общее ребро

Эта формулировка некорректна, правильнее было бы сказать так:

где две любые вершины одной клики имеют общее ребро.

Эти два выражения радикально отличаются по смыслу.

Sign up to leave a comment.

Articles