Комментарии 441
Тут больше подробностей по ограничениям
Любой прорыв начинается с маленьких побед. И OpenAI сделал несколько семимильных, на мой взгляд, шагов за год.
Атомную бомбу тоже начали с банальных «предположений о ядерных реакциях» в 30-х годах. В 38-39 году увидели, что когда облучали уран нейтронами образовывался вроде бы барий с массой в 2 раза меньше первоначальной. А через 7 лет Хиросимы и Нагасаки остались только угольки.
Если проводить аналогию, то само открытие ядерного расщепление не является прорывом до тех пор, пока не был построен ядерный реактор.
В исследовательских задач так точно.
хотите чтобы угольков не осталось даже? экий Вы кровожадный.
по теме статьи, это не может не радовать. всегда начинается с малого, возможно уже при нашей жизни можно будет наблюдать сюжеты из книг Азимова.
Но в последний момент робот решил, что это подтолкнет человечество к расселению по галактике, прекратит долгую стагнацию. И принял решение, руководствуясь 0м законом.
Это разве не в конце "Стальных пещер"? А Foundation много-много лет спустя.
Любой прорыв начинается с маленьких побед. И OpenAI сделал несколько семимильных, на мой взгляд, шагов за год.
Надо только учитывать не сам факт наличия шагов, но и их направление, т.к. часть сделана совсем не вперед. Год назад бот играл на миде на уровне одного из топ-мидеров мира, сейчас — не способен соперничать со средним игроком. Что будет, когда бот научится играть без ограничений и с расширенным пулом? Личный скилл на уровне 500-ммр помойки?
Вы говорите о другой метрике качества. Качество игры отдельного бота не равно качеству игры команды ботов. Вполне может даже оказаться, что попытка максимизировать качество на отдельном персонаже давала просадку метрики по команде в целом.
Тут надо понимать, что мы считаем важной доя нас метрикой и заниматься именно ей, проверяя в действительности, улучшается ли результат, в виде победы.
Вы говорите о другой метрике качества. Качество игры отдельного бота не равно качеству игры команды ботов.
Я говорю о том, что чем шире пул проблем, которые умеет решать бот, тем хуже он решает каждую из проблем пула. простая проблема специализации. В данном случае — мы непосредственно наблюдаем, как бот, который год назад выносил вперед ногами лучших мидеров мира, сливает теперь мид средним игрокам.
Совершенно очевидно, если бы теперешний бот умел бы играть на миде как тот, старый, то и в целом это бы повысило эффективность бота. Но он не умеет. Почему? Видимо, ограничение размера сети и выч. мощностей. Это важный момент. Если предел, при котором дальнейшее наращивание сложности сети не доступно, уже достигнут, то дальнейшее наращивание пула задач (а наращивать надо, ведь еще более 80 героев, причем среди них всякие "грязные" герои, которые ломают модель игры своим присутствием) не приведет ли к тому, что от бота, который идеально играл на миде на одном персонаже, мы получим бота, который вроде как может играть в доту в общем, в команде, на чем угодно — но делает это предельно плохо?
Не очевидно, что стало бы лучше. Это надо проверять с конкретными метриками.
"чем шире пул проблем, которые умеет решать бот, тем хуже он решает каждую из проблем пула."
Где-то есть статья из ML на эту тему?
Не очевидно, что стало бы лучше.
Совершенно очевидно.
Где-то есть статья из ML на эту тему?
Да любую книжку по нейросетям откройте, там вам напишут про соотношение между размером сети и количеством стимулов.
А в мире DL вообще вредно пичкать модель своими априорными знаниями, которые могут оказаться ложными.
Открывал, открываю и не одну, поэтому и говорю, что это не очевидно. Это гипотеза, которую надо проверять.
Это не гипотеза, а доказанный факт. При прочих равных с лучшим мидером вы будете иметь преимущество в золоте. Вы можете проигнорировать это преимущество, сведя игру к варианту "с худшим мидером", по-этому не может возникнуть такой ситуации, что наличие лучшего мидера не скажется в плюс.
Другое дело, если проблема в том, о чем я и говорил выше с самого начала — не получается обеспечить "при прочих равных". Можно обучить бота идеальному стоянию на миде невермором, а можно — среднего качества игроком на пуле из 16 героев. Одновременно — сети уже не хватает, вот и приходится выбирать.
Почему-то для вас тут стоит знак равенства. Хотя сами по себе утверждение сомнительно.
Вы говорите про человеческий опыт, а не про обучение модели.
Именно про обучение модели я и говорю. С чего вы взяли, что не про него?
У нас ситуация, в которой приходится жертвовать качеством модели ради того, чтобы она стала более универсальной.
Была модель на десяточку для одного персонажа, стала модель на 8, но для любого из 16. Понимаете?
В этом и заключается технологическая сингулярность. Машина совершает действия, неочевидные или даже глупые с точки зрения человека, которые он сам бы никогда не совершил, но при этом достигает цели эффективнее, чем человек.
Машина совершает действия, неочевидные или даже глупые с точки зрения человека, которые он сам бы никогда не совершил, но при этом достигает цели эффективнее, чем человек.
У нас случай другой — в данном случае машина совершает действия, которые совершенно точно снижают эффективность достижения цели.
Извините, но вырву вашу фразу из контекста.
TAS для марио показал, что для того, чтобы развить максимально быстро большую скорость бега нужно сначала развернуться в противоположном направлении. Мне кажется, что это и есть то самое — совершенно точно снижение эффективности — зачем разворачиваться влево, если я бегу вправо? Тем не менее, это быстрее.
Мне кажется, что это и есть то самое — совершенно точно снижение эффективности
Нет, это не то же самое, т.к. в вашем случае механика игры предполагает, что можно бежать быстрее, развернувшись влево.
В рассматриваемом случае подобные ситуации логически невозможны.
Не стоит из «я не могу связать» делать «логически невозможно». Я не вижу ни одного именно логического обоснования, кроме вашего субъективного взгляда.
Я вам тоже напомню, что выиграть матч — это не выиграть мид, не сделать больше убийств и не заработать больше золота. Выиграть — это снести тот самый ancient.
Так вот, если бы вы играли в доту, то знали бы, что про*б мида никак и ни в каком случае не может вам помочь снести тот самый ancient. Может помешать. А помочь — нет, не может.
С другой стороны, выигрыш мида — может помочь. Но никак не может помешать.
Потому что выиграв мид, вы можете делать все ровно те же самые действия, что и в том случае, если его проиграли. Но не наоборот.
Вы рассуждаете с той точки зрения, что это какой-то хитрый гамбит — пожертвовали пешкой (мидом), чтобы получить ферзя! Но если вы просто берете и на скиле тащите мид — вы ничем не жертвуете. Вы просто забираете ферзя.
Так вот, если бы вы играли в доту, то знали бы, что про*б мида никак и ни в каком случае не может вам помочь снести тот самый ancient. Может помешать. А помочь — нет, не может.
Расскажите это командам, которые играют по стратегии «задавить две линии» и в конкретной игре предпочитают взять более слабый мид, который отстоит кое-как, чтобы загнобить вражеского кора в хардлайне и одновременно выфармить своего керри в изи лайне. Это, конечно, не совсем кейс, когда мид, проигранный из-за скилла, ведёт к победе, но в этом случае мид, проигранный тактически, ведёт к победе.
Вы вообще читаете, что вам пишут? В нашем случае никто не брал слабый мид, чтобы давить что-то другое. Никто не уходил с мида на ганг, оставляя вражеского мидера на фрифарме. Никто не жертвовал слабым мидером ради того, чтобы саппорты более активно помогали своему керри/давили вражеского керри/хардлайнера.
Мы говорим о том, что один и тот же герой стоит на миде n минут и либо играет хорошо (много добивает и денаит, хорошо давит оппонента), либо играет плохо (добивает/денаит меньше, дает оппоненту чувствовать себя свободнее).
Так вот, нет и не может быть никакой пользы в том, чтобы стоять на миде намеренно плохо вместо того, чтобы стоять там хорошо.
Может быть польза в том, чтобы уйти на ганг, может быть польза в том, чтобы пойти в лес, может быть польза в том, чтобы играть сейфово, может быть польза в том, что будет слабый мид в плане пика, но не может быть пользы в том, чтобы просто _играть хуже_.
У вас, похоже, проблемы с логикой.
Так вот, если бы вы играли в марио, то знали бы, что поворот влево никак и ни в каком случае не может вам помочь добраться до финала справа. Может помешать. А помочь — нет, не может.
С другой стороны, движение вправо — может помочь. Но никак не может помешать.
Но ведь мы выяснили, что в марио, поворот влево может помочь добраться быстрее. Ваша аналогия неуместна.
Еще раз — выиграв мид вы можете сделать все те же самые действия в тот же момент, что и не выиграв его. По-этому ситуация в принципе не может быть хуже. С другой стороны, если вы не развернулись сразу влево в марио, то вы уже не можете повторить те же действия, как с разворотом в тот же момент.
выиграв мид вы можете сделать все те же самые действия в тот же момент, что и не выиграв его
Нет аргументов, значит повторяйте это, пока все вокруг не поверят.
Нет аргументов
Нет аргументов в пользу чего? Вам что в этом тезисе непонятно? Какие действия вы не сможете повторить, выиграв мид?
2. Если вы обратите внимание на начало ветки с моим сообщением, то узнаете, что я указывал комментатору, что он приводит оценочное суждение, которое может оказаться и неверным. В ответ я только и слышу «выиграть мид АБСОЛЮТНО ВСЕГДА!!!111АДИНАДИН лучше, чем проиграть». Выиграть мид приятно, полезно и удобно, но это не гарантия победы.
но это не гарантия победы.так такого никто и не заявлял.
Выиграть мид приятно, полезно и удобнода, и ни в одной ситуации не хуже чем проиграть мид (при прочих равных), что вам и повторили десяток раз.
- Ни одного объяснения не вижу. В лучшем случае я вижу только субъективное мнение.
Для оценки действий мидера есть вполне конкретный объективный фактор — это соотношение кс мидеров к n минуте. В том случае, если в эти n минут мидеры не ходили на ганг/в лес и к мидерам не ходили на ганг/сейв — это оценка конкретно действий мидеров, изолировано от остальной карты.
Если вы в таких условиях к 10 минуте имеет кс, например, 50 против 30 противника, то вы как мидер лучше, чем если вы имеете кс 30вс50 (наоборот).
И нет никакого смысла просто взять и отдать противнику кс, не добивая крипов. Это ровно то же самое, что крипов эти 10 минут добивать, а потом передать ему эту часть голды/опыта, например, нафидев под вышкой.
Мне искренне непонятно, что может быть непонятно в такой простой ситуации. Мне кажется, что вы просто троллируете, пытаясь показать себя сильно глупее, чем вы есть на самом деле.
простая проблема специализации
Простая проблема более долгого и качественного обучения. Предполагать, что научить играть в доту НЕ получится — это крайне странно после всех примеров. Вопрос только, насколько быстро. Успеют за месяц или за год? Или придется пять лет ждать новых идей в обучении?
Простая проблема более долгого и качественного обучения.
Еще раз — в результате долгого и качественного обучения мы наблюдаем не прогресс, а деградацию бота. Бот, который близко к идеальному играл в одних конкретных условиях, превратился в бота, который играет просто хорошо во многих.
Вопрос только, насколько быстро. Успеют за месяц или за год?
Вопрос не в том, насколько быстро, вопрос в том, хватит ли выч. мощностей.
Или придется пять лет ждать новых идей в обучении?
Новых идей в обучении нейросетей не было уже 50 лет, со времен появления персептрона Розенблатта. Ждать надо будет революции в производстве выч. техники, чтобы закон Мура снова стартовал и лет хотя бы 20-30 проработал.
мы наблюдаем не прогресс, а деградацию бота.
Вы — видимо да. Мы наблюдаем прогресс. Очевидно, что пространство возможностей кардинально расширилось и боты с ним вполне прилично справляются.
Просто прошлый раз они заточили бота на одну операцию (в некотором роде overfitting), а сейчас обучают на большом пространстве. Ваши доводы выше я прочитал, но они не подходят именно из-за того, что пространство расширилось (например, на миду может появиться второй враг, именно поэтому точно та стратегия, которой бот пользовался в 1v1 не подходит, стратегия изменилась. Для вас она выглядит хуже, зато его не будут внезапно забирать с фланга).
Новых идей в обучении нейросетей не было уже 50 лет
Не знаю, в какой заморозке вы были, но Proximal Policy Optimization, разумеется, новая идея.
Вы — видимо да. Мы наблюдаем прогресс.
Значит, вы плохо смотрите. Бот совершенно объективно хуже справляется с задачей стояния на миде.
Просто прошлый раз они заточили бота на одну операцию (в некотором роде overfitting), а сейчас обучают на большом пространстве.
Так я же об этом и говорю. Расширить пространство без падения качества не вышло — а тогда нет причин полагать, что качество и дальше не будет падать. В итоге у нас будет цепь "бот почти идеально играющий в миде на неверморе" -> "бот хорошо играющий одним из 16 героев в доту почти без ограничений" -> "бот плохо играющий любым героем без ограничений".
Не знаю, в какой заморозке вы были, но Proximal Policy Optimization, разумеется, новая идея.
Что в ней нового? Обычный стохастический градиетный спуск, напичканный эвристиками, привет началу 60х. Это не то что шаг вперед — это шаг назад от персептрона Розенблатта (на пол десятка лет), алгоритм которого гарантированно сходится за конечное время с верным результатом.
Если это шаг назад — зачем используют? Логично предположить, что вы просто не видите, в чем тут шаг вперёд, потому вам кажется, что его нет.
Обычный стохастический градиетный спуск
Не обычный. Вообще, ваше высокомерие вряд ли уместно. Если это всё такое тривиальное — аргументируйте. Покажите что-то менее "обычное", если разбираетесь (на самом деле ясно, что нет).
гарантированно сходится за конечное время
Условно конечное. На таких задачах большая плоская сеть конечно гарантированно может дать то же результат, что и глубокая, но не на реальной практике. Добиться сходимости за разумное время (например, месяцы, как в данном случае, а не сотни лет) — это реально достижение и это реально новое. То, что вам проблема скорости обучения не знакома (и вы наивно полагаете, что дело только в железе) — это исключительно ваш просчёт.
Если это шаг назад — зачем используют?
А почему нет, если работает?
Не обычный.
Чем необычный?
Покажите что-то менее "обычное", если разбираетесь (на самом деле ясно, что нет).
Менее обычного пока не придумали.
Добиться сходимости за разумное время (например, месяцы, как в данном случае, а не сотни лет) — это реально достижение и это реально новое.
"Добиться сходимости за разумное время" — это когда доказано, что выч. требования для сходимости в некотором классе задач не превышают некоторое Х (которое в каком-то смысле полагается "разумным").
А этого никто не добился, так что не врите. Есть некий набор эвристик, который, как предполагается, иногда может помочь в некоторых (неизвестно каких) случаях. Но при этом никто не гарантирует что сходимость в принципе будет, не говоря уж о том, что она будет за разумное время (или с разумной вероятностью).
В отрасли банально с повторяемостью результатов фундаментальная проблема, а вы про то, кто чего добился рассуждаете.
То, что вам проблема скорости обучения не знакома (и вы наивно полагаете, что дело только в железе)
Именно в железе и дело в первую очередь. Да, когда железо (и размер выборок для обучения) сделало возможным обучение сетей в принципе — то этим занялись, и, что логично, появились некие оптимизированный под задачу версии стандартных и давно известных алгоритмов (того же градиентного спуска). Но именно железо дало возможность. Без скачка производительности никакие оптимизации бы не помогли.
Менее обычного пока не придумали.
А вы в другой области покажите. В любой, за последние 50 лет. А я скажу, "нет, это банальный Х". Поиграем разок в вашу странную игру "ничего нового не придумали". Интересно посмотреть на ваши критерии "нового". Подозреваю, что это ваша особенность мышления "ничего нового не бывает, все похоже на что-то старое".
когда доказано, что выч. требования для сходимости
Не врите (с).
Добиться сходимости за разумное время — это получить результат. Вы можете выставлять какие угодно требования и считать себя самым умным, однако это лично ваше дело. К дискуссии отношения не имеет.
То, что не любой алгоритм даст математическую гарантию сходимости в любой ситуации тоже к дискуссии отношения не имеет. К реальным практическим задачам — тоже.
А почему нет, если работает?
А почему для этой задачи не использовать персептрон? Он лучше, на ваш взгляд, справится?
А вы в другой области покажите. В любой, за последние 50 лет.
Метод опорных векторов с нелинейным фильтром?
Добиться сходимости за разумное время — это получить результат.
Нет, это не так. То, что у кого-то на конкретной задаче что-то один раз сошлось — ничего абсолютно не значит, это не результат. Так же как если кто-то пошел в казино, дважды поставил на зеро и выиграл — это не результат, до тех пор, пока не предоставлен способ выигрывать ставя на зеро с какими-то разумными гарантиями.
То, что не любой алгоритм даст математическую гарантию сходимости в любой ситуации тоже к дискуссии отношения не имеет.
Зачем в любой? Достаточно знать, что он даст сходимость (пусть даже с какой-то вероятностью, но эта вероятность должна быть оценена и желательно выше чем "наугад") в какой-то ситуации, которая четко и явно описана. Иначе — это все становится с точки зрения практики бесполезным.
К реальным практическим задачам — тоже.
Как раз-таки имеет это отношение к практике и самое прямое. Отсутствие соответствующих мат. теорем выводит нейросети за пределы инженерных дисциплин в область живописи или стихосложения, т.к. результат становится принципиально неповторяем. Печально, что вы не видите в этом проблемы.
А почему для этой задачи не использовать персептрон? Он лучше, на ваш взгляд, справится?
Возможно, и лучше. А возможно — и хуже. У нас же нету никаких свидетельств в пользу того, что те сети, которые используются на данный момент в OpenAI, подходят к задаче лучше обычного однослойного персептрона? Нету. Как нету и обратных.
Метод опорных векторов с нелинейным фильтром?
Обычная минимизация функции. Ничего нового со времён работ Крамера двадцатых годов.
К тому же, это просто улучшение обычного SVM, которому уже 55.
У нас же нету никаких свидетельств в пользу того,
Нет свидетельств? Может вы перепутали и хотели сказать "доказательств"? Свидетельств-то сколько угодно. Конечно глубокие сети справляются лучше, чем перцептрон, на большинстве задач. Да и научных работ на эту тему множество. Вы конечно, можете их все обесценить, мол, это не наука, а художества.
у кого-то на конкретной задаче что-то один раз сошлось
А если у тысячи человек сошлось на определенном классе задач и есть куча информации, в каких условиях не сходится — это уже наблюдение. На него можно опираться и получать практические результаты.
в какой-то ситуации, которая четко и явно описана. Иначе — это все становится с точки зрения практики бесполезным.
Так определенные архитектуры и дают результат в четкой ситуации с какой-то вероятностью (выше рандома). Хочешь получить результат в распознавании изображений — бери сверточную сеть. Если не исследование ведёшь, а именно результат нужен. Конечно было бы классно иметь теорему, которая говорит, что сверточная сеть лучше всего на этом классе задач, но её пока нет. Есть наблюдения, исследования и куча практических результатов. Взять сверточную сеть именно с точки зрения практики — разумно.
Печально, что вы не видите в этом проблемы.
Вот этот абзац я пишу с помощью распознавания голоса. Печально что вы не видите реальных практических результатов и утверждаете что они неповторимы.
Обычная минимизация функции. Ничего нового со времён работ Крамера двадцатых годов.
Метод опорных векторов — это, содержательно, способ приведения задачи классификации к задаче минимизации. То есть — вы привели, SVM на этом по факту закончился. Саму задачу минимизации вы уже можете решать как хотите, вообще говоря. Так что ваше утверждение не совсем верно.
К тому же, это просто улучшение обычного SVM, которому уже 55.
Но он не является его частным случаем. Вы не можете из SVM сделать SVM с нелинейным фильтром, меняя как-либо входные параметры SVM. В случае с PPO — ребята просто предлагает полученную на основе эвристик целевую функцию, которая является входным параметром алгоритма. Замена целевой ф-и не меняет алгоритм.
А если у тысячи человек сошлось на определенном классе задач и есть куча информации, в каких условиях не сходится — это уже наблюдение.
Да, но в данном случае сходится одна конкретная сеть на одной конкретной задаче, при этом она же не сама сходится — процесс обучения постоянно контролируется человеком, постоянно вносятся правки в процесс. Если вы поставите другого человека — он будет вносить другие правки и у вас получится другой результат, даже если будет использоваться тот же алгоритм обучения. А если вы даже в рамках той же задачи используете другую обучающую выборку, или, например, сам алгоритм случайно пойдет немного не так (что возможно, если он стохастический) — то, опять же, будут другие наблюдения и другие правки, при этом все эвристики, которые вы делали в прошлом случае, окажутся хорошо если бесполезными (а на практике с большой вероятностью они могут быть вредны!).
Так определенные архитектуры и дают результат в четкой ситуации с какой-то вероятностью (выше рандома).
В какой ситуации и с какой вероятностью? Вот PPO хорош в какой ситуации и с какой вероятностью?
Есть наблюдения, исследования и куча практических результатов. Взять сверточную сеть именно с точки зрения практики — разумно.
Карго-культ в принципе разумен с точки зрения тех, кто его исповедует, да. При этом он не перестает быть карго-культом.
Печально что вы не видите реальных практических результатов и утверждаете что они неповторимы.
А они повторимы? Укажите мне, пожалуйста, каким конкретно алгоритмом. И, пожалуйста, чтобы не пришлось в процессе чего-то подкручивать: просто запустил, сунул выборку и получил результат.
Так что ваше утверждение не совсем верно.
Согласен. Хотя я мог бы, по вашей схеме, настаивать, что это просто комбинация известных вещей — линейные классификаторы были известны ранее, kernel functions — тоже не новое изобретение. Mercer их описал больше ста лет назад (спасибо Гуглу, да).
В случае с PPO — ребята просто предлагает полученную на основе эвристик целевую функцию
Так вот целевая функция — и есть новое, в данном случае! Именно она позволяет решать задачу такого размера. Никакой реальный прогресс в вычислительных ресурсах не позволит решить задачу на перцептроне, нужен reinforcement. А для reinforcement нужна хорошая целевая функция.
PPO, по утверждениям разработчиков, проще настаивать, проще контролировать. Как будет на практике — посмотрим. Ещё несколько команд возьмутся, начнут использовать — тогда и будет ясно, насколько повторяемы результаты на разных задачах.
Вот PPO хорош в какой ситуации и с какой вероятностью?
Я с PPO не так хорошо знаком. Будем считать, что идёт этап исследований. Когда изучат — будет понятно, в какой ситуации. Для сверточных сетей ответ известен.
Карго-культ в принципе разумен с точки зрения тех, кто его исповедует, да.
Попытка утрировать, возможно, хорошо выглядит в ваших глазах. Но вы прекрасно знаете, что сверточные сети — не карго-культ. И вы знаете, что я это знаю. Так зачем?
А они повторимы?
Если вы запустите обучение с теми же гиперпараметрами — получите тот же результат. Просто сунете выборку, запустите, получите результат.
В научных работах выбранные гиперпараметры описываются. Методы выбора гиперпараметров — это предмет исследований в настоящий момент.
Так вот целевая функция — и есть новое, в данном случае! Именно она позволяет решать задачу такого размера. Никакой реальный прогресс в вычислительных ресурсах не позволит решить задачу на перцептроне, нужен reinforcement. А для reinforcement нужна хорошая целевая функция.
reinfoircement и перцептрон (давайте лучше сразу оговоримся, хоть и запоздало, что под "просто перцептроном" мы понимаем "просто перцептрон с одним скрытым слоем", потому что на самом деле сети используемые OpenAI — это тоже перцептроны, просто многослойные :) вроде из контекста это ясно, но лучше уточнять, чтобы потом не оказалось что все имели в виду что-то свое) ортогональные вещи, вы можете делать reinforcement и на "просто перцептронах" :)
С-но любой метод, который работает на сети некоторой топологии, будет работать и для любой сети более простой топологии, другое дело, что он может быть не так эффективен (логично, что для более простой сети найдется более специализированный метод, как метод коррекции ошибок в случае "просто перцептрона", который не работает в многослойном случае, но более эффективен с однослойном).
А для reinforcement нужна хорошая целевая функция.
Да, но штука в том, что целевая ф-я — не алгоритм. Другое бы дело если бы был какой-то математический результат в стиле: "целевая ф-я вида Х обладает свойствами вида Y для задач, обладающих свойствами Z", где Y — какие-то полезные свойства, а Z — свойства, котоырми обладает какой-то содержательный класс задач. Но такого-то нет, просто кто-то на какой-то задаче потыкал и у него что-то получилось.
Ну вы всерьез это рассматриваете как сильное свидетельство в пользу того, что метод работает и работает эффективно?
Для сверточных сетей ответ известен.
Но вы прекрасно знаете, что сверточные сети — не карго-культ.
Ответ не известен, у нас просто есть наблюдения (пусть и обширные) того, что сверточные сети хорошо справляются с некоторым классом задач. При этом нет никакого понимания, почему это так. И не факт что это вообще так — вполне может быть, что среди всех топологий сверточные сети далеко не лучший вариант.
Так что это как раз и есть натуральный карго-культ — когда люди используют что-то, работы чего не понимают.
Методы выбора гиперпараметров — это предмет исследований в настоящий момент.
Только это вот ключевой момент, потому что вы же понимаете, что если в методе достаточно параметров, то подгонкой можно сделать так, что любая конкретная задача "решится"?
целевая ф-я — не алгоритм
Целевая функция, конечно, алгоритм. Не алгоритм обучения, это да. Гайка тоже, заметьте, не болт. Значит ли это, что новая гайка не считается новой на этом основании? Не понятна ваша мысль.
Ну вы всерьез это рассматриваете как сильное свидетельство
Когда у тысячи людей что-то получилось? А ещё тысяча описали, в каких случаях не работает? Да, рассматриваю. Иначе пришлось б отказаться, например, от лекарств. Вы уже отказались? Вряд ли хоть для одного есть математическое доказательство его работоспособности. Только модель и наблюдения, что реальность этой модели соответствует.
на самом деле сети используемые OpenAI — это тоже перцептроны
На самом деле нет. Впрочем, эта ваша стандартная особенность — "всё похоже на всё", не знаю почему, но видеть разницу вы отказываетесь, видите только общие черты (которые, несомненно, есть).
Ответ не известен, у нас просто есть наблюдения
Почему тела притягиваются, тоже ответ неизвестен, просто есть модель и наблюдения. Наблюдения — это нормально. Это хороший механизм познания и для сетей он тоже работает.
Где вы взяли определение карго-культа, кстати, не ясно, от общепринятого отличается, но пофиг.
любая конкретная задача "решится"
Если она решится так, как нужно, то кавычки неуместны. Самое банальное — у меня нет математических гарантий, что курьер привезет мне товар (я даже не знаю, как конкретно работает его мозг), но ожидаемая вероятность — высокая.
Можно наладить службу доставки, подкручивая кучу параметров и не имея ни одной теоремы. Назовёте такую службу доставки карго-культом? Не удивлюсь. Но большинство людей назовут её просто службой доставки. И задача доставки будет решаться без кавычек.
То есть, для решения задачи далеко не всегда нужны математические гарантии, что решение оптимально. Субоптимальное решение — тоже хорошо.
Целевая функция, конечно, алгоритм.
Алгоритм чего? Вот есть, например, алгоритм сортировки — он принимает несортированный массив и возвращает сортированный, а тот о котором вы говорите что делает?
Когда у тысячи людей что-то получилось? А ещё тысяча описали, в каких случаях не работает?
Получилось что, подгонка гиперпараметров под конкретную задачу? Так я вам и без наблюдений сразу скажу, что это возможно.
Да, рассматриваю. Иначе пришлось б отказаться, например, от лекарств.
С чего бы это? В случае лекарств мы изучаем, какие в нем активные вещества и каким образом они приводят к конкретному фармакологическому эффекту. То есть мы знаем как и почему работают лекарства, пусть иногда это знание и бывает несколько ограниченным. Мы не пытаемся делать лекарство "наугад", без понимания принципов фармакологии, в надежде на то, что повезет и получится. Но именно так (наугад) делают нейронные сети.
Только модель и наблюдения, что реальность этой модели соответствует.
Ну вот, а в случае нейронных сетей нет никакой модели.
На самом деле нет.
На самом деле, да, перцептроном является любая нейронная сеть, с-но, по определению. А дальше вы уже можете уточнить, какой у вас перцептрон — однослойный, многослойный, с обратными связями, разными типами передаточной функции и т.д.
То есть, для решения задачи далеко не всегда нужны математические гарантии, что решение оптимально. Субоптимальное решение — тоже хорошо.
Ну так у вас есть гарантии субоптимального решения. В случае курьера — вам с высокой долей вероятности гарантируется доставка, пусть и не 100%. В случае нейронных сетей вам никто не гарантирует ничего ни с какой вероятностью, вы играете в угадайку. Любая из эвристик может сработать или не сработать в любой ситуации по неизвестным причинам.
тот о котором вы говорите что делает?
Принимает на вход параметры и выдает расстояние от цели.
Ну так у вас есть гарантии субоптимального решения
На самом деле есть? И какие же это гарантии в случае курьера? Теорему приведёте, может быть? Если нет, то мой довод в силе. Любая ваша эвристика относительно курьера может не сработать по неизвестной причине, но сделать службу доставки всё равно можно (тоже, кстати, без гарантий).
Получилось что, подгонка гиперпараметров под конкретную задачу? Так я вам и без наблюдений сразу скажу, что это возможно.
Ну и о чем тогда разговор? Какую мысль вы пытаетесь донести? То "нет никаких гарантий", то "100% возможно даже без наблюдений". Вы имеете ввиду какую-то гипотетическую возможность, за триллион лет? Если да, то зачем?
Но именно так (наугад) делают нейронные сети.
Ваше частное мнение понятно. Собственно, не вижу причины дискутировать о мнении, вы имеете право иметь любое. Даже бездоказательное.
Принимает на вход параметры и выдает расстояние от цели.
А как узнать, что алгоритм в принципе работает? Вот в случае сортировки я проверяю, что получившийся в результате массив действительно отсортирован. И могу даже проверить какие-то дополнительные свойства, вроде стабильности. А в нашем случае, как можно убедиться в том, что то, что получается в результате — это действительно расстояние до цели?
Любая ваша эвристика относительно курьера может не сработать по неизвестной причине, но сделать службу доставки всё равно можно (тоже, кстати, без гарантий).
Конечно, может! Но строго контролируемым и ожидаемым образом. У меня есть четкое понимание, почему курьеры надежнее, чем просьба случайному человеку. И не только у меня, а у всех людей, кто пользуется курьерскими службами. И это не результат наблюдений, вроде "обычно курьеры доставляют", а именно понимание самого процесса — понимание того, почему курьеры "обычно доставляют".
В случае же использования обсуждаемых эвристик — ни у кого нет понимания, с какой бы стати данная эвристика должна давать полезный эффект чаще, чем вредить.
Какую мысль вы пытаетесь донести?
Ту, что факт возможности подгонки гиперпараметров под задачу — с практической точки зрения полностью бесполезен. Любая задача так решается, если повезет. Ключевой здесь момент именно в этом "если повезет". Наука тем и отличается от не-науки, что используя научный метод вы получаете результат ожидаемым образом, а не "как повезет".
Вы имеете ввиду какую-то гипотетическую возможность, за триллион лет? Если да, то зачем?
Это у вас надо спросить, именно вы ведь выдаете утверждения о гипотетических возможностях получения результата за триллион лет за успех.
Ваше частное мнение понятно. Собственно, не вижу причины дискутировать о мнении, вы имеете право иметь любое.
При чем тут мнение, если речь о фактах? Если честно, всегда обескураживает эта манера в ответ на конкретные доказуемые утверждения говорить: "это только мнение".
Мнение — это что-то вроде "мне нравится музыка Х", а "2*2 = 4" — это факт.
всегда обескураживает эта манера в ответ на конкретные доказуемые утверждения говорить
Утверждения, возможно, доказуемые. Но вы не потрудились их доказать. Если я вас верно понял, вы утверждаете, что выбор эвристик для создания сети происходит по методике мало отличимой от подбрасывания монетки. Но даже для меня, для кого сети — мелкое хобби, это не так. А вы утверждаете, что это так для исследователей, занимающихся этим серьезно. Потрудитесь доказать. Хотя бы объяснить, откуда вы взяли такое мнение. Тогда и отношение будет другое.
именно вы ведь выдаете утверждения о гипотетических возможностях получения результата за триллион лет за успех.
Не знаю, почему вы так решили, но нет. Если какие-либо мои слова навели вас на эту мысль, то проясню четко. Я не считаю результат за триллион лет, даже если он математически гарантирован — успехом.
факт возможности подгонки гиперпараметров под задачу — с практической точки зрения полностью бесполезен.
Гипотетическая возможность подгонки — бесполезна. Полезны статистически значимые наблюдения, что определенный класс задач можно решить за вменяемое время.
А в нашем случае, как можно убедиться в том, что то, что получается в результате — это действительно расстояние до цели?
Моя теоретическая подготовка недостаточна. Вы можете взять какую-либо признанную работу по целевым функциям и показать, что работа — мусор с научной точки зрения и ничего не даёт для понимания. При желании могу даже дать пример работы. Я сам больше опираюсь на мнение научного сообщества в таких вопросах, моя профессия в другом.
Но даже для меня, для кого сети — мелкое хобби, это не так.
Подтвердить это несложно — достаточно привести контрпример.
Хотя бы объяснить, откуда вы взяли такое мнение. Тогда и отношение будет другое.
Оттуда, что нет никакой информации о наличии методов, отличных от подбрасывания монетки. Отсюда вывод — либо таких методов нет вовсе, либо "власти скрывают".
Гипотетическая возможность подгонки — бесполезна. Полезны статистически значимые наблюдения, что определенный класс задач можно решить за вменяемое время.
Так у вас нет подобных наблюдений.
Смотрите, вот есть литература. Писатели, книжки пишут. Есть "Война и Мир" — если случайно жать кнопки, вы напишите ее примерно никогда, но Толстой написал. И вообще бывают хорошие писатели, которые пишут хорошие книги, вероятность написания которых, случайно жмакая кнопки — крайне мала.
При этом мы знаем, что для написания хорошей книги — надо собирать правильные слова в грамматически корректные (и при том желательно осмысленные) предложения — и на этом, вобщем-то все. Нет никакого способа сесть и написать хорошую книгу, имея какие-то гарантии. При этом люди пишут. Но не знают, как пишут (в том числе сами авторы) и по какой причине у них вообще что-то получается. То есть — результат неповторяем. Не в том смысле, что вы не можете перепечатать "Войну и Мир" — вы можете, но если сказать Толстому: "напиши-ка мне еще что-то того же уровня, похожее, но другое" (ака реши задачу того же класса), то велика вероятность, что ни черта не выйдет. И еще меньше, что выйдет у другого автора. За тысячелетия истории литературы человечеством было написано огромное количество хороших книг, но при этом мы совершенно не продвинулись в сторону того, что требуется сделать, чтобы вот сесть и написать хорошую книгу. По-этому литература — не инженерная дисциплина.
Вот все аналогично с нейросетями. Когда-то в 60-х были сформулированы базовые правила из разряда "выстраиваем слова грамматически верно", вот сейчас у нас есть некоторые люди со своего рода "литературным талантом", которые делают нейросети — при этом никто (даже сами эти люди) не понимает, с какой стати вообще в принципе что-то получается. И за последние полста лет мы в этом понимании не продвинулись ни на сколько, с-но не продвинулись и в разработке методов, которые позволяют "сесть и написать нейросеть". По-этому я и говорю — что прогресса нет. Все эвристики, которые "работают" — это нечто вроде: "писатель Х написал хорошую книгу на тему Y", ну да, типа написал. И это хорошо — чем больше хороших книжек, тем лучше. Только вот это ничего не дает человечеству в плане развития умений писать книжки, учитывая что опыт неповторяем и даже тот же автор в слегка других условиях родит уже что-то другое.
Моя теоретическая подготовка недостаточна. Вы можете взять какую-либо признанную работу по целевым функциям и показать, что работа — мусор с научной точки зрения и ничего не даёт для понимания.
Нет, погодите. Это же вы назвали целевую функцию "алгоритмом", вы и отдувайтесь. Не надо стрелки переводить на бедных ученых, они этого тезиса не озвучивали :)
Это же вы назвали целевую функцию "алгоритмом", вы и отдувайтесь.
Вопрос-то не об этом. Что бы назвать алгоритм алгоритмом, ссылка на учёных не нужна, достаточно ссылки на словарь. Как убедиться, что алгоритм делает то, что нужно, — это другой вопрос. Но даже если бы не делал, вы можете сказать, что алгоритм ошибочен. Но не можете сказать, что это не-алгоритм.
Ваше описание, почему литература — не инженерная специальность, очень хорошее. Но оно не подходит для нейросетей. Например, сверточная сеть вычленяет сначала низкоуровневые признаки. Даже не знаю, что тут может смутить, на этапе выделения линий и углов логика достаточно прозрачна. Переход к более высокоуровневым признакам менее прозрачен, но схема та же.
Впрочем, никто не знает толком, чем кошка отличается от собаки (визуально). Что с нейросетью, что без. Само выделение признаков — не магия. Магия — это какие признаки значимы, но разве это вопрос к нейросетям? Они-то их находят.
Подтвердить это несложно — достаточно привести контрпример.
Нужно распознать изображение — бери сверточную сеть. Простая эвристика, эффективность которой выше подбрасывания монетки. Вы можете выбирать архитектуру монеткой, ваше дело.
Для функции активации возьми для начала ReLu — тоже простая эвристика. Потому что формально нас устроит любая нелинейная функция, а сигмоид вычислительно сложнее.
Так у вас нет подобных наблюдений
Вы понимаете слабость этого утверждения? Хотите усомниться, что мои наблюдения статистически значимы? Но утверждать — "наблюдений нет" — это ж явно топить дискуссию, причем специально. AlphaZero — это наблюдение. Определенный класс задач (игры на доске, написано шахматы, го) можно решить за вменяемое время (они решены, значит решить можно).
Что бы назвать алгоритм алгоритмом, ссылка на учёных не нужна, достаточно ссылки на словарь. Как убедиться, что алгоритм делает то, что нужно, — это другой вопрос.
Нет, это важный вопрос. Точнее, важно то, почему вы на него не можете ответить (или, скорее, почему на него нельзя ответить в принципе). Дело в том, что расстояние до цели — это, по определению, ровно то, что получается в вашей целевой ф-и. Понимаете? Целевая ф-я — это не алгоритм. Это определение. Определение того самого "расстояния до цели". Алгоритмом может быть способ вычисления конкретной целевой ф-и (или некоторого класса). Например, есть у вас целевая ф-я вида Х, все считают ее долго, и вы так оп! Нашли способ считать ее быстро. Или нашли способ считать ее реже. Или как-то хитро пересчитывать на основе предыдущих результатов.
Вот этот ваш способ расчета и будет новым алгоритмом расчета целевой ф-и вида Х, но сама ф-я вида Х — это не алгоритм. Это функция. Для любой функции есть много разных алгоритмов вычисления.
Например, сверточная сеть вычленяет сначала низкоуровневые признаки. Даже не знаю, что тут может смутить, на этапе выделения линий и углов логика достаточно прозрачна.
О, смутить здесь может очень многое. Для начала, то, что следует определить, что такое "низкоуровневые признаки". Мне дано Х, как мне наверняка определить, низкоуровневый это признак (и вообще признак ли) или нет? Где строгое определение? Где доказательство корректности этого определения в принципе или в рамках выполнения каких-то условий? Наконец, после того как мы получим определение — где доказательства того факта, что сверточные нейронные сети действительно "вычленяют сначала низкоуровневые признаки"? Это действительно всегда так? Или нет? Если нет — в каких случаях? Быть может, есть хотя бы вероятностные оценки? Вроде как — сеть данного класса на выборке, удовлетворяющей определенным условиям будет "вычленять сначала низкоуровневые признаки" с вероятностью не большей чем…
Почему она эти низкоуровневые признаки вычленяет, если уж вычленяет? Как?
И, напоминаю, эти все вопросы заданы при условии, что мы не знаем, что такое, формально, "низкоуровневые признаки"! Это просто бессмыслица.
Магия — это какие признаки значимы, но разве это вопрос к нейросетям? Они-то их находят.
Смотрите, вы даже не можете дать определение тому, что такое "признак", но между тем утверждаете, что "уж нейросети то их находят"! То есть они находят то, не знаю, что.
Да даже если бы у вас было определение признака, то вы действительно с уверенностью можете заявить, что нейросети работают именно так? А может все же немного по-другому?
Нужно распознать изображение — бери сверточную сеть. Простая эвристика, эффективность которой выше подбрасывания монетки. Вы можете выбирать архитектуру монеткой, ваше дело.
А чем ваш выбор сверточной сети в данном случае отличается от монетки? Вы можете гарантировать что для моей задачи распознавания изображений, на моих данных, с моей конкретной топологией сети, методом обучения, эффективность будет действительно лучше, чем у монетки?
Хотите усомниться, что мои наблюдения статистически значимы?
Да, именно это я и сказал. Вы же сами прекрасно из контекста все поняли, как видно.
Да, именно это я и сказал. Вы же сами прекрасно из контекста все поняли, как видно.
Я из контекста предположил. Вы так точно проводите различие между самой функцией и способом её вычисления, но при этом утверждаете "у вас нет наблюдений". Разумно предположить, что вы это сказали ради красного словца, а имели ввиду "не показали статистическую значимость".
Но проблема не в этом. Проблема в том, что опираясь на мой невысокий уровень теоретической подготовки вы пытаетесь доказать, что построение сетей — чистый рандом. Это очень слабая позиция, вы так легко сможете доказать, что черных дыр не существует — я вряд ли приведу статистически значимые наблюдения.
То есть, повторюсь, вы не можете сказать "вы не знаете, значит этого нет". Не значит, на самом деле. Я много чего не знаю. Совсем другое дело, когда вы опровергаете мои доводы, показывая, что мое утверждение (предположим), не подтверждено.
утверждение — "я вижу примеры, значит это есть" — тоже не ахти. Но мое утверждение не в этом. Вы тоже видите примеры. Вы знаете (или можете проверить), что есть поиск Гугла по картинкам. Есть поиск по фотке у АлиЭкспресс. То есть это как минимум возможно. Но, более того, если вы возьмётесь за задачу по классификации, вы вполне с ней справитесь. Сможете ли написать популярную книгу — хз. А классифицировать животных — да, если не будете специально косячить.
Есть вполне себе технические мануалы по сверточным. И вопросы, необходимые для достижения цели там рассматриваются. Это не раскрытие чакр, на курсах рассматривают, как решить ту или иную проблему с определенной гарантией. Тяжело только в новых областях, классические задачи решаются надёжно и стабильно.
А чем ваш выбор сверточной сети в данном случае отличается от монетки?
Это попробовано сотнями людей. У вас нет строгой теоремы, украдёт ли курьер товар. И даже нет приличной модели, в математическом смысле, его поведения. И вряд ли есть оформленные надлежащим образом статистически значимые наблюдения. И чем тогда выбор курьера отличается от броска монетки?
Смотрите, вы даже не можете дать определение тому, что такое "признак"
Смотрю, вы настойчиво хотите доказать, что нейросеть не работает, опираясь на то, что я чего-то не знаю. Но уж слишком сильно перегнули. Признак — факт, говорящий о принадлежности к некоторому классу или говорящий о наличии некоего явления. И даже если б я этого не знал, есть же словарь. Просто уводите диалог в сторону такими вещами.
вы действительно с уверенностью можете заявить, что нейросети работают именно так
На низком уровне — конечно. Нейросеть говорит — на этом изображении есть горизонтальная линия в правой части изображения.
А может все же немного по-другому?
Для несверточных — да, немного по-другому.
что такое "низкоуровневые признаки".
Отличить "линия под углом 30 градусов" и "глаз" — не сложно. Первое — низкоуровневый, второе — нет. Я не знаю, есть ли математически строгое определение.
Почему она эти низкоуровневые признаки вычленяет, если уж вычленяет?
Как активируется нейрон? У нейрона коэффициенты на входы, где может быть линия — положительны, где не должна быть — отрицательны. Если линия будет вертикальной вместо горизонтальной — этот нейрон просто не активируется.
Если вопрос, каким образом сеть приходит к такому — так она аппроксимирует функцию котенка. А т.к. она многослойная — нижние слои аппроксимируют более простые признаки. Это вполне прилично изучено. Но я не рекомендую обучаться, задавая вопросы мне — пройдите курс какой-нибудь, ответы будут намного точнее.
Мне дано Х, как мне наверняка определить, целевой это признак или нет?
Целевой? Статистически. Для этого есть тестовый набор данных.
Целевая ф-я — это не алгоритм.
Самая простая — квадратичная.
F(x) = (t-x)^2
Вы сможете обосновать что это — не алгоритм? Что ж, но алгоритм её вычисления, полагаю, очевиден? t — это цель, x — это результат вычисления сети.
Может быть вы хотели сказать, что не ясен алгоритм минимизации этой функции (т.к. мы не можем напрямую менять х)? Что ж, иногда не ясен. Но сам вопрос, что исследователи предложили новый алгоритм (PPO) — можем закрыть? Даже из самого факта, что они могут эту целевую функцию вычислять, ясно, что "способ вычисления" у них есть (к тому же он описан в их работе). Пока не ясно, действительно ли он так хорош, но он явно новый и явно алгоритм. И они, как минимум, уже на этом этапе решили задачу, которую до них никто не решал. Ваш довод, что это что-то типа написания бестселлера, понятен, но они описали технические преимущества. (для написания бестселлеров нам такие детали пока не известны).
В случае курьера — вам с высокой долей вероятности гарантируется доставка, пусть и не 100%.
И всё-таки, с какой долей вероятности гарантируется доставка? Можно ли оценить эту вероятность надёжно? Есть ли доказательства или статистически значимые наблюдения, что доставка курьером Х действительно будет с вероятностью не ниже У? А нейросети с математической точки зрения изучены намного лучше, чем поведение людей. Так что утверждение, что это "монетка" не состоятельно.
Проблема в том, что опираясь на мой невысокий уровень теоретической подготовки вы пытаетесь доказать, что построение сетей — чистый рандом.
Я пытаюсь доказать, что построение сетей — это рандом в том же смысле, в котором написание книги. Или песни. Или картины.
У кого-то это получается, и получается, очевидно, статистически чаще, чем должно быть при рандоме. Но при этом нет никакого понимания почему получается и как повторить результат.
Мы говорим о разных вещах. Вы говорите, что есть конкретные, обученные сети — они действительно есть, с этим трудно спорить.
Речь же о том, что нету методов, при помощи которых эту сеть можно сделать. Точно так же, как нету методов, при помощи которых можно сесть и написать "Войну и мир". Хотя по факту она написана, понимаете?
И тот факт, что кто-то написал хорошую книгу (обучил хорошую сеть, решающую полезную задачу), конечно, сам по себе полезен, но он не является достижением в области поиска способов написания хороших книг.
Пока не ясно, действительно ли он так хорош, но он явно новый и явно алгоритм. И они, как минимум, уже на этом этапе решили задачу, которую до них никто не решал.
Представьте себе, что есть какой-то писатель. Хороший писатель, хорошие книги пишет. И вот он их пишет, каждые пять минут делая тройное сальто назад. Ну вот такой вот странный человек, не может он иначе.
Надо ли отсюда сделать вывод, что чтобы хорошо писать книги, следует подучиться акробатике и начать в процессе делать сальто назад, так же как и указанный писатель?
И всё-таки, с какой долей вероятности гарантируется доставка? Можно ли оценить эту вероятность надёжно? Есть ли доказательства или статистически значимые наблюдения, что доставка курьером Х действительно будет с вероятностью не ниже У? А нейросети с математической точки зрения изучены намного лучше, чем поведение людей.
Смотрите, вы не в том месте видите проблему. Мы можем как для нейронок так и для доставки просто посчитать и получить статистику и в рамках пары предположений это будет вполне корректная статистика. Но корреляция != казуация.
И вот тут-то и вступает в дело важный факт — мы понимаем почему статистика на стороне курьерских служб (почему они работают), но не понимаем, почему она на стороне нейронных сетей. Т.о. использование любых эвристик превращается в использования сальто для улучшения писательских качеств.
И вот тут-то и вступает в дело важный факт — мы понимаем почему статистика на стороне курьерских служб
А понимаем ли? Вот серьезно, почему статистика на стороне курьерских служб? Я понимаю, что это так, но для меня не очевидно, почему. Почему человек в доставке более надёжный, чем какой-то другой? Ведь им достаточно мало платят, откуда берется надёжность? Почему статистика на стороне нейронок — мне более понятно.
не понимаем, почему она на стороне нейронных сетей
Сверточная напоминает зрительную кору мозга. Да, в ней на самом деле есть нейрон, говорящий — тут есть горизонтальная линия справа. Почему статистика на стороне зрительной коры — понятно. У кого кора неудачная, не оставили потомства. Простой случайный поиск привел к работоспособной архитектуре.
А сверточная успешна потому, что это модель зрительной коры мозга. Да, я понимаю, что это не теорема, а что-то близкое к антропному принципу. Поиск архитектур — это может и искусство. А использование изученной архитектуры — вполне инженерная задача.
Речь же о том, что нету методов, при помощи которых эту сеть можно сделать
Пройдите уже современный курс по ML. Методы построения на основе известных архитектур известны.
Почему человек в доставке более надёжный, чем какой-то другой? Ведь им достаточно мало платят, откуда берется надёжность?
Им платят больше, чем случайному человеку которому не платят, и если они работают — то значит считают, что платят достаточно (иначе бы не работали, очевидно). Если человек работает в доставке — значит полученные деньги для него достаточно важны (иначе бы он не работал), а значит он не будет хотеть их потерять. Человек заинтересован лично в том, чтобы доставку выполнить => выполняет.
Почему статистика на стороне нейронок — мне более понятно.
Видимо, вы единственный в мире человек, которому это понятно :)
Не поделитесь?
Сверточная напоминает зрительную кору мозга.
Вы же понимаете, что это такое себе объяснение? :)
Во-первых — со зрительной корой мозга у нейронных сетей гораздо больше различий, чем общего.
Во-вторых — вообще говоря, нет причин полагать, что "алгоритм зрительной коры" хоть сколько-нибудь оптимален.
И, в-третьих — это же не ответ :)
Смотрите, вы заменили: "делаем сети сверточными, потому что сверточные сети, как показывает практика, хороши", на "делаем сверточные сети, потому что они похожи на зрительную кору, а она, как показывает практика, хороша" :)
Пройдите уже современный курс по ML. Методы построения на основе известных архитектур известны.
Так, понимаете, это же все из разряда "делай тройное сальто назад — и напишешь хорошую книгу!"
Почему-то я уверен, что далеко не все люди, прошедшие "современные курсы по МЛ" становятся хорошими специалистами по нейросетям.
Им платят больше, чем случайному человку которому не платят
Ну блин, вы серьезно? Давайте я спрошу — а если случайному платят? 500 рублей за доставку вместо 300, т.е. больше — значит надёжность будет выше, чем у курьера? С какой вероятностью можно быть в этом уверенным? Есть ли хотя бы способ посчитать эту вероятность?
(иначе бы не работали, очевидно)
Вы не знаете людей, которые работают, но считают, что им платят недостаточно? Можно ли быть уверенным, что "достаточно" по определению (раз не уходит, значит достаточно) — это надёжно? С какой вероятностью?
Может ли курьер поменять свое мнение? Решить, что ему платят недостаточно и он уволится, как только найдет другую работу? Его надёжность после этого падает? Насколько?
значит он не будет хотеть их потерять.
Некоторые за рулём пьют — значит они хотели потерять права? Не хотели бы, не стали бы пить? Почему же это не очень надежно работает?
По вашим строгим критериям доказательности ваш ответ считается хорошей моделью? Предъявите к своему объяснению ваши же требования. Представьте, что такое объяснение дали не вы сами, а кто-то другой. Полагаю, вы легко разобьёте это объяснение в пух и прах.
Не поделитесь?
Есть гипотеза — любую жизненную ситуацию можно аппроксимировать с помощью функции. Ну а функцию может аппроксимировать нейронная сеть. Проблема только в поиске этой аппроксимации. Не помню теоремы на эту тему, полагаю, что такая возможность доказана не для любых классов функций, но общая идея именно такая.
Лучше спросите, как так вышло, что нам удается найти неплохие способы аппроксимации. Как с любыми изобретениями — точного пути нет. Но когда способ найден, его проверка и использование — вполне инженерная задача. Пока нельзя сказать, что сверточная — лучшая архитектура для изображений. Но можно сказать, что она гарантированно справляется.
они похожи на зрительную кору, а она, как показывает практика, хороша
Как зрительная кора выделяет признаки, более-менее изучено. Я не увидел ваших возражений по поводу выделения низкоуровневых признаков. Есть нейрон, он активируется, если справа есть горизонтальная линия, например. Эта схема понятна? Как он это делает — понятно? Возражений, что он это делает надёжно и предсказуемо — нет?
Ведь можно ж реально задавать вопросы по плохоизученным областям, вместо этого вы утверждаете, что изученное — не изучено и вообще рандом.
Так, понимаете, это же все из разряда "делай тройное сальто назад — и напишешь хорошую книгу!"
Почему-то я уверен, что далеко не все люди, прошедшие курсы по Х, становятся хорошими специалистами по Х. К чему вообще приводить такой сверхуниверсальный довод? Предложение-то было не для всех, а для вас.
К тому же это из разряда — отучись в техникуме, возможно станешь нормальным сантехником. Не каждый, кто отучился в техникуме, станет хорошим специалистом. Но утверждать, что ремонт сантехники — это творческая профессия, а результат — рандом — вряд ли кто-то станет.
Ну блин, вы серьезно? Давайте я спрошу — а если случайному платят?
То как вы его тогда отличите от курьера?
Вы не знаете людей, которые работают, но считают, что им платят недостаточно?
Конечно, знаю. Но если бы человеку не было ценно рабочее место он бы, очевидно, просто не работал.
Предъявите к своему объяснению ваши же требования.
Смотрите, даже плохое объяснение примерно раз эдак в бесконечность больше, чем вообще никакое :)
В данном случае у нас есть вполне адекватная модель, которая описывает происходящее и позволяет делать вполне корректные выводы, которые подтверждаются практикой.
В случае сетей — нету такой модели.
Некоторые за рулём пьют — значит они хотели потерять права? Не хотели бы, не стали бы пить?
Обратите внимание, пьют гораздо меньше, чем пьют в принципе :)
С-но вариант с "не хочу потерять права" или "понимаю что опасно" вполне объясняет, почему мы наблюдаем тот факт, что люди редко пьют за рулем.
Лучше спросите, как так вышло, что нам удается найти неплохие способы аппроксимации.
Ну, именно об этом и речь.
Но можно сказать, что она гарантированно справляется.
Так в том и дело, что нельзя, пока вы не объясните механизм работы.
Есть нейрон, он активируется, если справа есть горизонтальная линия, например.
Есть нейроны которые вообще никак с низкоуровневыми признаками не связаны. Например, один нейрон может отвечать за распознавание конкретного лица.
Возражений, что он это делает надёжно и предсказуемо — нет?
Есть. Из самого алгоритма надежность и предсказуемость никак пока не следует :)
Это только наблюдаемый необъяснимый факт (который, в силу отсутствия измерений, может быть неверен)
вместо этого вы утверждаете, что изученное
Утверждать, что работа мозга изучена — это как-то очень поспешно. На самом деле даже в алгоритмическом плане наши знания весьма ограничены. Мы не можем мозг вскрыть и посмотреть "а как оно работает" (то есть вскрыть и посмотреть можем, но не увидим ничего), то что есть — это все больше гипотезы, основанные на косвенных свидетельствах.
Почему-то я уверен, что далеко не все люди, прошедшие курсы по Х, становятся хорошими специалистами по Х.
А я не говорил про курсы. Я говорил про тройное сальто с целью научиться писать. Разница же ощутима, нет? :)
То как вы его тогда отличите от курьера?
Остановили случайного человека, предложили пару тысяч. Не первый, так пятый согласится. Это надёжнее, чем курьер на зарплате? Почему, с какой вероятностью?
В данном случае у нас есть вполне адекватная модель,
"Платят деньги — значит достаточно надёжно" — это модель? "Нейросеть аппроксимирует функцию, которая отражает реальность" — не модель? Вы предвзяты. Если не согласны — опишите подробнее, почему ваше описание курьеров более "моделистое".
плохое объяснение примерно раз эдак в бесконечность больше
Плохое объяснение, откуда мы взялись — "нас создал бог". Я точно не согласен, что оно в бесконечность более хорошее, чем ответ "не знаю".
Но к главному мы пришли — нет никакой математической модели (ни строгой, ни вероятностной) доставки товара конкретным человеком. Ваше "плохое объяснение" не говорит ни о каких вероятностях вообще. Тезис "можно пользоваться инструментом, оценив вероятности по наблюдениям. Такое использование отличается от броска монетки в лучшую сторону" можно считать подтвержденным? Вы с ним согласны?
С-но вариант с «не хочу потерять права» или «понимаю что опасно» вполне объясняет,
С какой вероятностью? Вы уверены, что объясняет? Это может быть ложной корреляцией? Если нет, то почему? Заметьте, вопросы не сложнее тех, что вы задаёте про нейросети.
неплохие способы аппроксимации.
Ну, именно об этом и речь.
А как нам удается найти законы природы? Каким образом? Я не знаю, а вы? Насколько я понимаю, ответа на такие вопросы в принципе пока нет, но я хотел бы их знать когда-нибудь.
Так в том и дело, что нельзя, пока вы не объясните механизм работы.
В том-то и дело, что можно и что механизм есть. Пример с курьерами именно для этого — показать вам наглядно, что достаточно механизма работы (я его дал выше), философские вопросы "почему этот механизм работает" полезны, но на вероятность работы не влияют.
Есть нейроны которые вообще никак с низкоуровневыми признаками не связаны.
Конечно есть, согласен. Если это какой-то далеко идущий тезис, то разверните.
Из самого алгоритма надежность и предсказуемость никак пока не следует :)
Это только наблюдаемый необъяснимый факт (который, в силу отсутствия измерений, может быть неверен)
Конечно. Предсказуемость следует из наблюдений. Из самого алгоритма работы мозга тоже никак не следует, что курьер доставит товар. Мы даже это алгоритма толком не знаем. Учитывая, что измерений достаточно, сам факт можно считать достаточно надёжным.
Почему для вас факт "необъяснимый" мне всё ещё не ясно. Что не так с возможностью аппроксимации реальности? Вы сомневаетесь в такой возможности? Для непрерывных функций даже теорема есть — теорема Цыбенко. Для прочих теоремы пока нет, но в категорию "необъяснимых" этот факт не попадает уж точно. Скорее в категорию недоказанных гипотез.
Утверждать, что работа мозга изучена — это как-то очень поспешно.
Работа мозга? Неуместное обобщение с вашей стороны. Речь шла о зрительной коре.
Мы не можем мозг вскрыть и посмотреть «а как оно работает»
Зрительная кора так и изучалась. Вскрыли, вставили датчики, измерили. Почему вы утверждаете, что "не можем", опять же не ясно.
это все больше гипотезы, основанные на косвенных свидетельствах.
Не более косвенные, чем изучение кварков. Уж тут-то точно нельзя "вскрыть и посмотреть". К тому же там ещё и вероятностное всё. Но я бы не стал утверждать, что предсказание поведения кварков не отличается от броска монетки.
А я не говорил про курсы. Я говорил про тройное сальто с целью научиться писать.
Вы сказали, цитирую
Почему-то я уверен, что далеко не все люди, прошедшие "современные курсы по МЛ" становятся хорошими специалистами по нейросетям.
Вот этот довод мы можем считать бесполезным и выкинуть его? Он же вообще ни к чему не ведёт, согласны?
Аналогия с сальто забавна, но не более того. Есть объяснение, зачем его делать? И пример сотни людей, которые его сделали и написали бестселлер? Если да — это вполне причина тоже пробовать. Но ведь нет объяснения.
А зачем использовать ReLu — объяснение есть. Зачем использовать свёртки вместо полносвязанной сети — объяснение есть. Зачем использовать валидационный сет (а не только тестовый) — объяснение есть. На какие правила построения сетей вам не хватает объяснения? Может мы сможем разговор перевести в практическую плоскость. Какой элемент в нейросетях напоминает вам тройное сальто? Желательно конкретно.
Нет, потому что в отличии от курьера этот рандомный человек может спокойно уйти с деньгами и все.
> «Платят деньги — значит достаточно надёжно» — это модель?
Человек заинтересован в выполнении задачи методом «кнута и пряника», по-этому, скорее всего, будет ее выполнять.
Мы можем просто посмотреть на ситуацию и сделать гипотезу (теоретическую). А потом посмотреть на статистику и увидеть, что она подтверждает нашу гипотезу.
> «Нейросеть аппроксимирует функцию, которая отражает реальность»
Вопрос в том, как выходит, что нейросеть начинает апроксимсировать функцию, отражающую реальность. А не какую-то другую. Смотрите, у нас есть очень много классов функций, которые могут отражать реальность, и есть очень много способов, которыми мы можем эти функции строить. Я бы сказал — таких классов и способов бесчисленное множество. Какие есть основания выбирать одно конкретное конечное подмножество?
> Почему для вас факт «необъяснимый» мне всё ещё не ясно. Что не так с возможностью аппроксимации реальности?
Вы куда-то в сторону ушли. Нейронные сети это не про то как функции аппроксимируют реальности, это все очевидно. Нейронные сети — про _методы построения_ некоего класса таких аппроксимирующих функций. И вопрос не про то, почему функции аппроксимируют, тут как раз наблюдений достаточно, потому что само понятие «аппроксимирует реальность» — это и есть «соответствует наблюдаемым величинам». Вопрос именно в том, _почему мы получили_ такую полезную функцию данным конкретным методом. Почему в результате действия этого метода мы не получили фигню?
Вот почему курьер вам посылку доставил — потому что хочет деньги за доставку получить.
> Работа мозга? Неуместное обобщение с вашей стороны. Речь шла о зрительной коре.
А кора — это часть мозга. И то о чем вы говорите — это гипотезу. Пусть весьма достоверные, достаточно достоверные, чтобы ими было разумно пользоваться, — но пока только гипотезы.
> Вскрыли, вставили датчики, измерили. Почему вы утверждаете, что «не можем», опять же не ясно.
Пока что непосредственно на нейроны датчики, по-моему, не ставят. Снимают, например, ЭЭГ.
> Не более косвенные, чем изучение кварков.
Вот это вы очень хорошо вспомнили. Какими практическими достижениями на данный момент может похвастаться квантовая хромодинамика? Где мой кварк-глююнный генератор энергии? :)
Мы очень плохо сейчас понимаем, как взаимодействуют кварки, и вот есть, например, конфайнмент — наблюдаемое явление. Но мы не знаем, как его объяснить, откуда он берется, почему. И это очень плохо, и физики не спорят с тем, что это плохо, это проблема, это надо решать :)
> Аналогия с сальто забавна, но не более того. Есть объяснение, зачем его делать? И пример сотни людей, которые его сделали и написали бестселлер?
Пример с сальто, конечно, намеренно утрирован и сомневаюсь что вы найдете много людей, которые так написали бестселлер, потому что сомневаюсь вообще, что вы хоть одного человека найдете, который так пишет книгу. Но можно взять любые действия, которые люди совершают довольно-таки часто. Ну, например какой-то автор любил абсент. А потом бестселлер написал. Уверен, такие найдутся.
> А зачем использовать ReLu — объяснение есть. Зачем использовать свёртки вместо полносвязанной сети — объяснение есть. Зачем использовать валидационный сет (а не только тестовый) — объяснение есть.
И зачем? Вы сейчас скажете: «потому что лучше работает!», а я спрошу: «а с чего вы взяли что лучше работает?», а вы ответили: «ну вот кто-то делал и у него работало», а я отвечу: «ну если кто-то что-то сделал и у него получилось — это не значит, что это хороший способ, может, кто-то и книги через сальто пишет!» и мы пойдем по кругу :)
> Какой элемент в нейросетях напоминает вам тройное сальто? Желательно конкретно.
Ну вот например — использование многослойных сетей. Математически многослойные сети ничем не лучше однослойных, зачем их использовать? :)
может спокойно уйти с деньгами и все.
А может не уйти. И курьер тоже может уйти. Что вероятнее? Есть ли статистически значимые наблюдения, что случайный человек уйдет с деньгами? Короче, без цифр всё, на какой-то интуиции. Тем не менее как-то работает. И лучше, чем рандом. Почему работает — не знаю. Нейросети понимаю лучше, чем людей.
Гипотеза, говорите? "Скорее всего будет выполнять задачу" — это на гипотезу не тянет.
Какие есть основания выбирать одно конкретное конечное подмножество?
Никаких. Я не утверждал, что сверточная — это лучшая архитектура. Она работает. Но есть шанс, что другая сработает лучше. Тезис "она работает" от этого не становится ошибочным.
Вопрос именно в том, почему мы получили такую полезную функцию данным конкретным методом.
А "данным конкретным методом" — это вы про какой метод? Градиентный спуск? Тут ответ ясен. Мы катимся к минимуму функции. Вроде ответ очевиден, разве нет? Проблема в том, что ваш вопрос расплывчат. Конкретизируйте.
Если вы спрашиваете, "почему нейросети в принципе работают". Не как они достигают цели (это понятно, как), а почему так вышло, что они работают, то отвечу вопросом.
Почему тела притягиваются? Почему при синтезе гелия выделяется энергия? (Да, это всё тот же вопрос, почему светит солнце).
> И то о чем вы говорите — это гипотезу.
Не понимаю суть тезиса. Вы утверждаете, что зрительная кора работает не так? Или что это недостаточно изучено? Недостаточно наблюдений, нужно сомневаться?
Пока что непосредственно на нейроны датчики, по-моему, не ставят. Снимают, например, ЭЭГ.
Если бы. Нет, прямо втыкают иглы прямо в зрительную долю (со снятым черепом) и замеряют потенциалы. Конечно, это грубое измерение, но мы многое так измеряем. Протон тоже в микроскоп не разглядишь, но никто ж не назовет его гипотезой.
что это плохо, это проблема, это надо решать :)
Я ж не против матмоделей нейросетей. Наоборот, будет круто. Мой тезис, что построение сети — не рандом. Вполне инженерная задача, как в 17м веке строительство храма — современного сопромата ещё не было, но это не было броском монетки.
Ну, например какой-то автор любил абсент
Абсент наверняка помогает написать бестселлер. :)
И зачем? Вы сейчас скажете: «потому что лучше работает!»,
Вот зачем делать такие предложения? Валидационный сет нужен потому, что для нейросети надо настраивать гиперпараметры. И гиперпараметрами можно случайно заточить сеть под тестовый сет. Потому гиперпараметры проверяют на валидационном сете. А по тестовому смотрят уже в самом конце — сеть построила абстракции или просто заточилась под валидационный. Надеюсь, смог понятно написать.
Математически многослойные сети ничем не лучше однослойных
Сходимость лучше. Т.е. обучать быстрее до такого же качества (но сложнее было изобрести алгоритмы). Почему она лучше, думаю, понятно. Меньше связей у конкретного нейрона, значит меньше шагов до оптимума для этого нейрона. Если вы скажете, что это не строгая теорема, соглашусь. Не знаю, всегда ли это так. Но это достаточно часто так и вполне логично, что чем меньше параметров, тем быстрее нейрон сойдется.
А может не уйти. И курьер тоже может уйти. Что вероятнее?
Может. Но курьер это сделает значительно реже.
Есть ли статистически значимые наблюдения, что случайный человек уйдет с деньгами?
Так в том и суть, что в данном случае наблюдения не нужны, мы можем просто это вывести, логически, как теорему. И именно по-этому мы пользуемся курьерами — потому что понимаем, что они работают. Не потому что такова статистика. Статистика — не причина как раз, не важно, есть она или нет.
Статистикой, вообще говоря, теории опровергают, а не подтверждают.
Она работает.
Неверно. Правильно — она сработала. По факту. Некоторое количество раз, в некоторых конкретных случаях. Но то, что она работает — мы утверждать не можем. То, что курьеры будут доставлять — мы утверждать можем, а то, что нейронка сработает — не можем. Потому что это не вопрос статистики и наблюдений. Это вопрос наличия объяснений.
А "данным конкретным методом" — это вы про какой метод?
Ну начать надо с того, что данная конкретная функция в принципе окажется достаточно сложна, чтобы описать требуемую зависимость. Это понятно, что в классе найдется функция, которая все что надо отобразит с любой точностью, но почему именно вот эта, соответствующая, например, 200 нейронам подходит? Почему не потребовалось 2 миллиона нейронов?
Градиентный спуск? Тут ответ ясен. Мы катимся к минимуму функции. Вроде ответ очевиден, разве нет? Проблема в том, что ваш вопрос расплывчат. Конкретизируйте.
Вы явно на практике никогда градиентный спуск не применяли :)
В реальности обычно возникает множество проблем и, да, обычная ситуация — это когда градиентный спуск не работает нормально, а не наоборот :)
Почему тела притягиваются? Почему при синтезе гелия выделяется энергия?
Это вопрос неинтересный, т.к. относится к физической реальности. В случае же с нейросетями — вопрос чисто математический, о том, что выдумано нами самими.
Вы утверждаете, что зрительная кора работает не так? Или что это недостаточно изучено? Недостаточно наблюдений, нужно сомневаться?
Я говорю о том, что нет никаких достоверных свидетельств, что она работает именно так.
То есть, если завтра внезапно окажется, что она работает не так, то не будет особого удивления, не будет такого, что: "АХ ТЫ Ж БЛИН ДА КАК ЖЕ ЭТО ВОЗМОЖНО ТО??7??".
На самом деле, мы даже не знаем как слух работает, хотя он работает на порядок проще. А вы про зрение.
Вполне инженерная задача, как в 17м веке строительство храма — современного сопромата ещё не было, но это не было броском монетки.
Ну, почему, до сопромата — именно чем-то вроде броска монетки и было.
Сходимость лучше… Почему она лучше, думаю, понятно.
Нет, непонятно. И, представьте себе, никому в мире на данный момент не понятно.
Не знаю, всегда ли это так. Но это достаточно часто так и вполне логично, что чем меньше параметров, тем быстрее нейрон сойдется.
Логично, что Земля — плоская. Достаточно из окна выглянуть, и убедиться в этом логичном предположении. Для меня вот совсем не логично то, что сходимость будет быстрее с "маленьким числом параметров". Мне если честно даже непонятно, по какой логике к такому умозаключению вообще можно прийти.
Для меня вот совсем не логично то, что сходимость будет быстрее с "маленьким числом параметров".
Вычислительно, поиск в 10-мерном пространстве не сложнее поиска в 1000-мерном. Ну да, совсем не логично.
А польза от снижения размерности данных для вас тоже не логична? Зачем эти странные и нелогичные датасаентисты стараются отбросить несущественные параметры — не ясно?
PCA — вообще мусор, не доказано же, что снижение размерности полезно. Извините за сарказм, но вы ж не спросили логику, вы явно отвергли — нет, не логично и вообще не ясно, как до этого можно было додуматься.
То есть, если завтра внезапно окажется, что она работает не так, то не будет особого удивления, не будет такого, что
Конечно же будет удивление. Ваша убежденность, что мы ничего точно не знаем про зрение и слух, забавна, но не более того. Я же не предлагаю вам тайное знание, альтернативщину или верить мне на слово. Просто отложите учебники 70-х и прочитайте современную позицию по этим вопросам. Сразу скажу — не уверен, что есть что-то приличное на русском. Я не в курсе. А английском материалы подробные.
Почему 70-е? Потому что премия по физиологии 81-го года — за открытие, в частности, нейронов отвечающих за наклон линий, наличие точек и т.п. david hubel and torsten wiesel, если интересны подробности.
Думаю, поймёте, почему я считаю ваши утверждения про зрительную кору — полным п, уж не обижайтесь. Почти 40 лет прошло, перепроверено кучей людей, а вы всё ещё "нет никаких достоверных свидетельств" и "не будет особого удивления". Если у человека вдруг окажется 2 печени, тоже наверное, не будет особого удивления. Нет же достоверных свидетельств, что должна быть одна.
Про курьеров. Дадите ссылку на доказательство теоремы, что случайно взятый курьер надёжнее случайно взятого прохожего — вместе посмотрим, нет ли там каких-то нестрогих утверждений. До тех пор утверждение "мы можем просто это вывести, логически, как теорему" — пустое бахвальство. Ну или такая гипербола. Мол, ну конечно не прям строгую математическую теорему, но можем просто по-рассуждать и будет похоже на неё.
Что в итоге есть — ничего. Никаких цифр и вероятностей. Вы НЕ знаете, какие параметры существенны для надёжности курьера, не знаете, с какой вероятностью он доставит посылку. Даже утверждение, что случайный человек менее надёжен пока не доказано. Он ведь тоже хочет получить деньги, так что довод одинаков. Даже то, что он хочет получить деньги — не доказано. Да, я считаю это очень вероятным (и вы, полагаю, тоже), но почему вы так считаете?
Только честно. Серьезно, задумайтесь. Вы отдаете товар курьеру, он должен доставить покупателю. Его мотивация — это деньги? Почему так считаете? Лично я — потому что проецирую на курьера себя. Но я-то не всегда хочу их получить! Даже когда работаю и делаю дело хорошо. Вы мне, ясное дело не поверите, но это не существенно. Теорема же, просто докажите. Учтите, сомнительные утверждения тоже придется доказать. Или признать, что теоремы пока нет и её возможность под вопросом.
Вычислительно, поиск в 10-мерном пространстве не сложнее поиска в 1000-мерном. Ну да, совсем не логично.
С маленьким параметром сходимости может вообще не быть как раз из-за того, что пространство маленькая. Или функция будет такой формы, что спуск на ней будет очень плох.
Ваша убежденность, что мы ничего точно не знаем про зрение и слух, забавна, но не более того.
Ну вы видимо плохо разбираетесь в в вопросе :)
Потому что премия по физиологии 81-го года — за открытие, в частности, нейронов отвечающих за наклон линий, наличие точек и т.п. david hubel and torsten wiesel, если интересны подробности.
Это все замечательно, но знание о наличии нейронов, реагирующих на линии и точки нас не особо к пониманию общих принципов работы зрительной кары приближает. Ну есть нейроны, которые хорошо откликаются на линии, точки, цвета, есть те, что на прямоугольники или овалы. Есть те, что на более сложные фигуры и образы. И что дальше, с-но?
Про курьеров. Дадите ссылку на доказательство теоремы, что случайно взятый курьер надёжнее случайно взятого прохожего
Так я же говорю — случайно взятый курьер заинтересован в том, чтобы доставлять вашу посылку. По-этому доставляет. Что вам тут непонятно?
Вы НЕ знаете, какие параметры существенны для надёжности курьера, не знаете, с какой вероятностью он доставит посылку.
Так мне это и не надо знать. Я знаю, что есть причины, по которым курьем должен посылку доставить. Я хзнаю эти причины. По-этом я пользуюсь курьерскими службами, и другие люди пользуются и это нормально.
Но никто в мире не знает причин, по которым должна работать конкретная нейронка.
Ну вы видимо плохо разбираетесь в в вопросе :)
Или я плохо разбираюсь в вопросе или вы. Учитывая, что вы считали, что потенциалы нейронов не снимают датчиками и что "нет никаких достоверных свидетельств" о том, как кора работает на низком уровне, что более вероятно?
Или, переформулирую, насколько вероятно, что вы хорошо разбираетесь в вопросе, имея ещё пару дней назад такие заблуждения? Мне можете не отвечать, я явно вижу тут Даннинга-Крюгера. И это не наезд, вы легко можете исправить ситуацию, если захотите.
Есть те, что на более сложные фигуры и образы. И что дальше, с-но?
Это всё, это конец тезиса. Полагаю, что вам не до конца понятно, но это нормально. Я всего лишь показал, что источники информации есть. Теперь вы уже не сможете сказать "нет никаких достоверных свидетельств, что она работает именно так". Теперь у вас есть свидетельства.
Так я же говорю — случайно взятый курьер заинтересован в том, чтобы доставлять вашу посылку. По-этому доставляет. Что вам тут непонятно?
Непонятно, где теорема? Ваше нижеследующее утверждение — ложно.
Так в том и суть, что в данном случае наблюдения не нужны, мы можем просто это вывести, логически, как теорему.
Но никто в мире не знает причин, по которым должна работать конкретная нейронка.
Ещё одно ложное утверждение. Вы бы как-то более внимательно относились к квантору всеобщности.
Впрочем, плевать. "Никто не знает", значит никто. По всей видимости это ваше мнение, а мнения доказывать не принято. Попробую уважать ваше право такое мнение иметь. Про курьеров, кстати, тоже. Если это ваше мнение, что теорема возможна или что ваши логические построения похожи на теорему — полностью ваше право. Дискуссия о мнениях не несёт смысла, на мой взгляд.
Учитывая, что вы считали, что потенциалы нейронов не снимают датчиками и что "нет никаких достоверных свидетельств" о том, как кора работает на низком уровне, что более вероятно?
Учитывая, что я прав по обоим пунктам? Ответ, думаю, очевиден.
Или, переформулирую, насколько вероятно, что вы хорошо разбираетесь в вопросе, имея ещё пару дней назад такие заблуждения?
Какие заблуждения? Как вы сами же согласились — нейроны датчиками не меряют. Ваша убежденность в том, что "все хорошо, все понятно и все известно" — просто от банального недостатка знаний.
Это всё, это конец тезиса.
Конец какого тезиса? Ну распознают какие-то нейроны какие-то стимулы, это очевидно, нейроны для того и есть. Дальше то что? Как вы из этого выводите принципы работы зрительной коры?
Теперь вы уже не сможете сказать "нет никаких достоверных свидетельств, что она работает именно так".
"так" — это как? Вы же не указали, как. Есть нейроны, которые что-то распознают, да. А дальше-то что? Вы остановились даже не на полпути, а на 10% самого общего описания, пропустив еще 90%. И это ведь общее описание, а если начать вдаваться в подробности?
Непонятно, где теорема? Ваше нижеследующее утверждение — ложно.
Что ложно? Какая из посылок по-вашему ложна — что курьер заинтересован, или что из заинтересованность ведет к повышению вероятности выполнения задачи? Вы же как-то уточняйте.
Впрочем, плевать. "Никто не знает", значит никто. По всей видимости это ваше мнение, а мнения доказывать не принято.
При чем тут мнение, когда речь о фактах? Вы сейчас утверждаете существование чайника Рассела — что есть в мире кто-то, кто знает ответ на соответствующий вопрос, но почему никто кроме вас не знает о существовании этого человека. Почему нет никаких свидетельств в пользу его существования? С чего вы взяли что такой человек в принципе существует?
Мой логика проста — раз нету никаких свидетельств в пользу его существования, значит, считаем, что он не существует.
Учитывая, что я прав по обоим пунктам?
Вы издеваетесь?
Как вы сами же согласились — нейроны датчиками не меряют
Да, похоже издеваетесь. Ради шутки попрошу цитату, где я согласился с этим явно ложным мнением.
Как вы из этого выводите принципы работы зрительной коры?
На сарказм не похоже. Дайте угадаю, троллинг?
И это ведь общее описание, а если начать вдаваться в подробности?
Учебник в помощь. Мне всё равно, будете ли вы считать себя правым. Ваши знания — ваша ответственность, нужны — учитесь. Абсолютно мейнстримовая область, никаких секретных и "сакральных" вещей.
Что ложно? Какая из посылок по-вашему ложна
Посылки? Ложно утверждение, что вы можете собрать из этого теорему. Впрочем, вы это явно понимаете, теорему сформулировать не удастся, просто переводите тему.
почему никто кроме вас не знает о существовании этого человека
Тысячи людей, а не человека.
Почему нет никаких свидетельств в пользу его существования?
Почему нет никаких свидетельств в пользу существования самолётов? Я понимаю, что просто троллите, но ваш вопрос звучит именно так. Нет, блин, свидетельств. Никто не знает людей, кто в курсе, как собирать самолёты. Вывод? Таких людей (знающих, как собирать самолёты) не существует.
Мой логика проста
Логика ваша верна. Просто вы ради развлечения берете очевидно ложные посылки.
Вы издеваетесь?
Совсем нет. Я же озвучил два тезиса:
- нейроны не меряют, только косвенно (и это так, вы и сами согласились)
- мы на данный момент не знаем, как работает зрительная кора (и даже более простые механизмы — тот же слух) — что тоже верно, т.к. если бы было неверно — были бы какие-то научные статьи, в которых эти вещи бы описывались. А их не существует в природе.
Да, похоже издеваетесь. Ради шутки попрошу цитату, где я согласился с этим явно ложным мнением.
Вот же: "Нет, прямо втыкают иглы прямо в зрительную долю (со снятым черепом) и замеряют потенциалы. Конечно, это грубое измерение, но мы многое так измеряем."
Учебник в помощь.
Учебник чего? Подобной информации нету не то что в учебниках — а и в современных научных статьях по теме. Потому что ее вообще нет :)
Посылки? Ложно утверждение, что вы можете собрать из этого теорему.
Это как? Если у нас есть посылки Х и X => Y то мы выводим Y по modus ponens. И это строгая теорема по определению понятия "теорема".
Впрочем, вы это явно понимаете, теорему сформулировать не удастся, просто переводите тему.
Тему как раз переводите вы :)(
Смотрите, вы попросили дать объяснение про курьеров — я его дал. Далее вы пытаетесь показать, что объяснение в том или ином смысле неиделаьно и может быть гипотетически неверно — все так, как и для любого другого объяснения. В случае нейросетей проблема не в том что объяснение плохое, его просто тупо нет. Вообще никакого.
Тысячи людей, а не человека.
Где эти люди? Почему они скрываются да так, что о их существовании неизвестно?
Почему нет никаких свидетельств в пользу существования самолётов?
Почему же нет? Они есть! Вот я за окно выглянул — самолет летит. Вот в гугле написал "самолет" — мне фото с видео и фото самолетов :)
Захочу — найду инфу, как и из чего самолеты строятся, почему они летают, с расчетами.
А вот с сетями это не работает. Не получится у вас найти какую-то научную статью, в которой объясняются обсуждаемые вещи, как ни старайтесь.
Просто вы ради развлечения берете очевидно ложные посылки.
Ну так вы легко можете их опровергнуть контрпример. Как в случае чайника Рассела — показали его в телескоп и все.
Вместо этого вы просто голословно утверждаете существование чего-то, но пример привести не можете.
Во-первых, слух более сложно устроен. Но это так, к слову. Можете не верить, для вас же статей "не существует" об устройстве слуха.
были бы какие-то научные статьи, в которых эти вещи бы описывались.
Всё верно. И они существуют и там описано. Вам фамилии недостаточно? Вам ссылку на работу, за которую он Нобелевку получил? Ссылки на статьи, развивающие тему? Вы правда полагаете, что это всё фейк? Начните с Википедии. Там есть ссылки на книги, которых "не существует".
Я просто сути вашего троллинга не понимаю. Вроде разговор начинался разумно, а скатился — "нет, его научная работа не считается, потому что чайник Рассела и они не существуют". Сам David Hubel хотя бы существует или тоже чайник, по вашей теории?
Вы же понимаете, что пытаетесь отрицать общедоступную информацию? Если вы продолжите это делать и не опишите причины, если просто опять скажите "статей не существует" — я проигнорирую. Вы можете закрывать глаза сколько угодно, работы по зрительной коре от этого не исчезнут. Можете сравнивать их с чайником. Та же курсера с общедоступными курсами видна любому, у кого есть интернет. Она не видна только вам.
Ну так вы легко можете их опровергнуть контрпример.
Именно так. Я и привёл. Вы хоть как-то обоснуйте, чем этот контрпример не подходит. Чем ссылка на ученого плоха? Он изучал мозг НЕ с помощью ЭЭГ.
Почему они скрываются да так, что о их существовании неизвестно?
Неизвестно вам? Не знаю. Может вы от них скрываетесь? Эндрю Ын известен многим, например.
Вот же: "Нет, прямо втыкают иглы прямо в зрительную долю (со снятым черепом) и замеряют потенциалы. Конечно, это грубое измерение, но мы многое так измеряем."
Нет — это значит "нет, не ЭЭГ". Возможно, фраза сформулирована не совсем ясно, прошу прощения. Но как вы из неё сделали вывод, что я считаю, мол "нейроны не меряют, только косвенно", мне до сих пор непонятно. Грубое измерение — это в смысле меряют потенциал, а не каждую химическую реакцию отдельно (хотя такие подобные исследования тоже есть).
В Вики есть статья, "single-unit recording". Её тоже не существует? Это не свидетельство существания метода?
Что же до вашего мнения, будто я считаю, что отдельные нейроны не меряют — я считаю, что отдельные нейроны меряют. На основе общедоступных данных. Если вы читаете, что я считаю, что нейроны не меряют — ваше право. Можете продолжать думать, что я так считаю. Как я на самом деле считаю, я сказал. Надеюсь, не запутал, не было такой цели.
Если у нас есть посылки Х и X => Y то мы выводим Y по modus ponens
Верно. Только у вас нет Х и нет "X => Y", в остальном верно. "Если хочет получить деньги, значит сделает работу" — это утверждение не доказано. Докажите. Оно не очевидно. "Хочет получить деньги" — это утверждение не доказано. Оно верно для любого курьера в любой день? Если да — докажите. Если нет — то когда верно, когда нет?
Вот я за окно выглянул — самолет летит.
Где этот самолёт? Почему он скрывается да так, что о его существовании неизвестно?
Вот в гугле написал "самолет" — мне фото с видео и фото самолетов :)
Почему-то погуглить "самолёт" вы справились, а прочитать статью в Википедии об учёном — нет. Даже там написано, что измерялись отдельные нейроны. Вы всё ещё уверены, что "отдельные нейроны не меряются"? Вам нужны ещё свидетельства?
Вместо этого вы просто голословно утверждаете существование чего-то, но пример привести не можете.
Если вам действительно не понятен пример с учёным, сформулируйте, пожалуйста, точнее, пример чего вам нужен. Если вам действительно нужен пример (а не просто издевательство по кругу), я попробую найти что-то, что подходит под ваши условия. Опишите, какими качествами должен обладать пример, подтверждающий, что "отдельные нейроны меряют".
Если вам действительно не понятен пример с учёным, сформулируйте, пожалуйста, точнее, пример чего вам нужен.
Пример человека, который знает, почему работает конкретный алгоритм обучения нейронной сети и с-но сама сеть (естественно, мы сейчас не про какие-нибудь однослойные персептроны — те понятно, почему работают, на то есть соответствующие теоремы, так что не работать они просто не могут. мы про сети вроде той, что из обсуждаемой статьи). В качестве подтверждения того, что он правда знает — вполне пойдет статья с указанным объяснением.
Опишите, какими качествами должен обладать пример, подтверждающий, что "отдельные нейроны меряют".
Пример человека, который знает, почему работает конкретный алгоритм обучения нейронной сети.
То есть вы даже мой комментарий не дочитали? Ну да пофиг. Я думаю, по зрительным нейронам у вас возражений уже нет?
Могу предложить по сверточным, как работает, какими свойствами обладает и к каким результатам приводит, если интересно.
Взял старую работу (30 лет прошло), которая показывает, как сверточная архитектура достигает position-shift invariant. Человек — Wei Zhang.
Рассматривается, фактически, только один вопрос, другие вопросы рассматриваются в других работах.
То есть вы даже мой комментарий не дочитали?
Я прочитал, но полагал, что вы просто запутались. Мы же говорили не про подтверждение мерянья нейронов, а про подтверждение понимания работы нейронных сетей. С-но и ответил.
И вы дайте конкретную ссылку-то. Можете на старую работу, можете не на старую, это не важно.
Вы не держите полный контекст. Мы пришли вот к этому. "Совсем нет. Я же озвучил два тезиса:".
Мы разобрались? Вы согласны с тем, что ваш первый тезис неверен?
Смотрите, вы попросили дать объяснение про курьеров — я его дал.
Вы отредактировали комментарий, потому я пропустил это ваше утверждение. Вы сказали, что можно доказать, как теорему. Так докажите. Дело не в "неидеальности" объяснения, дело в том, что теорема не доказана вами. Всё просто, либо теорема доказана, либо нет. Суть не в том, что бы прижать вас к стенке, а что бы продолжить рассуждения. На наличие теоремы опирается ваше "наблюдения не нужны".
И вы дайте конкретную ссылку-то.
Потерялась, извините. Место хранения не очень, но я думаю, подлинность работы не сложно будет подтвердить, если возникнет потребность. Таких работ (по разным аспектам) десятки, это не что-то секретное.
https://drive.google.com/file/d/0B65v6Wo67Tk5ODRzZmhSR29VeDg/view
Вы не держите полный контекст.
Я как раз о полном и говорю.
Вы согласны с тем, что ваш первый тезис неверен?
Нет, но это, вообще говоря, не относится к предмету разговора, потому я и предлагаю оставить.
Таких работ (по разным аспектам) десятки, это не что-то секретное.
Ну так а где там ответ-то на вопрос, почему работать должно? Штука с реализацией на оптических фильтрах прикольная, конечго, но не про то.
Нет, но это, вообще говоря, не относится к предмету разговора, потому я и предлагаю оставить.
Относится. Потому я и говорю, вы не держите полный контекст. Только изначальный вопрос. А почему и зачем мы пришли с этим частностям — забыли. Это не критично, могу напомнить, мы легко вернёмся по цепочке наверх, когда достигнем согласия по этим пунктам.
Так всё же, какими качествами должно обладать подтверждение, что "отдельные нейроны меряют". Я понял, что статья в Википедии про измерения отдельных нейронов для вас подтверждением не является, вы всё ещё уверены, что это то ли невозможно, то ли не используется (не ясно, в чем конкретно вы уверены, но видимо уверены, что "не меряют").
почему работать должно
Почему должно — без понятия. Есть подтверждение, что работает и как работает. Почему должно работать доказательство иррациональности числа пи — я тоже не знаю. И почему оно иррациональное — не знаю. А во то, что оно иррациональное — это без сомнения. Сверточные сети позволяют достигнуть инвариантности к сдвигу и повороту изображения. Это без сомнения и никаким броском монетки не является.
По поводу теоремы мы пришли к согласию? Доказанная теорема о доставке товара конкретным курьером (которая скажет, доставит или нет) — отсутствует. Её возможность не подтверждена ничем. А значит утверждение "наблюдения не нужны" — не верно. Наблюдения в данном случае необходимы, без них никак.
Относится.
Нет, не относится.
А почему и зачем мы пришли с этим частностям — забыли.
А в том и дело, что мы к нему не приходили. Это был просто случайный высосанный из пальца тезис, который не имеет отношения к предмету обсуждения. То есть он никак не следовал из предыдущего контекста.
Так всё же, какими качествами должно обладать подтверждение, что "отдельные нейроны меряют".
Да мы вообще это подтверждение не обсуждали.
Я понял, что статья в Википедии про измерения отдельных нейронов для вас подтверждением не является
Она является подтверждение того факта, с которым я и не спорил. Вы же сами прекрасно понимаете, что между изучением работы одного единственного нейрона в принципе и изучением некоего процесса на уровне отдельных нейронов (о чем мы и говорили) — гигантская пропасть. Так чего придуриваетесь?
По поводу теоремы мы пришли к согласию? Доказанная теорема о доставке товара конкретным курьером (которая скажет, доставит или нет) — отсутствует.
В смысле? Вы так и не указали, какая из сформулированных посылок неверна. Я напомню вопрос: "Какая из посылок по-вашему ложна — что курьер заинтересован, или что из заинтересованность ведет к повышению вероятности выполнения задачи?".
Почему должно — без понятия.
То, что вы без понятия — я прекрасно понимаю, ведь, мой тезис состоит в том, что все без понятия. И вы в том числе, конечно :)
Но вы же утверждаете что есть люди, которые понимают, почему нейронные сети работают. Я у вас попросил соответствующую статью, в которой бы такой человек изложил это свое понимание: "вот нейронная сеть, работает так-то и так-то, результат дает по тем-то и тем-то причинам таким-то таким-то способом". А вы мне привели опять статью, в которой просто констатируется факт работы.
Я у вас не прошу очередного подтверждения, что существуют хорошие книги. Я прошу ссылку на способ написания хороших книг с обоснованием того, почему этот способ должен работать. Мой тезис — нету таких людей, которые это знают/понимают, никто вам не скажет, как написать хорошую книгу с объяснением, почему так.
А значит утверждение "наблюдения не нужны" — не верно. Наблюдения в данном случае необходимы, без них никак.
Как раз наблюдения и несущественны. Важно понимание процесса.
В этом разница между вашей логикой и моей. Я когда рассуждают о том, что что-то работает, исхожу из того, что понимаю процесс этой работы, с-но "не работать оно и не может".
А вы просто смотрите, и из того что монета два раза подряд выпала решкой делаете вывод, что она только решками и выпадает.
А в том и дело, что мы к нему не приходили.
Повторюсь, не держите контекст. Тем не менее, вы можете высказать свою позицию по вопросу, даже если он, по вашему, не относится к теме. Или сказать "не знаю", если не знаете.
между изучением работы одного единственного нейрона в принципе и изучением некоего процесса на уровне отдельных нейронов
Я не знаю, что заставляет вас придуриваться, однако речь именно об изученности процесса. Процесс распознавания низкоуровневых признаков изображения изучен на уровне отдельных нейронов. По этому тезису у вас возражений нет?
Вы так и не указали, какая из сформулированных посылок неверна.
Я не планирую доказать "неверность", что за бред, просить о таком? Ни одна из ваших посылок не доказана, вот и всё. Докажите их, пожалуйста или переформулируйте так, что б доказательство не требовалось.
Если вы сами тщательно рассмотрите граничные случаи, вы увидите, что заинтересованность курьера в получении денег не всегда ведёт к увеличению вероятности. А некоторые условия могут убрать заинтересованность. Деньги ему всё ещё будут нужны, а посылку доставлять откажется.
Если у нас есть посылки Х и X => Y то мы выводим Y по modus ponens
Разве из посылки "заинтересованность ведет к повышению вероятности" следует, что посылка будет доставлена? Вы можете в одном комментарии сформулировать и посылки и ваш вывод? Это нужно затем, что бы вам самому было видна необходимость переформулировать. Т.к. вы не видите неконсистентность формулировок, если они в разных комментариях.
мой тезис состоит в том, что все без понятия.
Тут я без сожалений признаю вашу вероятную правоту. Почему некоторые вещи "должны работать" (нейронные сети в частности), вполне возможно, все в мире без понятия. Соглашаюсь, что мне неизвестны люди, знающие об этом.
Ваш более ранний тезис, что построение нейронных сетей — бросок монетки — неверен. Много людей знают, как они работают и каким образом получается результат. Сделать нейронку для изученной области — инженерная задача.
Но вы же утверждаете что есть люди, которые понимают, почему нейронные сети работают.
Есть люди, которые знают, как они работают и как их делать. В обычном разговоре это то же самое, что "почему", но учитывая предыдущий разговор, я не стану утверждать, что они знают, "почему". Мне достаточно "как".
Важно понимание процесса.
Для понимания процесса нужно знать существенные факторы. Вы указали один — человек согласился работать. Исходя из "несущественных наблюдений" я знаю, что этого фактора недостаточно. Вы — нет. Потому что модели у вас нет (её но у кого нет), а наблюдения вы игнорируете.
исхожу из того, что понимаю процесс этой работы
В этом и ошибка. Не изучив должным образом процесс доставки вы считаете, что "понимаете процесс этой работы". А правда ли понимаете?
Так же, не изучив должным образом литературу по нейронным сетям, вы опять же считаете, что "понимаете процесс", а точнее, что понимать там нечего, сплошной рандом. Да и про изучение зрительной коры аналогично.
Исходить из того, что вы понимаете процесс работы можно, когда вы действительно его понимаете. А не думать так по-умолчанию.
А вы просто смотрите, и из того что монета два раза подряд
Очень странное предположение. Оно, конечно, неверно, но ваше право его придерживаться. К озвученным фактам это отношения не имеет.
Повторюсь, не держите контекст.
Повторюсь, это у вас проблема с удержанием контекста :)
Отмотайте назад и перечитайте сообщения, если забыли разговор.
Процесс распознавания низкоуровневых признаков изображения изучен на уровне отдельных нейронов.
Нет, не изучен. Только по косвенным (очень косвенным) данным. Если вы считаете иначе — ну подтвердите это какими-то ссылками.
Я не планирую доказать "неверность", что за бред, просить о таком? Ни одна из ваших посылок не доказана, вот и всё.
Эм, посылки и не требуется доказывать, на то они и посылки.
Смысл доказательства всегда состоит в том, что из конкретных посылок следует некий факт. Истинность посылок к доказательству уже не относится.
По-этому я и спрашиваю — какую из посылок вы ставите под сомнения? Без указания этого дальнейший разговор смысла не имеет. Если никакую не ставите — значит, все в порядке.
Если вы сами тщательно рассмотрите граничные случаи, вы увидите, что заинтересованность курьера в получении денег не всегда ведёт к увеличению вероятности.
Как вообще что-то может вести к увеличение вероятности ВСЕГДА или НЕ ВСЕГДА? Что-то лили увеличивает вероятность (в принципе увеличивает) или не увеличивает (в принципе не увеличивает). Понятия вроде "в конкретном случае" или "всегда" или "иногда" тут неприменимы. Это не имеет смысла.
Вы как-то переформулируете свой тезис, чтобы он не был случайным набором слов, а то так невозможно понять, что вы имеете ввиду.
А некоторые условия могут убрать заинтересованность.
Конечно, могут. Тогда курьер перестанет быть курьером, ведь зачем ему быть курьером, если он в этом не заинтересован? Человек в принципе никогда не делает ничего осознанно, если он в этом не заинтересован.
На самом деле "быть курьером" и "быть заинтересованным в доставке" — это одно и то же утверждение, просто сформулированное по-разному.
Тут я без сожалений признаю вашу вероятную правоту. Почему некоторые вещи "должны работать" (нейронные сети в частности), вполне возможно, все в мире без понятия. Соглашаюсь, что мне неизвестны люди, знающие об этом.
Тогда с чем вы спорите? Это же и есть мой изначальный тезис.
Очень странное предположение.
Это не мое предположение, это вы сами озвучили. Вы верите в то, что нейронные сети работают, потому что вы это статистически наблюдали (монетка выпала дважды), но при этом не понимаете почему получился такой результат наблюдений (не понимаете, почему нейронные сети работают, то есть почему монетка выпала дважды).
Я же не верю в работу нейронных сетей до тех пор, пока не узнаю, почему они работают — то есть, почему монетка дважды выпала орлом. Может, окажется, что у нее два орла? И тогда, действительно, она всегда выпадает орлом. Или ее хитро бросают. А может — она просто случайно двумя орлами выпала. И тогда тут ни о каком "работает" речи нет.
Отмотайте назад и перечитайте сообщения,
Окей, вы не понимаете, как мы к этому пришли. Пропущу, что бы не усложнять дерево обсуждения. Не существенно.
Нет, не изучен. Только по косвенным (очень косвенным) данным. Если вы считаете иначе — ну подтвердите это какими-то ссылками.
Второй раз? А с первого раза что не так пошло? "single-unit recording", первая ссылка в Гугле на Вики. Вы по прежнему будете считать, что "процесс не изучен"? Прочитайте, пожалуйста, прежде чем писать ещё раз "не изучено" и "нет наблюдений". Там все подтверждения, что распознавание низкоуровневых признаков изучено.
По-этому я и спрашиваю — какую из посылок вы ставите под сомнения?
Обе, я же вполне четко об этом сказал. Обе ваши посылки может сработают в конкретном случае, а может нет. С какой вероятностью они сработают — вы не знаете.
Прочитал ниже и понял, что конкретно вы не догоняете. Вы берете один параметр (курьер/не курьер). Я спрашиваю — от каких ещё параметров вероятность доставки зависит существенно? В этом и суть модели — знать все существенные параметры, согласны? Если считаете, что других существенных параметров нет — скажите прямо. Если не знаете — тоже скажите прямо.
Понятия вроде «в конкретном случае» или «всегда» или «иногда» тут неприменимы.
Применимы, конечно. Есть десять курьеров. Есть десять вероятностей доставки (курьер Х доставит посылку с вероятностью У). Повышаем зп, у пяти вероятность доставить следующую посылку растет, у пяти — не растет. ЗП — это существенный параметр, но не единственный.
а то так невозможно понять, что вы имеете ввиду.
А для вас в принципе невозможно сформулировать понятно, если вы понимать отказываетесь. В Вики вот вроде для всех понятно сформулировано. А вы всё ещё считаете, что распознавание низкоуровневых признаков зрительной корой мозга не изучено. И что предлагаете? Формулировать яснее, чем в Вики?
Вы как-то переформулируете свой тезис
Мой тезис — вы не знаете, какой полный набор существенных параметров, от которых зависит вероятность доставки. Значит вы не можете достоверно сказать, что курьер Х более надёжен, чем случайный прохожий У. Может проявиться фактор, про который вы не в курсе.
Могу в значках. Мы обсуждаем, что
Р(D|X) > P(D|Y), для любых D, X, Y
где D принадлежит множеству доставок, X — множеству курьеров, Y — множеству случайных прохожих.
Так вот, это утверждение не верно. Если ваше утверждение в другом — пожалуйста, изложите его в одном комментарии целиком.
Это не мешает в обычной жизни, т.к. можно предположить примерно, а потом исправить ошибку, если что. Мой вышестоящий тезис в этом и состоял — нет никакой хорошей модели доставки (в которой есть список всех существенных параметров). Для зрительной коры такая модель есть (есть основания считать, что учтены все существенные параметры).
Тогда курьер перестанет быть курьером, ведь зачем ему быть курьером, если он в этом не заинтересован?
Подмена понятий. Речь в моем комментарии о заинтересованности в получении денег. А не в том, что бы быть курьером. Пожалуйста, не надо так, это не хорошо.
Повторю ещё раз. Вы можете в одном комментарии сформулировать и посылки и ваш вывод? Что бы можно было рассмотреть вашу предлагаемую модель целиком.
Тогда о чем вы спорите? Это же и есть мой изначальный тезис.
Если уж быть точным, ваш изначальный тезис — что разработка сети — это как в казино на зеро, а сверточные сети — как карго-культ. Полагаю, что уж этот "изначальный тезис" отпал и вами больше не поддерживается.
Плюс прочитайте следующий абзац моего прошлого комментария.
Ваш более ранний тезис, что построение нейронных сетей — бросок монетки — неверен. Много людей знают, как они работают и каким образом получается результат. Сделать нейронку для изученной области — инженерная задача.
Остались возражения?
Это не мое предположение, это вы сами озвучили.
потому что вы это статистически наблюдали (монетка выпала дважды), но при этом не понимаете почему получился такой результат наблюдений
Вот утверждение, что я НЕ понимаю, почему получился такой результат, во оно ещё более странное. Как вы такой вывод сделали, например, после ссылки на ту работу по сверточным? Ну да хз, ваши выводы о моем понимании к делу не относятся, какие б странные они ни были.
не понимаете, почему нейронные сети работают,
Ещё более странно. Опять же, оставляю на вашей совести, особенно после моего прямого опровержения. Видимо вы противопоставляете — если я вам рассказал про статистику, а не начал сразу с ссылок — значит видимо я не понимаю, как работает внутри.
Так вот, как работают простые архитектуры — понимаю (сложные — пока нет, в процессе). И не только я, конечно. Пару фамилий я назвал, ещё сотню можете нагуглить сами. Но это так, к слову. Ваше предположение о моем понимании не существенно, я ж не использую это как довод, просто удивился вашему выводу.
А может — она просто случайно двумя орлами выпала. И тогда тут ни о каком "работает" речи нет.
Может быть. А может быть я осмотрел монетку, прочитал, как эту монетку бросали тысячу раз, узнал, из какого материала состоит и теперь предсказываю — упадет орлом, вероятность 100%, она действительно с двумя орлами.
А вы мне в ответ — вы же даже не знаете, почему два тела притягиваются. И никто не знает. Поэтому ставка, что она вообще упадет — это как в казино на зеро. Слабенький довод, не находите?
Второй раз? А с первого раза что не так пошло? "single-unit recording", первая ссылка в Гугле на Вики. Вы по прежнему будете считать, что "процесс не изучен"?
Там нет ничего про изучение процессов.
Прочитал ниже и понял, что конкретно вы не догоняете. Вы берете один параметр (курьер/не курьер). Я спрашиваю — от каких ещё параметров вероятность доставки зависит существенно? В этом и суть модели — знать все существенные параметры, согласны?
Нет, суть модели как раз в том, чтобы не знать параметры. Иначе это бесполезная модель. В случае курьера — я знаю что он курьер, и мне этого достаточно, чтобы сделать совершенно строгий логический вывод о том, что моя посылка будет скорее доставлена, чем нет. я понимаю, почему это так, я вижу статистику, которая это подтверждает. Что еще нужно?
Мой тезис — вы не знаете, какой полный набор существенных параметров, от которых зависит вероятность доставки. Значит вы не можете достоверно сказать, что курьер Х более надёжен, чем случайный прохожий У.
А мне это и не нужно, я говорю, что он более надежен при прочих равных.
Могу в значках. Мы обсуждаем, что
Р(D|X) > P(D|Y), для любых D, X, Y
где D принадлежит множеству доставок, X — множеству курьеров, Y — множеству случайных прохожих.
Так смотрите, P(D | X) — условная вероятность события D при условии выполнения события Х. Вы зачем-то формулируете утверждение как
forall D, X, Y: Р(D|X) > P(D|Y), где D — событие доставки конкретной посылки, а X/Y — конкретный некурьер или курер.
Любая такая вероятность либо 100%, либо 0%, потому что конкретная посылка совершенно точно либо доставлена либо не доставлена конкретным человеком.
Так вот утверждение должно быть такое:
Р(D|X) > P(D|Y), где D — событие доставки посылки, X — доставка курьером, Y — доставка некурьером.
Обратите внимание — никакой квантификации по событиям нет, потому что у нас просто три события, вполне конкретных.
То есть не "для любой посылки, курьера и некурьера, вероятность доставки данной посылки при условии, что она доставляется этим курьером, выше, чем вероятность доставки посылки при условии, что она доставляется этим некурьером", а "вероятность доставки посылки при условии, что она доставляется курьером, выше, чем вероятность доставки посылки при условии, что она доставляется некурьером".
Если уж быть точным, ваш изначальный тезис — что разработка сети — это как в казино на зеро, а сверточные сети — как карго-культ. Полагаю, что уж этот "изначальный тезис" отпал и вами больше не поддерживается.
В смысле отпал? Это тот же самый тезис и есть.
Много людей знают, как они работают и каким образом получается результат.
подождите мы только что выше пришли к согласию, что не существует ни одного человека, который бы знал как работают сети и как получается результат, разве нет? А теперь вы говорите совершенно противоположное.
Сделать нейронку для изученной области — инженерная задача.
Остались возражения?
Конечно же есть. Что-то является инженерной задачей если вы можете взять и по определенным правилам повторить результат. В случае нейронных сетей зачастую даже одна и та же команда разработчиков не может повторить результат, не говоря уже о другой команде. По-этому я и считаю, что на данный момент обучение нейронных сетей — ровно в той же степени инженерная задача, как живопись или литература.
А может быть я осмотрел монетку, прочитал, как эту монетку бросали тысячу раз, узнал, из какого материала состоит и теперь предсказываю — упадет орлом, вероятность 100%, она действительно с двумя орлами.
Так в том и дело, что вы ничего не осмотрели и не узнали. И единственная причина, по которой вы что-то предсказываете — потому что так уже было.
Никаких других причин у вас нет.
Обращу ваше внимание только на три пункта.
Нет, суть модели как раз в том, чтобы не знать параметры. Иначе это бесполезная модель.
Не бывает моделей без параметров. Курьер/не курьер — это параметр. Откуда вы взяли, что "суть модели — не знать примеры", не ясно. Если вы сможете подтвердить это ссылками, буду искренне благодарен, т.к. либо вы говорите о чем-то очень интересном, либо крайне заблуждаетесь.
Любая такая вероятность либо 100%, либо 0%, потому что конкретная посылка совершенно точно либо доставлена либо не доставлена конкретным человеком.
"Доставлена" — видимо вы говорите о событии в прошлом. Такое событие конечно либо 0%, либо 100%. Всегда. Нас интересует событие в будущем. "Будет доставлена". Утверждение, что вероятность "конкретная посылка будет доставлена", всегда либо 0%, либо 100% — очевидно неверное.
подождите мы только что выше пришли к согласию, что не существует ни одного человека, который бы знал как работают сети и как получается результат, разве нет? А теперь вы говорите совершенно противоположное.
Вы крайне, запредельно невнимательны. И это при том, что сообщения можно перечитывать. Я говорил, что не знаю людей, которые знают, "почему" они работают. Людей, которые знают, "как" — сотни (а может десятки тысяч, но тут не уверен). И предлагал вам обсуждать именно "как".
Пример, как работают свёртки, был дан выше (есть и другие материалы по этой теме, возможно более подходящие). Если вы внимательно прочитаете, вы тоже будете знать, как достичь position shift invariance в нейронной сети. Или можете продолжать настаивать, что вы не знаете, как это сделать.
Остальное не интересно. Если вы настаиваете на своем непонимании — ваше право, мне без разницы.
Не бывает моделей без параметров. Курьер/не курьер — это параметр.
Конечно, речь о том, что некоторыми параметрами, да и вообще в принципе некоторыми свойствами моделируемой системы, мы намеренно пренебрегаем. Именно по-этому модель — это, собственно, модель, а не сама моделируемая система.
Если вы сможете подтвердить это ссылками, буду искренне благодарен
См. выше — это включает понятие модели само по себе.
"Доставлена" — видимо вы говорите о событии в прошлом. Такое событие конечно либо 0%, либо 100%. Всегда. Нас интересует событие в будущем.
А событие в прошлом и будущем — это одно и то же событие в рамках конкретного вероятностного пространства, так что его вероятность никак не может поменяться во времени.
Это, впрочем, как раз не важно, вы почему-то откомментили несущественный для разговора момент но пропустили существенную часть — там, где я объяснял, что вы неверно сформулировали утверждение.
Я говорил, что не знаю людей, которые знают, "почему" они работают. Людей, которые знают, "как" — сотни (а может десятки тысяч, но тут не уверен).
А какая разница между "как" и "почему"? Вы какой-то софистикой занимаетесь. На мой взгляд — это ровно одно и то же. По-этому "никто не знает, почему работают нейросети" = "никто не знает, как работают нейросети".
Ну это с-но не важно, окей, допустим вы интерпретируете "как" как-то иначе, пусть, ну вроде как — никто не знает, почему написанная таким-то автором книга стала шедевром, но при этом понятно КАК он ее написал (тыкал пальцем по клавиатуре, ну или определенным образом пером бумагу шкрябал, если брать более ранний период), и в итоге так и останавливаемся на том, что разработка нейросетей — в точности такая же инженерная дисциплина, как литература, живопись, или музыка.
Музыка, кстати, лучший пример — там есть весьма глубокая тональная теория, которая описывает, какие конкретно звуки нравятся человеку и как их следует совмещать друг с другом, кроме того — есть еще и достаточно годные гипотезы (пусть и гипотезы, но они есть), которые достаточно содержательно объясняют ПОЧЕМУ это так. То есть музыка на данный момент — строго более инженерная дисциплина (если под "уровнем инженерности" подразумевать уровень понимания, почему и как что-то работает), чем нейросети, если уж объективно смотреть.
Так что, поздравляю, вы объявили музыкантов инженерами.
А событие в прошлом и будущем — это одно и то же событие в рамках конкретного вероятностного пространства, так что его вероятность никак не может поменяться во времени.
Вы хоть раз слышали про априорные и апостериорные вероятности?
Вы хоть раз слышали про априорные и апостериорные вероятности?
Апостериорная вероятность условная, с-но она тут не при чем.
А значит, условное вероятностное пространство меняется, и апостериорные вероятности меняются вместе с ним.
Апостериорные могут сколько угодно меняться, нас это совершенно не интересует, т.к. мы эти вероятности не рассматриваем. Нас волнует вероятность событий сама по себе, не условная.
Нет, судя по вот этой цитате, вас интересуют именно апостериорные:
Любая такая вероятность либо 100%, либо 0%, потому что конкретная посылка совершенно точно либо доставлена либо не доставлена конкретным человеком.
Потому что априорные вероятности рассматриваемых событий не могут быть равны ни 0, ни 100%.
некоторыми свойствами моделируемой системы, мы намеренно пренебрегаем
Вот именно. Параметры есть, но не все возможные, а существенные. Я ещё неделю назад попросил вас дать список существенных параметров для этой вашей модели. Он что, только один? Курьер/не курьер? А если у него сегодня первый день работы — это тоже не параметр? Не существенно? А сумма, которую платят за доставку — не существенно? Всё равно курьер надёжнее, чем не курьер?
См. выше — это включает понятие модели само по себе.
Вы подтвердили, что параметр есть. Пусть даже он в вашей тривиальной модели всего один. Просьба по возможности формулировать чуть точнее, а не в стиле "суть модели как раз в том, чтобы не знать параметры".
А событие в прошлом и будущем — это одно и то же событие в рамках конкретного вероятностного пространства, так что его вероятность никак не может поменяться во времени.
То есть вероятность дождя 8-го сентября либо 100%, либо ноль? И эта вероятность никак не поменяется спустя пару дней? Вы тщательно обдумали этот довод?
откомментили несущественный для разговора момент но пропустили существенную часть
Это очень существенный момент. Он важен для процесса рассуждения, но проще объяснить сам момент, чем то, как он будет влиять на дальнейший диалог.
Вероятности меняются со временем, есть вероятность не только для категорий, но и вероятность единичного события. Обратите внимание на вероятность дождя. Вероятность завтрашнего дождя (8-го числа) сегодня и послезавтра одинакова? Она больше нуля? Она меньше 100%?
Это, опять же, не какая-то эзотерика или альтернативщина, это вообще-то common knowledge. Probability of a single event отнють не является либо 0, либо 100.
Далее. Суть не в том, что я сформулировал неверно. Формулировка конечно верная по форме. Просто вы говорите, что это утверждение вы не поддерживали, а поддерживаете другое.
Р(D|X) > P(D|Y), где D — событие доставки, X — доставщик курьер, Y — доставщик не курьер.
Хорошо, так можно. Если вы скажете — я вывел это из наблюдений за людьми, плюс у меня есть более сложная модель (с желанием денег, согласием на работу и т.п.), которая тоже в целом соответствует наблюдениям — я с вами соглашусь. Не 100% надёжно, но вполне приемлимо.
Но вы стали утверждать не это! Вы утверждали, что наблюдения не нужны, а Р(D|X) > P(D|Y) вы сможете доказать строго как теорему. Вот это — неверно. Не получится. Если не согласны — продемонстрируйте доказательство.
А какая разница между "как" и "почему"? Вы какой-то софистикой занимаетесь
Если никакой, давайте остановимся на слове "как"? Вам всё равно, а мне удобнее. Никакую софистику по этому поводу разводить не будем.
Я ещё раз обращу ваше внимание (вы проигнорировали) на position shift invariance. Есть люди, которые знают, как достичь этого свойства в нейросети при распознании изображений. Есть работы, где описывается, как это сделать. Совсем не монетка. Если с этим доводом что-то не так — аргументируйте.
Вот именно. Параметры есть, но не все возможные, а существенные. Я ещё неделю назад попросил вас дать список существенных параметров для этой вашей модели. Он что, только один?
Поскольку мы один параметр и рассматриваем — ну да, один. Зачем нам другие и на что они могут в принципе повлиять?
А если у него сегодня первый день работы — это тоже не параметр?
А почему это может быть существенно, если мы смотрим по всем курьерам? Мы же говорим не о ком-то конкретном. Обо всех. Туда входят и те, что первый день работают и те, что не первый. Те, кому платят много и те, кому платят мало. Нас не волнует вероятность доставки конкретным курьером, мы ее не обсуждаем, нам она неинтересна. Мы говорим об интегральном показателе.
Вы подтвердили, что параметр есть. Пусть даже он в вашей тривиальной модели всего один.
Я и не говорил нигде, что параметров вообще не должно быть, вы как-то странно поняли.
То есть вероятность дождя 8-го сентября либо 100%, либо ноль? И эта вероятность никак не поменяется спустя пару дней?
Конечно, дождь, совершенно точно, либо произойдет, либо нет. То, что вы не знаете, как оно будет — это уже другое дело. Я, например, если монетку подкинул и закрыл глаза — то тоже не знаю, чем там она выпала. Хотя чем-то же выпала, вполне определенно.
Это очень существенный момент. Он важен для процесса рассуждения
Вообще-то он никак не влияет на дальнейшее рассуждение. Он совершенно отдельно.
Вероятности меняются со временем
В вероятностном пространстве нету вообще такого понятия, как время. Возьмем ту же монетку, вам дано множество {орел, решка}, сигма-алгебра подмножеств на нем: {{орел, решка}, {орел}, {решка}, {}} и конечная, конечно-аддитивная мера, отнормированная на единицу:
P({орел, решка}) = 1
P({орел}) = 1/2
P({решка}) = 1/2
P({}) = 0
никакого ВРЕМЕНИ и каких-то еще прочих бредней тут нет.
Но вы стали утверждать не это! Вы утверждали, что наблюдения не нужны, а Р(D|X) > P(D|Y) вы сможете доказать строго как теорему.
Ну так еще раз:
- люди, которые, в среднем, более заинтересованы в выполнении задачи, выполняют задачу в среднем лучше, чем те, что заинтересованы меньше
- курьеры в среднем заинтересованы в доставке посылки больше, чем некурьеры
=> в среднем курьеры выполняют задачу доставки посылки лучше
Если никакой, давайте остановимся на слове "как"? Вам всё равно, а мне удобнее.
Давайте по порядку:
- вы согласны с тем, что никто не знает, почему
- я согласен с тем, что кто-то знает, как (в вашем понимании "как")
верно?
тогда давайте перейдем к следующему тезису
Совсем не монетка.
Литература — тоже не монетка, но при этом не является инженерной дисциплиной.
С-но и вот следующий мой тезис — разработка и обучение нейронных сетей — не инженерная дисциплина. Потому что для того, чтобы быть инженерной дисциплиной, не достататочно понимания "как" (иначе бы инженерной дисциплиной была литература или музыка), но нужно еще понимание "почему", причем достаточно глубокое (см. тот же пример с музыкой — понимание "почему" есть, но не достаточно глубокое).
Новых идей в обучении нейросетей не было уже 50 лет, со времен появления персептрона Розенблатта
Рекуррентные сети — 1980. Энкодеры — конец 80-ых. Свёрточные сети — 1988. LSTM — 1997. GRU — 2014. GAN — 2014.
Да что там говорить, backprop в современном виде был описан только в 1986 году.
Да, не всё из этого про «обучение нейросетей», но, например, backprop и BPTT, а также GANы — это именно про оптимизацию.
А я ведь сейчас прошёлся только по самым известным и высокоуровневым штукам.
Говорить, что после персептрона Розенблатта ничего не появилось — это мягко говоря преувеличение.
Я уж даже не говорю, что к одним нейронным сетям оно вообще-то не сводится.
Об ML никто не говорил, мы конкретно нейросети обсуждаем.
Так можете какие-то конкретные новые идеи в области нейронных сетей за последние 50 лет назвать?
А то это очень странно — все говорят, что идеи есть, но назвать ни одной не могут.
Ганы и другие генеративные модели (FLOW, Vae), капсульные сети, сверточные сети,
Было описано у Розенблатта. Или с тех пор появились какие-то новые результаты, доказаны новые важные теоремы о свойствах таких сетях? Можно примеры? Я бы с удовольствием ознакомился.
дифференцируемый нейрокомпьютер и нейронная машина Тьюринга
Ну здесь можно в какой-то мере согласиться.
Кучи новых алгоритмов оптимизаторов как Adam, например.
Adam сам по себе к нейронным сетям никакого отношения не имеет, по такой логике можно "прорывом в области нейросетей" назвать любой новый эффективный метод оптимизации. Видимо, остальная "куча новых алгоритмов" попадает туда же.
ГАНы были описаны у Розенблатта?
Я конечно не спец, но везде написано, что их описал в 2014 году Гудфеллоу.
Капсульные сети предложил Хинтон и его команда в 2017 году.
Про аутоэнкодеры я не знаю, но не думаю, что они были у Розенблатта.
Все эти сети попадают в тот или иной класс, описанный у Розенблатта. Немного тонкий вопрос с ганами — в прямом виде их нет, но пару из состязательных сетей можно заменить одной эквивалентной сетью.
Я не называл это прорывом в области нейросетей. Это просто новый алгоритм оптимизации в области машинного обучения. Как раз в нейросетях применяется регулярно.
Давайте договоримся, мы говорим конкретно о нейронных сетях. Просто универсальные математические алгоритмы, применимые, в силу универсальности, к нейронным сетям не относятся к разговору.
Ну например были открыты adversarial attacks. Это было довольно неожиданное открытие.
Серьезно, неожиданно? Нет, штука конечно интересная и прикольная, тут я без вопросом соглашусь, но как и для кого может быть неожиданным факт невозможности построить гомеоморфизм между пр-вами разной размерности?
Нет не попадают. Розенблат придумал перцептрон.
Он придумал нейронные сети в принципе и назвал их "перцептрон". "Просто перцептрон Розенблатта" (без уточнений, какой именно) — это "просто нейронная сеть". Любая.
Как именно гомеоморфизмы между пространствами разной размерности связаны с adversarial attacks?
Напрямую. Любая "неполная" (в том смысле, что неспособна в силу недостатка количества нейронов распознать полный набор стимулов — то есть в общем-то все применяемые на данный момент сети как раз в этом смысле неполные) выполняет проекцию из пр-ва высшей размерности в пр-во низшей. Гомеоморфизма между ними нет в принципе. Кроме гомеоморфизма нам еще подойдет просто непрерывное вложение — но непрерывных вложений сильно меньше по сравнению с разрывными. Иными словами — чтобы сеть сошлась к непрерывному вложению должно очень и очень сильно повезти, и никаких внешних причин для такого везения — нет.
Почему для кого-то стал неожиданным тот факт, что не реализовался сценарий, вероятность которого крайне мала и которому нет никаких причин реализовывать — мне искренне непонятны, это вы не у меня спрашивайте. Действительно странной (и удачной) была бы как раз обратная ситуация.
Можно лишь сказать, что:
The existence of the adversarial negatives appears to be in contradiction with the network’s ability to achieve high generalization performance.
на ТАКОМ уровне рассуждения (просто словами, без четкого смысла) действительно может много чего быть неожиданно, с математической же точки зрения — неожиданностей никаких.
Вы мне напоминаете философов, которые используют математические термины безо всякого смысла, чтобы запудрить мозги читателю.
Если вы не понимаете математических терминов на уровне первого курса матфака — это же ваша проблема, а не моя, разве нет?
Я думал, вы имеете какой-то базовый набор знаний, сразу бы предупредили, что нет.
С какой это стати сети выполняют проекцию из пространства высшей размерности в низшую?
Ну это даже не смешно. Не вижу смысла разговор продолжать. Вы себя выше вроде за такого специалиста выставляли, а в итоге не знаете даже самых базовых вещей. Естественно, для вас будут всякие "неожиданности".
Ну вы можете почитать статью, если хотите.
Ну окей, я не поленился, в самой же статье в п.4.3 делается анализ неустойчивости (причем вполне себе тривиальный анализ, буквально в пару строк), где получены оценки, согласно которым нет никаких причин полагать, что сети устойчивы.
Для меня теперь стало все еще более непонятно — каким образом один и тот же человек в одной и той же статье называет явление "неочевидным и неожиданным", а потом там же при помощи несложных математических выкладок показывает, что ничего неожиданного в этом нет.
Качество игры отдельного бота не равно качеству игры команды ботов. Вполне может даже оказаться, что попытка максимизировать качество на отдельном персонаже давала просадку метрики по команде в целом.Может в какой-то другой игре, но не в Доте.
Нам кажется, что надо каждому игроку играть лучше, а обученная модель спокойна могла получить процент побед с более слабым middle персонажем в 76% против 67% с более сильным, но при изменненных других параметрах.
Задача модели это иметь как можно лучшую заданную метрику, а она может оказаться
1. довольно хитрой или комбинацией нескольких
2. не коррелировать с нашей интуицией.
Те же шахматисты подскажут, что модель часто делает шаги контринтуитивные шаги, но они оказываются выигрышными.
Нам кажется, что надо каждому игроку играть лучше, а обученная модель спокойна могла получить процент побед с более слабым middle персонажем в 76% против 67% с более сильным, но при изменненных других параметрах.
Так я же об этом и говорю. Для того, чтобы обучить бота играть более универсально, приходится ухудшить более специфичные навыки. В итоге чем больше мы будем обучать, тем хуже бот будет играть.
Не факт. Затем мы можем продолжить обучать модель и «сильный мид» (еще бы формализовать эту метрику) вновь окажется выигрышным в обучении фактором.
Но сеть то уже не сможет играть сильно на миде, не влезет в нее.
Ну так из примера выше. Была сеть, которая умела стоять на миде, стала — та, которая разучилась.
Поскольку навык стояния на миде качество игры не может уменьшить никак, то может такое возникнуть только в том случае, если "разучиться" требуется, чтобы научиться чему-то другому.
Навык этот окажется активностями, возможно, тысяч нейронов во множестве сетей. Так что штука не бинарная ВКЛ/ВЫКЛ.
Так речь и не идет о есть/нету, речь о качестве навыка (хорошо/плохо с практически непрерывным спектром).
. Допустим, она решает, что есть смысл чуточку слить мид
Нет, не может быть в доте никакого смысла слить мид. Никак и никогда. Дота так не работает.
Не надо обманываться, это никакой не контринтуитивный шаг, а просто бот разучился тащить на миде. Такой же косяк, как свен, разменивающий себя в т2, даблшрапнель снайпера и т.п. вещи.
в большие локальные победы за счет лучше откормленных (и менее тормозных) саппортов
От слива мида сапортам будет хуже, а не лучше.
обученная модель спокойна могла получить процент побед с более слабым middle персонажем в 76% против 67% с более сильнымОткуда информация? С кем играла обученная модель и сколько раз? Что понимается под «сильным» мид персонажем?
Мы не можем сказать, какие свойства окажутся выигрышными для какой модели заранее. Если бы могли, то нам был бы ML и DL не нужен, мы бы просто писали линейные алгоритмы, которые дофига умны.
Мы не можем сказать, какие свойства окажутся выигрышными для какой модели заранее.
Нет, мы можем, потому что знаем, как игра устроена.
Доте нужен ИИ только для того чтобы разработать стратегию взаимосвязанных действий 5 персонажей на карте (т.е. принять решение, когда идти в атаку, когда зачищать лес, когда уйти в оборону, когда сосредоточиться на заработке золота и т.д.). Это нетривиальная проблема, а то что касается отдельных битв, которые уже начались, тут задача сводится чуть ли не элементарному решению (битвы легко просчитываются, т.к. скилов и возможных действий у героев не много).
Говорю как человек убивший пару лет на DL :)
Быть специалистом предметной области полезнее в данном случае, чем знать DL.
Да и вообще всегда полезнее.
Это уже проходили. Экспертные системы заняли свою узкую нише и не более. В мире ML подобные рассуждения не работают.
Понимаете, вы говорите о том, что пачка экспертов способны сделать «умную» модель, ибо разбираются в вопросе.
Нет, мы говорим о том, что эксперты обычно знают некоторые вещи, которые гарантированно правильны. Например, эксперт в шахматах знает, как ставить детский мат. И что надо сделать, чтобы его гарантированно не поставили.
Есть просто некоторые вещи которые очевидно верны, в силу просто того как устроена игра. Например, в случае доты, абсолютно во всех практически осуществимых случаях при прочих равных лучше заработать больше золота и голды на команду, чем меньше (или не дать заработать противнику, например). Ситуация в которой это не так, практически неосуществима просто в силу игровой механики. Это утверждение из разряда того, что бкб работает 10-5 секунд. Ну вот столько оно работает иничегонисделать.
эксперты обычно знают некоторые вещи, которые гарантированно правильны
Не так. Эксперты знают некоторые вещи, которые работают для них. Это не значит что они гарантировано правильны.
Например, в случае доты, абсолютно во всех практически осуществимых случаях при прочих равных лучше заработать больше золота и голды на команду, чем меньше
Это очевидно не так. Выиграв на 10 минут быстрее можно заработать заметно меньше золота за игру. Станете утверждать что выиграть на 10 минут раньше — хуже чем на 10-20-30 позже? Можно еще придумать ситуации когда лучше пойти и продавить линию чем разбежаться на фарм. Или такого тоже никогда не случается и нужно фармить как можно больше?
Это очевидно не так. Выиграв на 10 минут быстрее можно заработать заметно меньше золота за игру. Станете утверждать что выиграть на 10 минут раньше — хуже чем на 10-20-30 позже?Очевидно, что у вас неправильно задана целевая функция: вопрос не во времени или золоте, а в наборе действий, при которых шанс на победу будет максимальным. С более лейтовым составом высока вероятность, что пойти заработать золота будет менее рискованно, чем пытаться закончить матч сразу.
Не так. Эксперты знают некоторые вещи, которые работают для них. Это не значит что они гарантировано правильны.
Нет, именно гарантированно правильны. В принципе, объективно, для всех.
Это очевидно не так.
Это, очевидно, так.
Выиграв на 10 минут быстрее можно заработать заметно меньше золота за игру.
Вы намеренно опустили "при прочих равных"? Не существует такого варианта, где вы при прочих равных зарабатывая больше золота выигрываете игру позже.
Т.к. вы можете просто совершать все те же самые действия, не обращая внимания на то, что лишнее золото у вас есть (и, с-но, выигрываете игру ровно в тот же момент, как если бы золота у вас не было). То есть это, как минимум, не ухудшает вашей ситуации, но при этом дает вам возможность делать некоторые действия, которые без золота вы бы делать не могли (то есть ситуацию потенциально улучшает).
Есть конечно нюанс — это механика расчета золота за убийство, но чисто математически то, что вы таким образом бонусно получите, абсолютно всегда будет меньше того, что получил ваш противник.
Станете утверждать что выиграть на 10 минут раньше — хуже чем на 10-20-30 позже?
Это не лучше и не хуже, это одинаково (а для бота играющего против игроков — чем позже тем лучше, как раз, т.к. бот в отличии от человека не выматывается, а дота когнитивно дает очень большую нагрузку). В доту играют не на время.
И, да, имея преимущество, его обычно наращивают — забирают товера, дофармливают нужные айтемы, забирают рошана, и уже потом идут пушить наверочку, на 10-20-30 минут позже. Но зато с бОльшими гарантиями успеха.
Не существует такого варианта, где вы при прочих равных зарабатывая больше золота выигрываете игру позже.
То есть вариант сидеть в защите пока часть команды фармит и выиграть в эндгейме не существует? Всегда идет раш с самого старта? Мне кажется вы либо не разбираетесь в теме, либо уперлись и в упор не видите ошибок в своих рассуждениях. При каких прочих равных? При всех? Но при всех прочих равных у ваас и золота будет одинаково, невозможно зарабатывать больше золота делая то же самое. А значит количество золота зависит от выбранной стратегии, от конкретных действий в каждый конкретный момент. И вариантов как можно заработать больше золота в ущерб другим параметрам — масса.
То есть вариант сидеть в защите пока часть команды фармит и выиграть в эндгейме не существует?
Вы о чем?
Мне кажется вы либо не разбираетесь в теме, либо уперлись и в упор не видите ошибок в своих рассуждениях.
Вы просто не можете понять, что вам пишут.
При каких прочих равных? При всех?
Да, при всех.
Но при всех прочих равных у ваас и золота будет одинаково, невозможно зарабатывать больше золота делая то же самое.
Конечно можно! Если вы выигрываете мид, то вы получаете больше золота/опыта при прочих равных
И вариантов как можно заработать больше золота в ущерб другим параметрам — масса.
Конечно же, их масса! Но если вы выигрываете мид, а не сливаете — вы зарабатываете больше золота без ущерба каким-то другим параметрам.
И вы этого никак не хотите понять.
У того, что вы выигрываете мид — нет никаких возможных негативных последствий.
Речь ведь даже не о том, что вы можете либо стоять и тащить мидл, либо пойти гангать, нет — речь именно о стоянии на миде, где вы либо забираете больше крипов и гнобите противника, либо нет. В первом случае вы не жертвуете абсолютно ничем, вы просто получаете больше к моменту Х, и это никак не влияет на то, что происходит на остальной карте.
Вы сейчас полагаете что бот какой-то сверхумныйй и делает какие-то сверхгениальные вещи. Это не так. Текущий бот (если посмотреть игру) — довольно глуп, часто тупит, очень плох в макроигре, единственное что у него действительно хорошо выходит — это стак скилов в замесах.
Так что глупость бота в данном случае — это именно глупость бота, а не какой-то хитрый план, что "иначе было бы хуже".
идеально играющий инвокер может удержать от проигрыша и выиграть игры практически сам.
в ЛоЛе — нет, там концепция игры совершенно другая
Идеально играющий инвокер ничего не сможет сделать против своей прямой контры.
Это какой? ;)
Ему нужны сапорты
В том случае, если сапорты противника на миде поселятся. А иначе — отъестся на мидере противника и начнет нагибать всю карту с 10 минуты.
А еще тут могут и свои тиммейты «помочь» — они же тоже личную эффективность оптимизируют! Курьера отобрать, например. Или просто тоже прийти на мид.
Мидер противника может и не позволить на себе отъесться…
Мы же говорим о ситуации, когда скил инвокера значителньо выше.
А еще тут могут и свои тиммейты «помочь» — они же тоже личную эффективность оптимизируют! Курьера отобрать, например. Или просто тоже прийти на мид.
Давайте ближе к реальности все-таки ;)
Тогда лучше бы было дать стимул на победу, чтобы игроки всерьез играли :)
В общем как по мне, получилось, какое-то двоякое впечатление. Вроде и круто, что команда разработчиков так продвинулась за год, а с другой стороны не понятен выбор игроков и их отношение к игре.
То есть, если в том году, каждый хотел попробовать выиграть того бота на миде, то здесь получился какой-то вялый эффект :(
Одного этого ограничения достаточно, чтобы сильно порезать возможности ботов.
Сделать, чтобы боты легко убивали человека 1 на 1 — несложно. Основная задача — научить их принимать долгосрочные тактические решения.
Вы не заметили ограничения на реакцию в 200 мс? Это между прочим почти вдвое больше, чем реакция опытного игрока.
А вы сможете указать в каких моментах игры это порешало?
Вы доте реакция (и вообще микро) не так важны как кажется.
Каждый раз в тимфайте, можно попытаться увернуться или побежать в определенном направлении и противник должен на это среагировать — это реакция.
В любой игре реакция и микро важны, просто до определенного уровня. и 200 мс (целая пятая часть секунды) это уровень весьма средненького игрока.
В каждом моменте, где из кустов выходит герой, или когда игрок видит что-то появляющееся из тумана войны — это реакция.
Замечательно, но вопрос остается — где именно это порешало в данной конкретной игре?
В любой игре реакция и микро важны, просто до определенного уровня. и 200 мс (целая пятая часть секунды) это уровень весьма средненького игрока.
Ну я еще раз задаю вопрос — вы можете конкретные моменты показать, где это решало, а не теоретически рассуждения?
Типа: "вот в моменте х если бы игрок среагировал не с 200мс, а с 150мс, то замес бы пошел по-другому..."
Я не отрицаю, что такие моменты возможны. Я лишь говорю о том что вы переоцениваете их количество и, с-но, важность "ограничения реакции".
К слову на счет того, что "200мс — реакция среднего игрока" — на самом деле это совсем не так. Реакция игроков в замесе сильно больше, чем 200мс, просто потмоу что ко времени реакции приходится добавить время на осознание происходящего и на принятие решения.
Пример: в первой доте из-за особенностей анимации можно было гарантированно уворачиваться от подкопа скорпа. Ну то есть если я вижу, как вы пытаетесь меня копнуть, то я отхожу вбок и вы ничего не сделаете, не подкопаете, как ни старайтесь. И для того, чтобы это сделать, не требовалось какой-то особой реакции, ну потрениться полчасика и все. Но ирл это никто не делал, просто потому что в замесе вы не можете следить за одним конкретным скорпом, а если а заметите момент подкопа, то просто не успеете принять решение об увороте, т.к. приходится учитывать еще множество фактором в плане того, в какую сторону бежать и что делать.
API соблюдает условия честной игры — то есть не сообщает ботам о врагах вне видимости.
Ну, реакцию для ИИ замедлили — об этом в статье написано.
200мс для профессионала, я полагаю, вполне приемлимо.
И в pve, и в pvp. А на той же арене при игре на 120мс и на 50мс разница уже была более очевидна в форматах 2 на 2 и 3 на 3.
Вы не путайте пинг с делеем. Ваши 120мс пинга на самом деле ~300.
«Если бы компьютер выиграл считывая информацию органическим глазом (обязательно с слепым пятном и необходимостью моргать!) с монитора, нажимал через устающие биологические руки (с туннельным синдромом!) на мышь и клавиатуру, ему бы хотелось жрать, спать и трахаться, то можно было бы говорить о каком то прорыве.»
а вообще, все таки ограничений маловато, (но это надо вводить для будущих убер версий)
помимо суперреакции которую снизили, есть множество мелких преимуществ у ИИ
Скорее, если бы эти человеческие мешки мяса использовали строгую логику позитронного мозга (дань Азимову), то у них было бы столько же внезапных озарений, как и у нас.
Жду бота для Майнкрафта )))
я слышал в XX веке какого-то гроссмейстера спросили: "а не получится ли так, что компьютер обыграет человека в шахматы, и не станет ли это смертью шахмат, как спорта". На что получил встречный вопрос "может ли автомобиль обогнать человека, и не станет ли это смертью легкой атлетики"
В шахматах люди уже давно проигрывают машинам, но ничего принципиального не произошло
Изменился регламент и теперь партии не оставляют на доигрывание именно по причине мощных анализаторов.
Мы еще в MUD ботов писали, которые по ночам чего нибудь интересное фармили. А как итог — в момент умирания весь мад выглядел как куча зомби, повторяющих одни и теже действия.
довольно быстро он окажется в топе, где он конечно же привлечет внимание со всеми вытекающими
Знаете к чему это приведёт? К тому, что
Мне дали блокировку в кс просто так
Там тип патруль есть чтобы игроки вычисляли читаков, ну и естевственно школьники патрули тож есть
Вот и такой мне дал бан
Якобы я читер
Хотя я просто жесткий игрок
будет тру стори для каждого второго.
Так что ИНОГДА патрули ошибаются, но это бывает очень и очень редко.
Вполне себе играют, как раз чтобы квалификацию не терять.
будет любопытно почитать откровения самих спортсменов
Ну вот например: hellraisers.pro/ru/news/4006-oskar-otvetil-na-voprosy-bolelschikov
1matas1: Сколько ты тренируешься в день, чтобы поддерживать свой уровень игры?
oskar: Не очень много. Я считаю, что я достаточно талантлив, чтобы поддерживать уровень своей стрельбы в хорошей форме. Я также надеюсь, что моя реакция не хуже. Я просто играю FPL (закрытый ладдер на платформе FACEIT для профессиональных игроков — примечание моё) (от 2 до 5 часов) и тренируюсь со своей командой (6 часов).
В моих тренировках нет ничего особенного, несколько часов я играю FPL, потом тренируюсь с командой. Когда я чувствую, что часто не могу попасть по врагу, я захожу на DM и играю там минимум 30 минут. Примерно получается 8-9 часов почти каждый день.
Про ранкед игры ни слова.
То же самое касается не только «контры», но и других киберспортивных игр, вот например про доту: www.the-village.ru/village/people/people/315317-kiber_voini
Обычно я просыпаюсь около 11 часов утра. После завтрака сажусь с кружечкой кофе почитать новости. Потом открываю доту, смотрю, как играют другие игроки. Играю три-четыре игры для разминки один, после чего начинаются тренировки против других профессиональных команд. Делаем от шести игр в день и обычно заканчиваем часов 8–9 вечера. После тренировки проводим ее разбор, потом можем покурить кальян, сходить в кино, либо же продолжаем играть по отдельности.
Играть из дома в трусах по интернету не эффективно: не получится вместе разобрать спорные игровые моменты, да и концентрация при игре из дома совершенно не та.
Опять ничего про ранговые игры. Вы удовлетворены, или у вас есть другая инфа, противоположного плана?
В вашем же интервью человек пишет про ладдер каждый день.
хинт: ладдер — это и есть рейтинговые игры.
Играю три-четыре игры для разминки один
и тут рейтинговые игры
читайте внимательнее собственные же источники :)
В вашем же интервью человек пишет про ладдер каждый день
Покажите пожалуйста цитату про ладдер, я в упор не вижу ничего подобного, даже самого слова такого там в статье нет.
читайте внимательнее собственные же источники
А вы не фантазируйте. Ладдер если кто и играет, то по собственному желанию, в качестве развлечения, если есть на то время. Каждый же день — только командные тренировки. Ладдер каждый день может себе позволить только тот, у кого нет команды. Таки читайте внимательнее мои источники.
Покажите пожалуйста цитату про ладдер, я в упор не вижу ничего подобного, даже самого слова такого там в статье нет.
Я просто играю FPL (закрытый ладдер на платформе FACEIT для профессиональных игроков — примечание моё) (от 2 до 5 часов) и тренируюсь со своей командой (6 часов).
Хотя я тут нагуглил рейтинг обычного ладдера по доте (ссылочку любезно предоставили ниже) — таки первые 3-6 мест занимают игроки, входящие в какую-либо команду. По контре статистику было бы интересно найти.
Так что сойдёмся на том, что некоторые профессиональные игроки регулярно играют в рейтинговые игры. Как часто у них возникают проблемы и как они решаются, это уже другая история.
Например, возьмём этого Michael «shroud» Grzesiek. Топовый стример, ушедший из команды чтобы продолжать стримить!
Возьмём его команду, Cloud9; первый попавшийся и довольно давно в ней числящийся игрок — Tyler «Skadoodle» Latham. Гуглю «Skadoodle plays counter strike mm» — и получаю болт. Не играет в ранкеды, видимо. Беру следующего, autimatic. Нахожу одно единственное видео «AUTIMATIC PLAYING ESEA RANK S ON MIRAGE (FT.STEWIE2K)». Вроде бы это ранкед? Я не уверен из-за ESEA. На его стримах — командные игры в основном. Следующий игрок STYKO — снова ничего не найдено. И так далее.
В общем, ваши доводы не убедительны.
Шрауд вначале был топовым игроком, и только потом стал стримером
У меня другие сведения:
Mike «shroud» Grzesiek has been playing since the launch of Counter-Strike: Global Offensive. He rose to prominence through the popularity of his twitch stream as well as his talent in the game which he displayed in ESEA-M with Slow Motion and then with Exertus and Manajuma in ESEA Invite.
…
He decided stepped down as he wanted to become a backup player and full time streamer for Cloud9, although at this point he had already decided to retire from the game.
Сейчас он стримит исключительно пубг уже с год.
Они играют только в составе своей команды против таких же спортсменов по лану
Вы в курсе, что многие прогеймеры тренируются по режиму, эдак 8-12 часов в день? На каких ланах это происходит, по-вашему?
Не знаю откуда у вас «ваши данные», но это можно узнать как из интервью у про игроков, так и на их стримах.
это можно узнать как из интервью у про игроков
Хотелось бы видеть. То, что я находил (см выше например), говорит об отсутствии интереса к ранкед при наличии команды.
Если взять League of Legends/DOTA — то там про игроки регулярно стримят. Включая тех, кто участвует в чемпионатах мира (то есть игроки из топ-16 команд).
Скорее всего этот человек таки пользовался читами когда-то давно. или ставил из интереса и наследил в системе.
Вот это точно ни при чём, потому что бан ему дали «следователи патруля» после просмотра записи игры, где на него тупо нажаловались «за неподобающее поведение». Читы им в той игре, запись которой смотрел патруль, не использовались 100%, что не помешало дать ему бан за «сторонние программы, помогающие целиться, видеть местоположение врагов или получать другие преимущества над остальными» (цитирую со скриншота ответа, возможно автоматического, службы поддержки по поводу бана).
Я склоняюсь к тому что ваш знакомый побаловался софтом, да и забыл даже, а бан подвезли через год-полтора, совсем не редкая ситуация.
Я склоняюсь к тому что ваш знакомый побаловался софтом, да и забыл даже, а бан подвезли через год-полтора
Ёлы-палы, я же ссылался на конкретную причину блокировки:

Такое невозможно для игры пол года назад — жалобы не рассматривают с таким огромным лагом. Повторяю, это не VAC бан, а ручной бан патрулём.
Всё таки нельзя строить выводы об изменениях на основании одного наблюдения. Возьмите хотя бы десяток. Если это будут друзья и знакомые — это тоже не будет достаточно репрезентативной выборкой, но хоть что-то. Делать выводы просто на основании сына — это совсем перебор. Вдруг он у вас в футбол не играет — так что же, популярность футбола, выходит, упала?
Шахматы, шашки, морской бой, карты и…
И все?
Менеджер/Монополия вдвоем не так интересно.
Ну может еще 5-10 игр.
Сейчас шахматы/шашки не потеряли популярности в абсолютном количестве, но в процентном конечно уступают миллионам игр на телефонах, планшетах, и т.д.
Ну или по простому — шахматы потеряли рынок, то есть стали менее популярны — в принципе я это и говорил.
Население земли увеличилось.
Другое дело, что у шахмат есть серьезные конкуренты, поэтому да, я предполагаю, что количество людей, играющих в шахматы, не стало меньше.
Будет стимул. После создания подобного ИИ встает следующая задача, научить его ошибаться так, чтобы метрика заинтересованности живых игроков была максимальна.
А после этого — мне будет глубоко безразлично живой ли там человек. Скорее даже наоборот, если бот будет давать максимальную заинтересованность, то он будет предпочтительнее живого человека. А следующим этапом станут личные боты, которых таскаешь из игры в игру, потому что они будут знать что нужно конкретно тебе. Такой виртуальный друг. Потом ему добавят функцию общения, а там уже один шаг до влюбленности… Так стоп, что-то меня не туда немного занесло...
Ну собственно да, к этому все и идет. Я не фантастику описывал а вероятный по моему мнению сценарий. Более того, я реально этого жду потому что для меня главная проблема в мультиплеере это то, что со случайными людьми мне играть не интересно практически, а с одними и теми же начинаются проблемы совпадения по времени. С ИИ ни того ни другого не должно быть в идеале.
Помимо изменения регламента (без доигрываний, без гаджетов и т.д.):
- изменился процесс подготовки (дебюты просчитываются дальше)
- продвинулась теория (базы окончаний),
- радикально изменился послематчевый анализ (игрокам в прямом эфире показывают альтернативные ветки, чемпион мира делает большие глаза, оппонент говорит что видел эту линию но не рискнул — шоу продолжается и после окончания партии),
- больше людей могут понимать партии топов (движки в реальном времени показывают оценки и лучшие ходы)
Но в целом шахматы не умерли, а получили развитие. На каждом крупном турнире применяются новые идеи, которые можно играть не раз и ходы, которые вообще не игрались раньше.
Вот когда автопилот научится водить лучше человека (а пока он ещё отстаёт), тогда реально начнется закат «человеческих» автогонок.
Как уже писали выше по моим субъективным оценкам, люди перестали стремится как раньше развивать уровень в шахматах, играют просто для удовольствия. Без заучивания и проработки всяких партий, дебютов и т.д.
Не дисциплина не умрёт, просто после того как достоверно установлено что человек не станет лучшим, люди перестают стремится быть лучшими.
В итоге, да люди будут продолжать играть и ездить на авто, и т.д. во всех средах где ИИ станет сильнее, но будут делать это для удовольствия, а не соревнования.
Когда-то в Ф-1, если не случалось механических неполадок, выигрывали чисто гонщики. Просто потому, что в принципе повернуть на этой болванке на велосипедных колесах мог далеко не всякий. Потом появились более широкие колеса и выигрывать гонку начали двигатели. Потом придумали антикрылья, и выигрывать гонку начала аэродинамика. Потом придумали турбину и снова начали выигрывать двигатели. Потом аэродинамику и двигатели придушили и снова начали выигрывать гонщики, но не долго — появились трэкшен контроли и АБСы… Их тоже придушили… Но появились КЕРСы… Сейчас придушили все и выигрывать начала надежность. Думаю, что на следующей итерации снова на первый план выйдут гонщики.
Это я все к чему? Шашки 8х8 и 10х10 уже решены, примерно как крестики-нолики 3х3, где победа невозможна. Но продолжают проходить чемпионаты…
после того как достоверно установлено что человек не станет лучшим
Факт, что человек с ружьем и некоторым опытом стрельбы на открытой местности примерно всегда дойдет до финиша первым — не отменил соревнований по легкой атлетике между людьми без ружья.
Наиболее широко «в прессе» представлены битвы против ботов администрации WoW, которая, как считается, недополучает кучу денег из-за активности ботов и из-за того, что игрокам не использующим ботов — тяжело. И да, время от времени банят «ботоводов» пачками в сотни тысяч аккаунтов… Но в свое время народ писал автоприцеливалки для различных он-лайн шутеров. (Да и в «нашем все» Quake, кстати, штатных встроенных ботов для игры при недостатке онлайн-игроков, по рассказам авторов в те годы, пришлось делать сильно тупыми и медленными. Иначе у мясных игроков вообще шансов не было.)
ИИ, победивший людей в Доту — интересен в первую очередь тем, что он «самообучился» своим стратегиям и тактикам. Если бы действия «ИИ» программировал бы мало-мальски приличный программист — у команды хомо сапиенсов шансов бы вообще не было. Даже близко. Совсем.
О чем я и упомянул в контексте Quake: 19 лет назад разработчикам ботов в Quake Arena пришлось оных ботов сильно оглупить и замедлить. Ибо иначе хомо сапиенсы дохли до того, как имели шанс увидеть бота.
Но основная моя мысль была в том, что администрации онлайн игр не очень важно, управляется бот нейросетью на суперкомпьютере или скриптом на вижуал васике. Им важно, чтобы «платящий кастомер» продолжал платить. А платящий кастомер почему-то упорно не хочет платить, когда его всегда обыгрывают. По этому, администрация примерно всех более-менее крупных онлайн игр активно борется с неофициальными ботами, нарушающими игровой баланс.
Вдобавок вы путаете ботов для всяких wow, цель которых не обыграть человека, а прокачать аккаунт. И ботов, которых пишут именно для игры против людей, так чтобы людям с ними было интересно играть.
А в 94-м я своих «ботов» писал, а не в школу ходил.
Если бы действия «ИИ» программировал бы мало-мальски приличный программист — у команды хомо сапиенсов шансов бы вообще не было.
Лучшие «традиционные» боты для доты, писанные неплохими программистами не имеют никаких шансов против мало-мальски умеющей играть команды людей. Вы путаете шутеры где основное действие довольно просто (стрелять в голову) и на 99% решает реакция с MOBA играми, где даже идеальная реакция не спасёт от слаженных командных действий.
Если бы действия «ИИ» программировал бы мало-мальски приличный программист — у команды хомо сапиенсов шансов бы вообще не было.
В случае доты это неверно. Quake в этом плане намного проще. Для доты вы хорошего бота без самообучения не напишете.
Просто, на момент начала игры, когда выбираются команды, бот должен исходя из состава соперников решить задачу оптимизации, выбрать свою команду, и модель поведения с соответствующими команде соперника весовыми коэффициентами. Дальше вопрос кодинга и получения доступа к API. (и да, решить задачу оптимизации — нетривиальная штука в данном случае, нужно будет потрудиться, чтобы задачу сформулировать и более-менее быстрый метод ее решения придумать...)
Вы менеджер с техническим бэкграундом? Общую схему вы описали конечно верно (она тривиальна), а вот решить те самые детали — без обучения — это вряд ли. На уровне стандартных ботов доты — да. Но не на уровне профи.
А про бота… Решать детали — это можно использовать мудреные нейронные сети, а можно вспомнить, что каждая характеристика каждого персонажа — это чиселка. И эту чиселку можно вбить в соответствующую клеточку матрицы. И потом, понадергав строчек из этой матрицы, порешать систему уравнений… И потом, решив задачу оптимизации, выбрать одну из достаточно типовых стратегий поведения для «своих» персонажей с весовыми коэффициентами.
А если что-то более глобальное, то тут и люди не час потратят на то, чтобы приспособиться.
Почему бы вам не сделать так для шахмат? Или Го?
Если я правильно помню, то примерно так и были устроены всю жизнь системы для игры в шахматы. В том числе, система, которая обыгрывает чемпионов мира. Про Го — не уверен.
когда могли бы просто решить «несколько уравнений»
У нас вроде есть доступ к API и нам не нужно заниматься распознаванием изображений? Если бы нужно было распознавать изображения, то да, сверху системы уравнений можно было бы прикрутить нейронную сетку для распознавалки. Опять же, простые «тупые» алгоритмы вполне справлялись с распознаванием характерных паттернов в 90-х на 386-х процессорах с 640К оперативной памяти и жестким диском на 20 мб… Но, соглашусь, на ML в наше время это делать проще.
И эту чиселку можно вбить в соответствующую клеточку матрицы. И потом, понадергав строчек из этой матрицы, порешать систему уравнений…
Вычислительная сложность той системы, что у вас получится, вас не смущает? ;)
Вычислительная сложность той системы
Как бы так сказать… Была у меня во студенчестве задачка. Как ни крути, требовалось для решения три «матрицы» 64x64x64 типа флоат… А памяти было в плохие дни 32 килобайта, а в хорошие — те самые знаменитые 640… Ну и пришлось извратиться чуть-чуть и обойтись двумя матрицами 64х64. И много других примеров было в моей жизни. Так что, нет, сложность меня не смущает.
Потому что вариантов как можно отыграть чемпионом, в какую сборку пойти, какие руны проставить — слишком много. Поэтому игроки выбирают контр-пик исходя из своих навыков.
Поэтому даже просто выбрать свою команду — это огромное количество обучения, которое критически зависит от навыков управления чемпионом.
Это обучение, обучение, обучение.
Кроме того, дота — игра с неполной информацией, и это кардинально усложняет задачу. Задача «что делать, когда я вижу врага» намного проще, чем задача «что делать, когда врагов не видно» — не только для машин, но и для людей.
Грубо: больше/меньше/сравнимый?
А каков тактический/стратегический простор доты в сравнении со старкрафтом?
Грубо: больше/меньше/сравнимый?
Тактический — в старкрафте сильно шире за счет большого количества юнитов (с-но тут боты могут очень силньо выигрывать, т.к. могут позволить себе многозадачность, в то время как никакой игрок не может успеть сделать все, что требуется, с-но распределение внимания с расстановкой приоритетов — один из важнейших скилов хорошего игрока в ск). Стратегический — в старкрафте немного уже.
правда до этого еще далеко )
А в чем причина упования на механическое управление? Если бот собирает стандартный кубик рубика за 0.35 секунд, то и на кнопки нажмет, и мышкой подвигает с нечеловеческой реакцией. Просто создание таких роботов — это другая ключевая компетенция команды исследователей, и смысла распыляться сразу на два фронта никакого нет.
Промахиваются, в первой игре Death Prophet не попала способностью. Сам момент тык
Кажется, она его не видела, когда волну кастовала.
Кажется, она его не видела, когда волну кастовала.
Некромант вышел из тумана когда ударил крипа, AI сразу же применил способность.
Так там способность на площадь а не targeted
Таргетно да, не промажет, даже среди кучи вражеских юнитов.
Активировать вещи можно с клавиатуры еще с первой доты. Я регулярно так делаю, если PRO игроки игнорируют такую возможность — значит скорость для них не главное. Или им есть куда развиваться :)
3-4 персонажа ИИ согласованно ломали вышкСкажите, а бот всё-же один, или их несколько? Я про то, что управляются они с одного компьютера, или нескольких?
В примере у живых(pro) игроков нужно добавлять важную составляющую как коммуникации — кто танкует, кто идёт. Чаще всего проблема в коммуникациях является причиной поражения(кто-то вышел в лес фармить, его поймали и пропушили базу 5 на 4; либо кто-то сказал «валим!», один понял «валим домой», другой понял «валим их»).
В жутком замесе(который может длиться всего 10 секунд) очень сложно разговаривать и координировать аттаку, и люди полагаются только на навыки, опыт и сыгранность команды.
Если боты управляются с одного компа, значит ему ничего не стоит контролить все 5 героев и согласовывать моментально действия.
Если боты управляются с разных машин, то стоит для (немного) бОльшей чистоты эксперимента(они же ввели 200мс на реакцию, значит хотят чистоту) делать также задержу на координацию хотя-бы в 1 секунду: кто перетанковывает, кого начали пушить, итд.
Как-раз из-за того, что в живых играх живые игроки видят игровую ситуацию немного в разные моменты времени, то и оценивают ситуацию они по-разному: одному игроку может показаться хорошей идеей идти в контр-аттаку, а другому нужно сходить на базу. Чтобы принять решение что делать — все должны мыслить одинаково (еще не изобрели нейро-хаб).
Опять-же боты получается должны быть примерно в аналогичных условиях: каждый бот играет только 1 персонажем, принимает решения только исходя из своей текущей ситуации (ты всё знаешь о своём герое), и немного о ситуации у твоих союзников, обмен командами тоже в ограниченном объёме и с существенной (для бота) задержкой.
промахивались бы боты способностями или нетТоже хорошее предложение. Как вы знаете, у человека имеется задержка на опознание цели. Мы видим не текущую картинку, а с запозданием в ~80мс. Это значит, что мы никогда не сможем попасть в движущуюся цель, если не начнём предсказывать следующий её шаг. Это значит, что человек при прицеливании(что в доте, что в action) планирует, где будет враг через ~200мс(пока рука кликнет, пока наведётся). Это очень хорошо видно в стрелялках — очень часто стреляя в выбегающего противника ты стреляешь правее/левее него, потому-что ты ожидал, что он остановится там. И это хорошо видно в самой доте — опытные игроки очень часто красиво уворачиваются от AOE-стана людей.
Так вот, ботам также стоит добавить задержку в прицеливании с прогнозом/предсказанием где будет герой противника через это время.
Если боты управляются с разных машин, то стоит для (немного) бОльшей чистоты эксперимента(они же ввели 200мс на реакцию, значит хотят чистоту) делать также задержу на координацию хотя-бы в 1 секунду: кто перетанковывает, кого начали пушить, итд.
Вообще вполне возможно что боты не осуществляют никакой коммуникации вовсе. В таком случае для чистоты эксперимента следует отключить внутриигровой чат и разнести людей-игроков по разным комнатам. И запретить им видеться до игры полгода.
Посмотреть на игру сыгранной команды ботов против сыгранной команды людей было бы действительно интересно, даже если люди — не супер-про.
William «Blitz» Lee is an ex-professional Dota 2 player
Austin «Capitalist» Walsh is an independent Dota 2 caster and content creator. He has also played Dota 2 at a semi-professional level
Ben «Merlini» Wu is a former professional DotA player
Ioannis «Fogged» Loucas is a Dota 2 player
Поэтому не стоит думать, что взяли абы кого. Этот матч изначально преподносился как команда ботов против команды бывших про-игроков.
пс: про букмекеров и деньги в dota-лигах всё не могу свою 3ю статью дописать :/
Вы можете удивиться, сколько на Хабре может оказаться уважаемых людей, которые успели в свое время потратить достаточно времени на МОБА игры. И даже поигрывать сейчас.
Основная суть в том, что боты смогли поймать человека толпой.
А для этого нужно было вовремя согласовать свои передвижения таким образом, чтобы уйти со своей линии, успеть догнать человека так, чтобы он не успел убежать, успеть его убить, успеть вернуться на линии за фармом.
Опытный игрок не должен быть идиотом — если с другой линии уходит противник, значит возможно он вышел к тебе на перехват, и надо отступить. И вот в этом часто и заключается основная сложность. Когда уже непосредственно началась драка 1 на 2 или 1 на 3, это уже самый финал комбинации.
это как сделать лапмочку нового типа, которая очень светит, то жрет 10кВат в час… прикольно, освещает, но нафиг не нужно, зато сделали… могёте!
Сам матч? Я думаю, вы это не серьезно. Ясно же, что основные расходы на эту исследовательскую работу — это зарплаты самих исследователей и железо для обучения.
Если считать прям совсем грубо (с ошибкой в несколько раз), то условно, зарплаты за год — $1млн (там человек 10, но как я понимаю, самые высокооплачиваемые над другими проектами тоже работают, не только над openai-five), ещё столько же — аренда железа (256 gpu, 128000 cpu cores).
Теперь можете говорить, если хотите, мол, как дорого, лучше бы пенсионерам раздали.
1) > однако, не слишком радикально влияли на игровой процесс
Именно, что влияли радикально. Например, именно 5 бессмертных курьеров позволили ботам делать то, что они делали: танковать вышки и не возвращаться на базу для отхила.
2) > пул из 18 героев
Это не просто 18 героев, а 18 героев с простейшими механиками. Там не было ни одного героя, которых люди обычно называют «мерзкими». Тот же Тинкер в одиночку мог бы в одиночку защитить базу от пуша ботов, и вся их тактика была бы поломана.
3) > реакция ботов была ограничена 200 мс
Не похоже, судя по инста-хексам лиона. Я не разбирал тот момент, но такое возможно в двух случаях: ошибка человека и каст хекса заранее (что, по сути, тоже ошибка). Поясню: ульт шейкера имеет нулевое время каста, то есть должен срабатывать моментально после блинка (при активации через shift). Если человек не использовал shift — это его ошибка (в первую очередь из-за отсутствия опыта игры против ботов). Если человек позволил заранее сделать на себя каст хекса — это тоже его ошибка (для этого есть смок). В итоге либо ошибка человека, которую не допустит опытный игрок, либо невероятное время реакции, что не является честным на мой взгляд.
По итогу: боты сильно прожимают кнопки и двигаются по карте, но делают множество бесполезных вещей (вроде прожимания смоков под вражеским тавером). И если последнее рано или поздно поправят, то как править общую «безыдейность» игры — мне не понятно. Как только боты оказываются в незнакомой или сложной ситуации, они перестают действовать адекватно. В последней игре (когда зрители напикали им ерунды) боты пытались сплитпушить, и даже местами удачно, но это всё, на что их хватило.
После игры были вопросы разработчикам, и на вопрос о коммуникации ботов был получен примерно следующий ответ (если я правильно перевёл): им не нужно коммуницировать, потому что они все одинаковые. Имхо странная точка зрения.
Мне, честно говоря, не совсем понятно зачем вообще этим занялись люди. Точнее говоря, зачем именно так занялись. Видел слайды архитектуры ботов — там сплошные нейронные сети. В связи с этим, я не вижу смысла в этой разработке. Предположим через 2 года боты будут выигрывать любую команду людей. И что? Какой от этого толк? Люди перейдут в другую игру с похожей механикой, и переход займёт пару дней, а для перенастройки ботов придётся проделать заново половину работы. И это хорошо, если у вас будет огромная выборка игр, как в случае с дотой. А что если такой выборки не будет? Я бы понял, если бы за ботами стояла какая-то новая архитектура, но от приклеивания очередной порции НС я не вижу никакого толка.
Не похоже, судя по инста-хексам лиона.Уже разобрали:
I downloaded the clip which runs at 60fps showing the hex. I counted the frames from when he blinks in until he gets hexed and it was 13 frames. At 60fps each frame is around 16.66ms of time.Плюс комментарий от шейкера:
So with 13 * 16.66 it shows that the reaction was around 216.58ms well within the response time the OpenAI team said that the bots have.
THIS. I did not shift queue, I thought I clipped lion in the fissure and didn't instant echo either. I havent rewatched the clip but I'm sure you see me hesitate and it gave the bot more than enough time. Hard to change muscle memory to change vs bots because vs humans it's still unlikely they get the hex off before and blink shift queuing echo can be risk in other situations. I saw an ideal 2 hero block but just made an error.www.reddit.com/r/DotA2/comments/94vdpm/openai_hex_was_within_the_200ms_response_time/e3ofipk
Добавлю. По-моему стоило все таки выбрать для этой игры, если не про игроков, то хотя бы просто хороших.
Да дело не в том, что игроки плохие, дело в том, что играли на расслабоне (как-то иначе запрыгивания по одному в четверых объяснить нельзя) и (что более важно) стак не сыгран.
Fogged — He's ranked 180 in the Americas leader boards.
Blitz — I couldn't find Blitz in the leaderboards but according to his dotabuff he's 576
Merlini — Immortal, Ranked 674
Capitalist — Immortal, Ranked 961
Про то, кто такой MoonMeander думаю вы догадаетесь погуглить, прежде чем что-то писать.
Не знаю на счёт рангов, но иногда складывалось ощущение, что играют выходцы с 3к паба.
Да, сейчас он вряд ли играет на уровне условных Noone или Miracle, но я почему-то уверен, что он играет лучше лично вас, какой бы у вас рейтинг там ни был.
То, что он когда хорошо играл, не значит что он сейчас играет хорошо, и уж точно не значит, что он хорошо отыграл в каком-то конкретном моменте. Кроме того, есть ещё 4 игрока. Лучшие команды эпизодически играют как рандомный стак на 3к и сами же это признают.
То, что он когда хорошо играл, не значит что он сейчас играет хорошо
То, что он Rank 674, не значит, что он хороший игрок.
То, что он один из топовых игроков в прошлом, не значит, что он хороший игрок.
То, что его отобрали для этого матча, не значит, что он хороший игрок.
Попахивает диванной аналитикой, не находите?
Попахивает диванной аналитикой, не находите?Ну можно немного поанализировать на самом деле.
То, что его отобрали для этого матча, не значит, что он хороший игрок.Мы не знаем по каким критериям они отбирали игроков, потому то что его отобрали — не значит хороший он или плохой.
То, что он один из топовых игроков в прошлом, не значит, что он хороший игрок.Судя по ликвипедии — достижений особых у него нет, потому судить насколько он топовый — тоже довольно сложно.
То, что он Rank 674, не значит, что он хороший игрок.Не стоит забывать, что американский регион — слабейший в доте, и в сравнении с другими регионами его 674 ранг очень сильно обесценивается.
В целом можно и дальше продолжать, но не особо интересно. Этот Мерлини довольно сильно переоценен.
им не нужно коммуницировать, потому что они все одинаковые. Имхо странная точка зрения.
Это не странно, а полностью логично. Любой бот и так может узнать, что хочет и собирается сделать другой бот, просто "представив" себя на его месте. И если человек может предположить с ошибкой, то идентичный бот, имя ту же самую информацию, предположит точно то же самое, что и второй бот.
А почему у ботов должна быть одна и та же информация? Они же управляют разными персонажами.
Т. е. каждый бот считает поведение сразу всех остальных ботов? Потому что чтобы знать какое решение принимает другой бот, нужно посчитать то же, что посчитал он. Зачем тогда ботов 5?
Бот управляет одним персонажем. Другим он отдавать команды не сможет. То есть к игре нужно 5 подключений. Почему они сделали 5 копий для пяти подключений вместо одного бота с пятью подключениями? Полагаю, так тупо проще оказалось. Обучать именно одного бота, который управляет одним персонажем (хоть и решает за пятерых), а не такого, который держит сразу пять подключений.
Тогда это нифига не логично и не эффективно. Бот должен быть либо один на 5 персонажей, либо коммуницировать с другими ботами.
Так а зачем? Коммуникация — это точно сложная задача, я в ML не очень хорошо разбираюсь (на уровне хобби), но мне кажется нет никакого смысла к такой сложной задаче ещё и коммуникацию прикручивать.
Вычислительные ресурсы нужны крайне маленькие. Большие они на этапе обучения, а на этапе игры там вычисления просты.
Информация — это то, что бот видит и про что знает. Видимость в доте — общая. Т.е. все видят одно и то же (у человека кроме карты есть ещё основное окно, но для ботов это не актуально).
— Не нравится сетап
— Люди совершают одни и те же ошибки снова и снова
— Много перегибов с агрессией
Мне бы интересней было на hots глянуть, ибо его евенты являются тактической вилкой.
Хотя если, например, тейсер или гендзи каждый раз будет получать прицельный стан то тут конечно будет тяжело
Всю игру OpenAI Five можно охарактеризовать таким популярным среди сообщества термином, как «душили».
Правильно, скорее: "ребятишки, да че ж вы себя не бережете-то?!". С-но team human играли настолько плохо, что матч получился совершенно не показательным, если бы вместо OpenAI были бы обычные боты из доты — результаты был бы ровно тем же. Что печально — если в случае с матчем с денди ИИ действительно смог что-то продемонстрировать, то в данном случае никакой демонстрации не вышло — нельзя продемонстрировать уровень, когда противник даже не пытается сделать вид, что играет на победу.
1. Команда человеков была сыграна? Или это была просто некая группа людей?
2. Один OpenAI управлял всеми 5 AI персонажами? Или за каждого свой AI?
3. Что покажет следующая игра, после того как человеки проанализируют «собственное понимание механики» ботами?
3. Игроки против ИИ в этот раз не были профессионалами, вряд ли они смогли придумать хорошую стратегию.
Или каждый кон AI будет придумывать неожиданное и непринятое?
Или таких стратегий все же ограниченное количество?
Или даже зная стратегию с которой AI будет действовать не получится его одолеть?
- Как я понял суть в том что AI действовал не так как обычно принято.
Да нет, ничего такого. Вполне обычная игра (если не считать каких-то объективно плохих решений, вроде отдаться под товером, но зато его добить).
Вот и вопрос — зная теперь такую стратегию поможет это игрокам человекам?
То, что показывал ИИ — стандартная безыдейная игра 5 тел вне какой-либо стратегии кроме "бежим вперед и убиваем/умираем", при этом уже даже по статистике видно, что боты имея преимущество в десяток фрагов не имели преимущества по золоту (а то и проваливались), это признак очень плохого понимания макроигры. Любая команда даже самых средних игроков такое снесет вообще без проблем, играя в стандартного фармящего кери. Команда затерпит, а потом на 20+ минуте выйдет какая-нибудь фармящая магина и в соляного разломает ботам лица без каких-либо шансов.
К 9 минуте к людям уже на базу заходили ломать тавера, о каких 20 минутах речь.
Можно и раньше к людям заходить на базу и ломать товера, только на практике это, представьте себе, очень редко работает. Практически никогда, если люди перед этим не отдадутся перед эти в 2+1 у хг.
Если вы сами вместо дефа выходите и отдаетесь — ну при чем тут боты? Ну да, они молодцы, конечно, что пошли в этот момент пушить, а не устроили пикничок. Но на этом заслуга и заканчивается.
А как вы предлагаете терпеть, когда уже на 1 минуте боты заходят под Т1 и по очереди танкуют урон от вышки?
Зачем терпеть? Можно просто убивать. ТП на деф и -5 "танковальщиков".
Если пик неудачный — ну и фиг с ней этой т1, мы то про т3 говорим.
Поверьте, если бы было выгодно заходить и танковать т1 на 1 минуте так, то это бы игроки давно делали и давно бы это пофиксили :)
"Так как Dota 2 — дисциплина крайне разносторонняя и сложная для освоения"
Для кого сложная? Для детей с задержкой в развитии?
А может люди проиграли лишь потому, что оказались не такими умными, как себя считали, играя в этот "киберспорт".
"Так как Dota 2 — дисциплина крайне разносторонняя и сложная для освоения"
Для кого сложная? Для детей с задержкой в развитии?
Да для всех сложная, неподготовленному человеку потребуется несколько недель, чтобы начать понимать, что вообще происходит на карте (не говоря уже о том, чтобы начать играть).
Соответственно, на то, чтоб начать понимать, что вообще происходит, лимит секунд 30.
Минимум для понимания происходящего на конкретной карте — узнать и запомнить 10 героев, их скилы, анимации героев и скилов, несколько десятков используемых предметов и базовую механику игры, которую меньше чем на нескольких листах а4 не изложишь.
Так что, в вашей реальности никто в доту не играет.
Бред. Скилы надо знать, чтоб понимать, как с ними бороться.
Скилы надо знать, что понимать, что происходит на карте. Потому что иначе вы видите как летит какая-то цветастая переливающаяся хрень… и? Зачем она нужна? Хилит она? Дамажит? Откуда взялась?
О сложности же игры говорит совсем другое. Сколько памяти нужно для того, чтоб запомнить всё дерево игры и какая его часть нужна, чтоб гарантировать ничью даже против идеально играющего противника.
Вы путаете сложность игры и сложность победы над противником.
, а два идеальных игрока могут сыграть только вничью.
Исключительно при идеальном балансе.
Ни одна MOBA не является идеально сбалансированной, хотя и стремятся к этому и регулярно выпускают патчи, в которых усиливают или ослабляют чемпионов. А потом выпускают новых чемпионов, слегка меняют баланс и все по новой.
Человек не успевает перепроверить баланс всех комбинаций и все варианты. А вот бот, который может виртуально отыграть тысячи матчей за день без устали и перерыва, вполне может это сделать. Поэтому при игре 1 на 1, я уверен, из двух идеальных ботов победит тот, который делает первый пик.
В командном сражении это не прокатит, но в сражении 1 на 1 думаю всегда найдется лидер.
Ну или, если такого лидера нет вообще — да, всегда будет побеждать бот, у которого второй пик.
Чистый субъективизм. Это вообще не про доту. Ее надо изучать долго и упорно, сотня героев с минимум 4 скилами, сотня предметов, нейтралы, механики из wc3. А ещё комьюнити в России недружелюбное — новичок в игре моментально покрывается матом. А ещё игра совсем не приносит кайф, когда после часа "потной" (устоявшееся выражение) игры сливается победа за один замес. И вопреки всему этому игра все равно популярна (и не у бессмертных тоже).
Выбрана самая оптимальная стратегия для победы. Всем звеном до победного.
Ранг — это одно дело, а как люди отыграли конкретную игру — другое. Отыграли они далеко не на immortal, какой бы ранг у них ни был.
Вам кажется, что боты крайне слабы, поэтому и проигравшие им очень слабы. Хоть на самом деле ситуация радикально отличается.
Сила и слабость познаётся в сравнении.
Это с чего вы взяли? Есть вполне объективные вещи, которые сравнений не требуют.
Вам кажется, что боты крайне слабы, поэтому и проигравшие им очень слабы.
Нет, я вижу вполне конкретную и объективную дичь, которую делали игроки, и которую люди даже с 2-3к ммр себе при серьезной игре не позволяют. Вне зависимости от того, с какого уровня противником идет игра. Просто выбор, типа: "делать дичь запрыгивая 1в4 или не делать".
Хинт: если вы все-таки решили "делать", то получите 4 репорта, успехов.
Подойдите с такими же оценками для любой игры Инта и тоже найдёте много дичи.
На порядок меньше, поверьте.
Пять ботов, не взаимодействующих напрямую. Есть только параметр, исходя из которого бот начинает "ценить" положение команды в игре, а не только своё личное. Цитата из блога:
OpenAI Five does not contain an explicit communication channel between the heroes' neural networks. Teamwork is controlled by a hyperparameter we dubbed "team spirit". Team spirit ranges from 0 to 1, putting a weight on how much each of OpenAI Five's heroes should care about its individual reward function versus the average of the team's reward functions. We anneal its value from 0 to 1 over training.
Каким образом Боты управлялись? Ведь у доты нет открытого API.
Есть ли исходные коды этих ботов в открытом доступе?
Если хочется поднять у себя на компе этих ботов и с их кодом и алгоритмом обучения поиграться, то это можно как-то сделать?
Про «честные» победы по правилам, знакомым боту, тут тоже упомянули, но на это способны единицы.
Игроки не понимали escape threshold (момента, когда надо убегать чтобы не добили) и использовали подобный для людей
Мне казалось, что как раз контроль количества хп и знание, какие атаки сколько отнииают как раз и отлисают хороших игроков от не очень хороших.
А кто в курсе, играло действительно пять ботов (инстансов), или один бот, управлявший пятью персами? Синергия для одного инстансов естественна и не удивительна, другое дело если пять инстансов действительно скооперировались. Мне думается, таки был один инстанс...
Подробный разбор матча по Dota 2 между OpenAI и людьми в формате 5x5. Люди проиграли