С Христом не получилось бы, ибо «Jesus Christ» является очень распространённым выражением, своего рода аналогом «Чёрт побери». С яичницей похожая история — есть поговорка «You can't make an omelette without breaking eggs». Хотя может и про Гитлера есть поговорка.
UPD: с другой стороны, что Иисус, что яичница просто имели бы другую вероятность упоминания, но график вероятности хотя бы одного упоминания в серии из n испытаний должен был бы выглядеть похоже.
Все операции с нейросетью сводятся к простым операциям линейной алгебры, поэтому сами по себе не очень трудоёмки. Однако, при обучении нужно перелопатить огромное множество данных, причём не один раз, поэтому процесс обучения хочется ускорить настолько, насколько это вообще возможно. Соответственно, для того, чтобы сказать «потянет» или «не потянет», нужно определиться с деталями: насколько большой вход у нейросети, насколько большая (в ширину и глубину) эта сеть, сколько раз в секунду её нужно вызывать.
Вообще же, мне кажется, в игровом ИИ нейросети используются редко, ведь есть более простые и прозрачные методы.
Что касается реализации на GPU, то, как правило, никто не пишет GPU-ориентированный сишный код, люди описывают нейросеть на каком-нибудь высокоуровневом языке (python или lua, например) с использованием специального символьного пакета, а потом из этого высокоуровневого описания генерируется сишный код (рассчитанный, как правило, на CUDA – технологию программирования под GPU от nVidia). Он же потом компилируется нужным компилятором, запускается, а результаты можно обрабатывать в том же высокоуровневом языке.
Это "обычные" (в архитектурном плане относительно современной науки) нейросети, просто они предсказывают, насколько хороша текущая позиция и что делать дальше [цитата]:
One neural network, the “policy network”, predicts the next move, and is used to narrow the search to consider only the moves most likely to lead to a win. The other neural network, the “value network”, is then used to reduce the depth of the search tree — estimating the winner in each position in place of searching all the way to the end of the game.
Как это у комментаторов нет ограничений по времени? Я бы, например, не стал ждать комментариев по текущей доске сутки.
"Играть лучше" не значит "находить лучший ход", да, но значит "не допускать ошибок". Не знаю ничего про Го, сужу по шахматам: один глупый ход способен кардинально изменить положение на доске, приведя к изменению баланса сил.
Я бы из того, что комментатор (путь и профессионал) в прямом эфире заметил "ошибку" не делал поспешных выводов о том, что это действительно была ошибка.
Это будет означать, что машины победили, но в любом случае будут проведены все 5 партий, так что у человека даже в этом случае будет шанс показать себя.
Я не знаю правил Го, но, думаю, можно как-нибудь использовать игры на текущей сетке для «разогрева» системы. А добить уже можно будет за счёт игры с собою.
Эта система не занимается полным перебором, поэтому эффект от увеличения доски будет не столь значимым. Думаю, что даже если увеличить доску до 101x101, то за год система гугла прокачается до гораздо больше уровня, чем любой человек (или группа людей).
Хотя отсутствие истории партий на такой доске процесс обучения для системы, конечно же, усложнит.
Да, свёртка двух функций с конечным носителем даст результатом функцию с конечным же (но уже чуть большим) носителем.
support — это и есть «носитель» по-русски (отсюда и обозначение в Вики). Компактность означает замкнутость и ограниченность (т.е. конечность, если мы говорим о числовой прямой).
Не совсем понимаю, о каких «хвостиках» идёт речь. Если Вы имеете в виду, что конечная сумма случайных величин с конечным носителем плохо приближает нормально распределённую случайную величину, то это не то, чтобы было сильно важно: у нормального распределения очень мало массы в хвостах (например, вероятность того, что стандартная нормальная случайная величина отклонится от ожидания всего на 7 (а носитель-то бесконечен, она может с некоторой вероятностью и на 10100 отклониться) уже составляет ничтожно малое значение 10-12), поэтому для некоторых практических применений можно счесть, что плотность обнуляется после уклонения на некоторое a от мат. ожидания.
Носитель — это множество положительной плотности.
«В точности» означает именно то, что означает: никакие приближения не рассматриваются.
Я, собственно, идею суммы 12 равномерных величин не поддерживаю, поэтому со мной нечего обсуждать, а другие участники «тредика» не в курсе происходящего.
Плотность распределения суммы из 12 равномерное распределенных нез. величин относится к классу нормального распределения? Не верю.
Это вообще к чему? Как бы слова «Ирвин-Холл» и «Нормальное» существенно различаются, я уже не говорю о формулах распределения. Ежу понятно, что сумма 12 стандартных равномерных случайных величин имеет конечный носитель и (в точности) нормальным быть не может.
Что такое ЦПД? Деорема?
Вообще, я не понял сути Вашего комментария. Я лично просто сказал, какое распределение будет у суммы n независимых равномерных случайных величин, а Вы мне тут (спустя полтора года после моего сообщения и 2 года с создания треда) каких-то простейших и нерелевантных фактов о нормальном распределении набросали. Это вообще что было и к чему?
Для получения PhD не мозги нужны (см. 3 qualities of successful Ph.D. students), а желание и упорство. Не знаком лично с Цукербергом, но, думается мне, в соответствии с его системой жизненных ценностей (особенно теперь, с рождением первого ребёнка) цель вроде «Заняться исследованиями на переднем крае науки путём получения подготовки исследователя, эквивалентной приличной PhD программе» имела бы крайне низкую ценность: цена достижения цели высока (мы говорим о нескольких годах огромных временных вложений, на семью и бизнес просто не останется времени), а польза неочевидна (карьера самого Марка уже состоялась, а Человечеству он может помочь спонсированием других исследователей).
Примерно такой смысл и был заложен в исходном уничижительном комментарии: Цукерберг находится в таком положении, когда ему просто невыгодно заниматься исследованиями наравне с настоящими исследователями самостоятельно. Про мозги и интеллектуальные способности я нигде не говорил.
Это как если бы человек худощавого телосложения захотел стать чемпионом мира по пауэрлифтингу: у него, быть может, и есть всё, что для этого нужно (руки, ноги), но без подготовки нет никаких шансов, более того (в плане достижения поставленной цели) он заранее находится в более худшем положении, чем его чуть более упитанные сверстники. А если ещё и цель эта не очень оправдана, то и тем более мне видится совсем нерациональным её достижение.
Бесполезность следует из неоптимальности и излишней трудоёмкости действий. Я не верю, что можно быстрее чем за пять лет добраться до переднего края исследований в машинном обучении без бонусов хорошей PhD программы (научник, коллеги-аспиранты, обучение студентов, написание статей и соавторство), которой предшествовали не менее хорошие ступени бакалавра и магистра (в течение которых человек получает фундаментальные знания вроде всякой математики и алгоритмов, а так же впервые окунается в мир исследований).
Ничего личного, но под PhD я понимаю приличную программу на западе (причём не любую, а именно приличную), а наши «кандидатские» в большинстве своём (опять же, не все, но уже большинство) ничего интересного с точки зрения мировой науки не представляют.
P.S. Ну и я тут говорю о PhD как о процессе, специально выстроенном для подготовки учёного, способного самостоятельно проводить исследования, а не как о результате в виде «корочки».
Да, в процессе получения PhD в этот самый мозг загружаются текущие наработки в области и ориентиры вроде «что работает, а что – нет».
В целом, конечно же, ничто не мешает Вам (ну или какому-нибудь программисту без специального образования) сейчас взять листочек бумаги и ручку и начать исследовательскую деятельность по объединению теории гравитации и квантовой механики, например, но абсолютная бесполезность этого действа (по крайней мере в краткосрочной перспективе) очевидна.
А основная цель — разработка технологий распознавания речи и адекватной их интерпретации и т.п.
Основная цель кого? Цукерберг сам-то даже бакалавра не получил, не говоря уже о PhD, необходимом для исследовательской деятельности в подобных областях. Подозреваю, он либо будет пользоваться готовыми движками распознавания речи / жестов (которые уже достигли зрелости, вообще говоря), к которым потом припишет бизнес-логики, либо будет дёргать ребят из Facebook AI Research. Так что разработкой технологий, я бы сказал, тут не пахнет, просто Цукербергу хочется жить в умном доме.
UPD: с другой стороны, что Иисус, что яичница просто имели бы другую вероятность упоминания, но график вероятности хотя бы одного упоминания в серии из n испытаний должен был бы выглядеть похоже.
СМИ говорят, это сделал он сам
Сильно отца удивила награда
Сделают мальчику младшего брата
Вообще же, мне кажется, в игровом ИИ нейросети используются редко, ведь есть более простые и прозрачные методы.
Что касается реализации на GPU, то, как правило, никто не пишет GPU-ориентированный сишный код, люди описывают нейросеть на каком-нибудь высокоуровневом языке (python или lua, например) с использованием специального символьного пакета, а потом из этого высокоуровневого описания генерируется сишный код (рассчитанный, как правило, на CUDA – технологию программирования под GPU от nVidia). Он же потом компилируется нужным компилятором, запускается, а результаты можно обрабатывать в том же высокоуровневом языке.
"Играть лучше" не значит "находить лучший ход", да, но значит "не допускать ошибок". Не знаю ничего про Го, сужу по шахматам: один глупый ход способен кардинально изменить положение на доске, приведя к изменению баланса сил.
Я бы из того, что комментатор (путь и профессионал) в прямом эфире заметил "ошибку" не делал поспешных выводов о том, что это действительно была ошибка.
Хотя отсутствие истории партий на такой доске процесс обучения для системы, конечно же, усложнит.
support — это и есть «носитель» по-русски (отсюда и обозначение в Вики). Компактность означает замкнутость и ограниченность (т.е. конечность, если мы говорим о числовой прямой).
Не совсем понимаю, о каких «хвостиках» идёт речь. Если Вы имеете в виду, что конечная сумма случайных величин с конечным носителем плохо приближает нормально распределённую случайную величину, то это не то, чтобы было сильно важно: у нормального распределения очень мало массы в хвостах (например, вероятность того, что стандартная нормальная случайная величина отклонится от ожидания всего на 7 (а носитель-то бесконечен, она может с некоторой вероятностью и на 10100 отклониться) уже составляет ничтожно малое значение 10-12), поэтому для некоторых практических применений можно счесть, что плотность обнуляется после уклонения на некоторое a от мат. ожидания.
«В точности» означает именно то, что означает: никакие приближения не рассматриваются.
Я, собственно, идею суммы 12 равномерных величин не поддерживаю, поэтому со мной нечего обсуждать, а другие участники «тредика» не в курсе происходящего.
Что такое ЦПД? Деорема?
Вообще, я не понял сути Вашего комментария. Я лично просто сказал, какое распределение будет у суммы n независимых равномерных случайных величин, а Вы мне тут (спустя полтора года после моего сообщения и 2 года с создания треда) каких-то простейших и нерелевантных фактов о нормальном распределении набросали. Это вообще что было и к чему?
Примерно такой смысл и был заложен в исходном уничижительном комментарии: Цукерберг находится в таком положении, когда ему просто невыгодно заниматься исследованиями наравне с настоящими исследователями самостоятельно. Про мозги и интеллектуальные способности я нигде не говорил.
Это как если бы человек худощавого телосложения захотел стать чемпионом мира по пауэрлифтингу: у него, быть может, и есть всё, что для этого нужно (руки, ноги), но без подготовки нет никаких шансов, более того (в плане достижения поставленной цели) он заранее находится в более худшем положении, чем его чуть более упитанные сверстники. А если ещё и цель эта не очень оправдана, то и тем более мне видится совсем нерациональным её достижение.
Ничего личного, но под PhD я понимаю приличную программу на западе (причём не любую, а именно приличную), а наши «кандидатские» в большинстве своём (опять же, не все, но уже большинство) ничего интересного с точки зрения мировой науки не представляют.
P.S. Ну и я тут говорю о PhD как о процессе, специально выстроенном для подготовки учёного, способного самостоятельно проводить исследования, а не как о результате в виде «корочки».
В целом, конечно же, ничто не мешает Вам (ну или какому-нибудь программисту без специального образования) сейчас взять листочек бумаги и ручку и начать исследовательскую деятельность по объединению теории гравитации и квантовой механики, например, но абсолютная бесполезность этого действа (по крайней мере в краткосрочной перспективе) очевидна.