Pull to refresh
57
0
Павел Смольников @pavel_smolnikov

Инженер-предприниматель

Send message

Прочтите, пожалуйста, раздел «Исключения». Это мой личный, не коммерческий, авторский канал. Он не является компанией, коммерческим продуктом, услугой или проектом

У них есть старое поколение технологии — HTM / NuPIC, которая очень хорошо показывала себя в прогнозировании событий и выявлении аномалий. Несколько стартапов было запущено на этой основе. Про нее можно почитать как раз в книге «Об интеллекте». Был также совместный проект с Intel, в рамках которого они добились существенного ускорения LLM на CPU. Сам Thousand Brains — новый проект, первая версия только выложена в GitHub. Поэтому они только собирают комьюнити. Но в ряде публикаций (в том числе в научных журналах), в своих экспериментах они уже добились очень хорошего изучения и распознавания объектов даже одной кортикальной колонкой.

Ответил чуть выше по этому поводу:
Я списался с автором английской статьи. Действительно, в оригинальной публикации была ошибка на этот счет. В последующих публикациях он исключил данную строчку. С разрешения автора, я удалил ее в переводе.
Я списался с автором английской статьи. Действительно, в оригинальной публикации была ошибка на этот счет. В последующих публикациях он исключил данную строчку. С разрешения автора, я удалил ее в переводе.
Спасибо за замечание. Поправил на:
Молодой человек невысокого роста и пытливого математического ума, Китов прошел в рядах Красной армии целый карьерный путь за время Великой Отечественной войны.
Китов действительно оказался в рядах Красной армии не в начале войны, а в 39-м году. Но вот только он был не принят (как вы предложили) и не произведен (как было в первоначальной версии перевода), а призван.
Сейчас в процессе перевода как раз их большая работа про кортикальные колонки. А данная статья в New York Times — это просто небольшой очерк о компании в целом, на который они сами приводят ссылку на главной странице своего сайта.
Есть еще потрясающая статья «Could a neuroscientist understand a microprocessor?», где авторы на двадцати с лишним страницах проводят целый реверс-инжиниринг, с графиками, схемами и т.д. — так как если бы они изучали процессор, подобно мозгу.
Если вы говорите про узоры клеточных автоматов, которые в начале статьи приведены, то про них Вольфрам написал целую монографию «A new kind of science», о процессе создания которой он и рассказывает выше. Помимо бумажной версии, есть общедоступная электронная версия.
Кстати, да. Вы подняли очень интересный вопрос. Ведь Blizzard действительно годами (если не сказать десятилетиями уже) оттачивал баланс как отдельных юнитов, так рас в целом, оптимизируя его именно под человеческий стиль игры и его возможности. Хороший тому пример — блинк сталкеров. Или еще один — развод пехоты (при ударе бейлингов, допустим). Руками ты все равно упираешься в какой-то предел. А вот ИИ может доводить такие техники до совершенства.

Баланс всей игры под ИИ, конечно, переделывать не будут. Но как я писал выше уже, игра против людей и не так интересна, т.к. априори рано или поздно алгоритмы будут на порядок сильнее. StarCraft — это хоть и не детерминированное поле 8 на 8, но все равно вполне ограниченная цифровая среда. Поэтому по-настоящему интересны именно бои самых передовых ИИ-архитектур. И тут уж можно и на APM никакого ограничения не накладывать и камеру вообще убрать.
В обзоре на канале Alex007SC2 есть хороший момент, когда APM AlphaStar во время битвы достигает и полутора тысяч действий:
image
Очень вряд ли, на мой взгляд. Искать причину в том, что «как обычно проплатили» нет смысла. В первую очередь нужно учесть, что для них это был реально новый опыт. И они реально еще не понимали, чего ждать и как вообще в таком режиме может складываться игра. То есть это, в некотором смысле, и психологическое давление. MaNa так и сказал в интервью, что многих вещей не ожидал увидеть. И что осознал, насколько его стиль игры опирался именно на игру против живого соперника, используя именно человеческие слабости.

Плюс нужно учесть, что в западном сообществе репутация — это всё. И если коллеги заметят какое-то неадекватное поведение нетипичное, то это может очень сильно подмочить репутацию и даже разрушить карьеру в киберспорте.
То что ИИ будет обыгрывать даже самых продвинутых корейцев, по моему мнению, лишь вопрос времени. На мой взгляд, самое интересное поле битвы, которое нас ждет — это турниры ИИ против ИИ. Они во многих видах существуют и сейчас (в том числе упомянуты в статье), но это пока была только разминка. Во-первых, боты до этого имели довольно простую архитектуру. Во-вторых, уровень самих соревнований ограничивался в основном небольшими мероприятиями при университетах, организованными узким комьюнити.

А теперь представьте, когда другая сильная команда выдвинет своего бота против AlphaStar. Вот тут и начнется настоящая битва умов с большой репутацией на кону. Ведь как это так, если вдруг какая-то малоизвестная команда вдруг обойдет DeepMind? Это что значит, что их базовые алгоритмы и архитектуры оказались эффективнее? Они там в небольшой команде нащупали что-то более крутое, чем несколько десятков PhD?

А вот то что стратегия игры AlphaStar действительно довольно примитивной остается — тут полностью согласен. Учитывая, что он проходил обучение на большом массиве реплеев — это наводит на два предположения. Либо такие микро-стратегии действительно оказываются более эффективными при их точном выполнении. Либо просто сам фундамент «глубокого обучения» не позволяет разворачивать во времени более сложные зависимости.
Да, они сами это тоже отметили в статье:
В наших играх против TLO и MaNa, AlphaStar держал APM в среднем на уровне 280, что намного меньше чем у профессиональных игроков, хотя его действия при этом могут быть более точными.

Но алгоритм расчета APM учитывает не все нажатия, а только «эффективные». То есть просто повторные клики в одной точке в APM не входят. Кроме того, алгоритм расчета APM немного меняется от патча к патчу, как раз учитывая, что именно считать действиями.
Для Minecraft есть еще LearnToMod (с возможностью программирования на JS и Scratch-подобном языке) и Minecraft Pi — Minecraft для Raspberry c возможностью управления миром через Python-команды.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity