может существовать система со сверчеловеческим разумом не обладающая самосознанием
Ну смотрите, задайте GPT начальный текст "Ты робот, обладающий самосознанием". И он будет им обладать. Чем не вариант? На вопросы типа ты осознаешь себя, он будет отвечать что осознает. Ну и так далее.
Как кто-то метко обозначил в одной из предыдущих дискуссий по искусственному интеллекту — нельзя определять разум инструментами самого разума. Это замкнутый круг, так ничего не добиться.
А будущий хакер будет работать с такой системой методами социальной инженерии и убеждать AI в необходимости нужного ему поведения
Да, у меня тоже порой возникают такие мысли. Мы все ждём, что сильный ИИ будет повторять путь человечества. То есть постепенно учиться, улучшаться, и в итоге достигнет уровня интеллекта не хуже человека. Что он однажды родится как уникальная личность, грубо говоря. При этом есть сложность, как запрограммировать его быть разумным. Так как совершенно непонятно как придать ему нужные свойства, мы и про себя-то не знаем, как такими стали. И еще есть опасность, что он может наворотить дел пока на ранних этапах будет глуповатым и несовершенным.
Но GPT-3 намекает, что все может случиться совсем не так. Что ИИ сразу получится сверхчеловеческим. Представим, что GPT-3 увеличат в 1000 раз. Он будет сразу в своей памяти держать все эти 300 Гб текста, или сколько там. Со всеми фактами и знаниями со всего интернета. И на его входе будет дополнительно картинка с камеры. И его быстродействие и способности действительно смогут управлять механикой, посылая текстовые команды на шаговые двигатели.
И все программирование такого ИИ будет заключаться в том, какой начальный текст подать ему на вход. "Ты добрый ИИ, помогающий человечеству". И он начнет действовать согласно этой установке. "Ты злой ИИ, собирающийся уничтожить человечество". И он начнет это делать.
Это вообще не ИИ в нашем понимании. Сформированном книгами, фильмами и ожиданием. Эту тупо система, база данных, я даже не знаю как это назвать. У нее нет ни своих целей, ни сознания, ни мотивации. У нее вообще нет никаких человеческих ограничений и предыстории. Это просто сложная запутанная база данных, к которой можно делать запросы. Но при этом она, как мы уже видим по слабым намекам в серии GPT, будет полностью обладать полными свойствами интеллекта. То есть вставив его в силиконовую куклу и дав начальную установку "Ты притворяешься человеком, чтобы никто не мог тебя отличить от живого человека, обладающего сознанием". (ремарки про сознание я специально вставляю, так как многие оперируют именно этими категориями, так-то понятно, что никакого сознания не существует и никогда не существовало, появившееся когда-то в философии понятие сознания — это просто аналог понятия религии, заполнявшей пробелы в понимании мира при недостатке настоящих знаний)
И он так и сделает. И никто не отличит.
Пугающая перспектива (в плане злоупотреблений). Но в то же время сколько возможностей! Это имхо даже лучше, чем какой-то робот, который будет мучительно проходить все этапы эволюции при развитии своего мозга до человеческого. Эксперименты выше с хорошим/злым ботом показывают, что такой путь вполне реален. А намеки на это, и в целом понимание что к этому идёт, были ещё начиная с первой GPT.
Не зря от этой нейросети англоязычные люди в восторге ). Еще пару лет назад такое качество казалось недостижимым.
А что касается трудностей с логикой, то мне кажется проблема в том, что серия GPT не привязана к трехмерному миру. Если ее обучать на основе видео с текстовыми описанием происходящего, то со здравым смыслом было бы намного лучше. Как в примере с широким столом, который не проходит в дверь. Сложно представить, что в тексте это встречалось часто (это, как минимум, редкие примеры). Но с точки зрения динамики 3д мира, это тривиальные причина и следствие.
Собственно, известные случаи людей-маугли (и просто отдаленные слаборазвитые народы с ограниченной речью) показывают, что не имея возможности много говорить и обучаться с использованием речи, они сильно отстают в развитии. Причем, по большей части, именно по логике.
Люди так и учатся — от животных унаследовали умение понимать динамику трехмерного мира, и много-много-много говорят (слушают, читают) для развития интеллекта. Поэтому когда появится приемлемый фреймворк для обучения динамики реального мира (пока такого просто не существует, хотя начальные наработки уже имеются, например в распознавании 3д формы объектов по 2д картинкам), то в объединении с GPT-3, вполне может получиться сильный ИИ. Обучение динамики мира, по сути, означает создание embedding'ов для каждой наблюдаемой ситуации. Поэтому с архитектурой трансформера эти визуальные наблюдения могут быть достаточно легко объединены. Так как там текст на входе тоже сначала преобразуется в embedding'и, которые уже дальше идут по сети.
А что касается возможностей трансформеров в логике, то вот недавний GPT-f, в котором архитектуру трансформер применили к математическому языку для автоматического вывода доказательств. Во-первых, эта нейросеть достигла SOTA, а во-вторых, нашла несколько более коротких логических цепочек в математических доказательствах, чем были известны до этого. Так что с логикой у этой нейросетевой архитектуры потенциально все ок.
Это мультиязычная модель. Там скорее всего на входе просто пример диалога на китайском. Имитирующий заботливую тётушку/бабушку. Видимо, забавность такой ситуации и позволила им получить бета доступ к API. Так-то OpenAI (теперь ее уже называют ClosedAI) не разрешает свободные обращения к GPT-3. Вот народ и изворачивается, как может. То как генератор текста для игры в подземелья использовали, то как фитнес инструктора. Теперь вот разговор с заботливой тётушкой. Во всех случаях это стандартная GPT-3, только инициализированная разным начальным текстом. Но потом можно относительно легко сменить контекст и поэкспериментировать свободно.
Если сравнивать с Алисой, то Алиса не генерирует текст, а выбирает из готовых фраз (так говорили разработчики). Что резко снижает интерес к ней как к чат-боту, когда знаешь что она в принципе не может ничего ответить, кроме готовых предложений. Ее надо было назвать Эллочкой ). Но для продакшена такой подход конечно лучше, так как там заведомо почти не будет фраз с ругательствами. И бессмысленных наборов букв тоже. Гугл ассистент, кажется, работает так же. Но поговорить именно как с чат-ботом, интереснее с полноценным ботом.
Кстати, я попытался ввести тексты из этой статьи… Ну так себе, немного лучше чем GPT-2, но все равно много несвязанных глупостей. Как диалог получается лучше.
AI: Child, you look skinnier. Have you eaten yet?
Me: Знаешь анекдот про трех поросят?
AI: Нет, скажи.
Me: Заходит еврей, русский и англичанин в бар. Как думаешь, что дальше было?
AI: Англичанин? Не знаю, продолжай.
Me: Первый поросенок построил дом из соломы. А потом пришел волк. Ну и все…
AI: А как они разобрались?
Me: Что разобрались, кто из них англичанин?
AI: Потому что англичане против волков.
Me: Почему это?
AI: Солому для них легче из рук выплеснуть.
Me: Не выплеснуть, а сдуть. Волк же!
AI: Не разбирайся в английском, если не знаешь
Кстати, вот еще прикольный недавно появившийся чат с GPT-3: https://nainai.herokuapp.com/
Он на pinyin, но автоматически переводится на английский. Я попробовал вводить русским текстом и GPT-3 начал отвечать на чистом русском :)
Конечно, это не полноценный AI, так что я согласен со всеми критиками. Но все же диалоги иногда впечатляют, в том числе по соблюдению логики и запоминанию контекста разговора. Вот пример только что состоявшегося диалога:
Не в этом дело, изменить закон в этом плане дело нескольких дней, так как никаких технических препятствий для такого использования микросот нет. Это же оборудование существующих операторов, а не самодельные пиратские GSM станции.
Дело скорее в том, что наши спасатели либо не пытались проталкивать такую технологию, либо операторы на запросы предоставить фемтосоту отмораживались, ссылаясь как раз на эти недоработанные законы. Либо законотворцы тормозят, игнорируя внесение такого законопроекта. Там ведь надо зарегулировать кому выдавать, при каких обстоятельствах, кто несет ответственность за нецелевое использование (например, за трилатерацию такими станциями частных лиц, как это делают спецслужбы).
В общем, использование фемтосот для поиска заблудившихся людей это добросовестное использование, здесь нельзя ссылаться что это запрещено законом. Наоборот, это закон должен быть приведен в соответствие с действительностью. Во многих странах, кстати, фемтосоты уже давно используются в службах спасения, даже на хабре об этом как-то писали, кажется. Так что юридический образец для этого есть готовый, даже не надо ничего придумывать.
Более того, солнце нагревает разные участки и объекты на земле, которые еще около двух часов после заката светятся в инфракрасном диапазоне по яркости сравнимо с человеком. А есть еще гниющие пни, животные типа лисиц и кабанов и т.д… В общем, нужны либо идеальные погодные и наземные условия как в ролике выше (и хороший дорогой тепловизор), либо возможность сразу на вертолете облетать сотни или даже тысячи точек с ложными срабатываниями.
Тепловизор конечно хорошая штука, но насколько я знаю, пока для поиска именно людей в лесах широкого разнообразия (а не в тепличных условиях как на ролике выше), его еще никому не удалось нормально применить. Наш опыт несколько лет назад с тепловизором за 10 млн тоже провалился по перечисленным выше причинам.
В интерфейсе два поля для голосования: первое настоящее и второе для теневого голоса. По сути, проводятся параллельно два голосования. И для каждого выводится свой ключ для проверки потом своего голоса.
А вот как избежать коррупционной проверки, если начальники будут иметь прямой доступ к правильному блокчейну, а не просто к общему интерфейсу проверки для обычных людей… Вот это хороший вопрос! Как показало электронное голосование по прошедшему недавно конституционному перевороту, во многих фирмах у руководства были списки еще не зарегистрировавшихся на электронном голосовании и по этим спискам они принуждали работников голосовать. Т.е. какая-то инсайдерская информация разработчиками явно сливалась на сторону. Видимо, в российских условиях это не сработает. Слишком высокий уровень коррупции в высших ветвях власти.
Так что спасет только параллельный подсчет голосов конкурентами, имхо. Тем более, что он делается элементарно в рамках текущей системы электронного голосования. Вот этот обезличенный зашифрованный бюллетень, прошедший авторизацию на госуслугах (и поэтому гарантированно единственный для каждого избирателя и обезличенный), должен отправляться сразу на несколько серверов оппозиции, которые их подсчитывают независимо. А для защиты от тотальной фальсификации, когда реальная оппозиция вообще не допущена к выборам, также любым желающим быть наблюдателями. Open-source софт, который можно запустить на своем сервере, и всего лишь заранее добавив себя в список кому надо рассылать бюллетени во время голосования.
P.S. Таааак… я дико извиняюсь, но похоже и это не панацея. Ничего не мешает генератору бюллетеней (госуслугам) нагенерировать фальшивых бюллетеней с нужным голосом и отправить их всем наблюдателям. Нет в мире совершенства =). Почему бы населению самому не обеспечить сменяемость власти, чтобы властям наконец можно было доверять, и все эти трудности просто не требовались бы?
И все таки, почему не дать возможность считать голоса всем желающим? Как минимум, всем участвующим в выборах кандидатам. А также любому желающему внешнему наблюдателю. Какая разница отправлять зашифрованный и не привязанный к избирателю бюллетель в одну точку, или сразу на несколько серверов?
Выборы считать состоявшимися, если результаты подсчета у всех кандидатов сходятся.
Если у кого-то отличается от остальных и он уверен в фальсификации с других сторон, то просит своих сторонников проверить свой голос в блокчейне (да, такая возможность необходима, а для защиты от принуждения надо иметь теневой голос, т.е. два ключа для проверки своего голоса, и только пользователь знает какой настоящий. а теневой можно показывать работодателю).
А, главное — просит выйти этих людей на митинг. Значимые фальсификации — это десятки тысяч голосов. Это число гарантия, что такое количество людей невозможно подкупить. Далее следствие и суды просто набирают из этой толпы достаточное число людей, которые под присягой дают показания в уголовном деле против фальсификаторов.
Митинг необходим, чтобы продажные суды и полиция не делали липовые дела. Так как выход десятков тысяч людей, проверивших свои голоса, это гарантия что была фальсификация.
Единственная возможность здесь сжульничать — это если кто-то из кандидатов убедит своих последователей дать ложные показания (десятки тысяч человек, под угрозой уголовного преследования за ложные показания, серьезно?!). Но и это решается тем, что остальные кандидаты попросят выйти своих последователей. Чья толпа больше, тот и победил. Не думаю, что можно заставить солгать большую часть населения. Большинство людей хорошие.
А позднее, в цивилизованных условиях, у всех кандидатов будут сходиться результаты подсчета, и все будет ок.
Надо просто вырыть под реактором шахту глубиной в километр, и при всех нештатных ситуациях тупо сбрасывать его туда. Опасность ведь представляет не сам взрыв (точнее, расплавление реактора, хотя и радиоактивное облако тоже опасно), а что потом вся эта масса будет десятилетиями греться и загрязнять почву, воду, воздух. И ничем невозможно ее заглушить. А так получится автоматическое захоронение, хехе. Технически, реактор можно подвесить над шахтой на балках, которые расплавятся при повреждении реактора, и он упадет.
Нет, не бессмысленным. YOLO3 одна из лучших нейросетей и идёт вровень с десятком других современных архитектур. Так что ее выбор полностью оправдан. Просто удивили такие странные результаты сравнений в статье, такого не должно быть.
Новые архитектуры регулярно появляются, но там нет такой большой разницы, улучшения максимум на единицы процентов, а не в разы. А основная и самая трудоемкая работа для практического применения всегда заключается в дообучении какой-нибудь современной нейросети под свой датасет. Так что с этим в статье все нормально, стартап имеет право на существование. Там ведь ещё огромная сложность с выбором минимального score, по которому отсекать результаты. Для этого тоже нужен довольно большой свой датасет. Чтобы по нему выбрать что важнее — детектировать все объекты, но при этом будет много ложных срабатываний, или надёжное срабатывание без ложных целей, но при этом часть объектов будет пропущена. Кроме того, простая замена 80 категорий на 1-2 (как, видимо, сделали в статье) резко уменьшает размер нейоросети и ускоряет ее работу. Если не считать провокационного заголовка и некорректного сравнения с какими-то жутко устаревшими сетями (подозреваю, там mobilenet какой-нибудь, возможно даже первый, если в cloud сервисе крутится на CPU), то ребята все сделали правильно. Результат тоже очень хорош, лучшего на текущем этапе развития нейросетей особо и не добиться.
Какие нейросети используются в "Google AI" и "Microsoft Computer Vision"? Потому что вот прямо сейчас взял довольно старую разработку от Google "EfficientDet D7" с COCO 2017 (80 категорий объектов) и она без всякого дообучения выдает сравнимое качество распознавания:
Но использовать YOLO3 и дообучать под свой датасет это правильно, конечно. Хотя уже вышел YOLO4 (и какой-то левый YOLO5, но на самом деле это примерно как YOLO4). Кроме того, для вида сверху (без перспективы) есть сетки с Oriented Box и соответствующие датасеты/соревнования (такие как DOTA, пример сетки ), которые не чувствительны к поворотам.
Что будет с крылом – ну, тут должны считать специалисты, но невесомым оно (а также и шасси, способные выдержать посадку на высокой – большей, чем у обычного самолёта скорости) точно не будет.
Это если исходить, что к обычной ракете (т.е. первой ступени) приделываются крылья. Но ведь вся ракета может быть крылом. Грубо говоря, поверните длинную цилиндрическую ракету на 90 градусов, немного сплющите ее, и получите крыло с огромным удлинением. А значит очень эффективное в плотных слоях атмосферы. Экономия топлива на первых десятках км может быть до 20 раз, т.к. аэродинамическое качество почти линейно зависит от удлинения. На практике, конечно, в таком крыле возникнут большие нагрузки на изгиб, а вот это уже потребует большого увеличения массы. Плюс мешает очень низкий кпд ракетных двигателей на малых скоростях (пока выгоднее поскорее проскочить атмосферу, не дающую своим сопротивлением разогнаться).
Поэтому более реалистичные проекты подразумевают форму первой ступени в виде треугольника, т.е. в виде несущего корпуса. Там изгибающие нагрузки от подъемной силы минимальные. А вот с шасси, точнее, усилением конструкции под шасси, проблема конечно остается… Впрочем, шасси может быть распределенным и снимать эту проблему. Просто этого никто еще не делал.
Я к тому, что самолетная первая ступень — это не ракета с крыльями. Это скорее сплющенная по длине и растянутая в ширину ракета, чтобы получился треугольник с таким же внутренним объемом. Поэтому, теоретически, его масса может быть сравнима с обычной ракетой. Или даже меньше, так как в компактной конструкции проще обеспечить прочность. У длинной ракеты с типичными нагрузками на сжатие, есть понятие потери устойчивости тонкостенной конструкции и другие специфические проблемы (все это увеличивает массу). С другой стороны, пока самолетные схемы по итоговой массе уступают ракетной посадке. Но это не значит, что теоретически их нельзя сделать выгодными. До Маска серийную вертикальную посадку тоже никто не делал, а российские космические специалисты дружно утверждали, что это невыгодно.
Парашют позволяет при приемлемых его площадях и массах снизить скорость спуска до примерно 8-12 м/с. Но мягкую посадку он осуществить не сможет.
Ну, справедливости ради, под планирующим парашютом ракету можно раскачать и поставить на землю вертикально с околонулевой вертикальной скоростью. Не думаю, что вычислительно это такая уж трудная задача (потому что она уже давно решена на небольших RC самолетах). Другое дело, что парашют не позволяет еще находясь в космосе снизить скорость вхождения в атмосферу. Да и сама масса парашютной системы наверно сравнима с остатками топлива, необходимыми для вертикальной посадки, поэтому большого смысла в этом наверно нет...
Ну, это ж первые шаги. Потенциал виден, хоть и не без недостатков. Это не тупиковое направление, как может показаться из других комментариев.
Это как было с первым GPT, уже тогда было понятно что примерно будет выдавать GPT-3. Так же как сейчас понятно, к чему приведет GPT-3 в своих следующих версиях.
Это надо рассматривать как обычный детектор. Результат можно вывести текстом, а можно нарисовать наглядную картинку для доктора. Сути это не меняет.
Предполагается, что этих 25% данных достаточно для постановки диагноза (и в исследовании это доказывается, см. ниже). Это ведь не первые 25% данных, а потом пустота. Скорее съемка ведется просто с более редким шагом или вроде того. Человек не может в такой шумной картинке что-то увидеть, а компьютеру этого достаточно.
Да, технически нейросеть дорисовывает картинку, заполняя пустоты, вы правы. Но не фантазируя от себя, а используя диагноз из тех 25% данных, которых достаточно для постановки диагноза. Доказательством этому служит то, что доктора не смогли отличить реальный снимок со 100% данными и сгенерированный нейросетью на основе 25%. Они получаются одинаковые.
Причем, обратите внимание, сюда как раз входят нетипичные, уникальные случаи болезней, о которых вы говорите. Ведь тестовую выборку, на которой это проверяется, нейросеть не видела. Если бы она заполняла их чем-то типичным, то снимки отличались бы, так как в тестовой выборке попались бы уникальные случаи. А в работе утверждается, что они получаются одинаковыми.
Но риск ошибочного диагноза конечно сохраняется (как и от живого доктора), поэтому наиболее разумно использовать эту технологию как экспресс тест. С возможностью потом провести полноценное исследование. Или хотя бы применять для хоть какой-то помощи в случаях, где полноценное исследование невозможно.
Это работает и в обратную сторону — если на МРТ есть малейшие симптомы болезни, то нейросеть может дорисовать типичную картину. То есть это надо воспринимать как экспресс тест — если сразу показало проблему, то нужно лечить. А если ничего нет, то делать полное обследование. Не зря там упоминаются экстренные случаи (инсульты, дети), когда нет возможности ждать обычный час.
Ну смотрите, задайте GPT начальный текст "Ты робот, обладающий самосознанием". И он будет им обладать. Чем не вариант? На вопросы типа ты осознаешь себя, он будет отвечать что осознает. Ну и так далее.
Как кто-то метко обозначил в одной из предыдущих дискуссий по искусственному интеллекту — нельзя определять разум инструментами самого разума. Это замкнутый круг, так ничего не добиться.
Да, у меня тоже порой возникают такие мысли. Мы все ждём, что сильный ИИ будет повторять путь человечества. То есть постепенно учиться, улучшаться, и в итоге достигнет уровня интеллекта не хуже человека. Что он однажды родится как уникальная личность, грубо говоря. При этом есть сложность, как запрограммировать его быть разумным. Так как совершенно непонятно как придать ему нужные свойства, мы и про себя-то не знаем, как такими стали. И еще есть опасность, что он может наворотить дел пока на ранних этапах будет глуповатым и несовершенным.
Но GPT-3 намекает, что все может случиться совсем не так. Что ИИ сразу получится сверхчеловеческим. Представим, что GPT-3 увеличат в 1000 раз. Он будет сразу в своей памяти держать все эти 300 Гб текста, или сколько там. Со всеми фактами и знаниями со всего интернета. И на его входе будет дополнительно картинка с камеры. И его быстродействие и способности действительно смогут управлять механикой, посылая текстовые команды на шаговые двигатели.
И все программирование такого ИИ будет заключаться в том, какой начальный текст подать ему на вход. "Ты добрый ИИ, помогающий человечеству". И он начнет действовать согласно этой установке. "Ты злой ИИ, собирающийся уничтожить человечество". И он начнет это делать.
Это вообще не ИИ в нашем понимании. Сформированном книгами, фильмами и ожиданием. Эту тупо система, база данных, я даже не знаю как это назвать. У нее нет ни своих целей, ни сознания, ни мотивации. У нее вообще нет никаких человеческих ограничений и предыстории. Это просто сложная запутанная база данных, к которой можно делать запросы. Но при этом она, как мы уже видим по слабым намекам в серии GPT, будет полностью обладать полными свойствами интеллекта. То есть вставив его в силиконовую куклу и дав начальную установку "Ты притворяешься человеком, чтобы никто не мог тебя отличить от живого человека, обладающего сознанием". (ремарки про сознание я специально вставляю, так как многие оперируют именно этими категориями, так-то понятно, что никакого сознания не существует и никогда не существовало, появившееся когда-то в философии понятие сознания — это просто аналог понятия религии, заполнявшей пробелы в понимании мира при недостатке настоящих знаний)
И он так и сделает. И никто не отличит.
Пугающая перспектива (в плане злоупотреблений). Но в то же время сколько возможностей! Это имхо даже лучше, чем какой-то робот, который будет мучительно проходить все этапы эволюции при развитии своего мозга до человеческого. Эксперименты выше с хорошим/злым ботом показывают, что такой путь вполне реален. А намеки на это, и в целом понимание что к этому идёт, были ещё начиная с первой GPT.
Не зря от этой нейросети англоязычные люди в восторге ). Еще пару лет назад такое качество казалось недостижимым.
А что касается трудностей с логикой, то мне кажется проблема в том, что серия GPT не привязана к трехмерному миру. Если ее обучать на основе видео с текстовыми описанием происходящего, то со здравым смыслом было бы намного лучше. Как в примере с широким столом, который не проходит в дверь. Сложно представить, что в тексте это встречалось часто (это, как минимум, редкие примеры). Но с точки зрения динамики 3д мира, это тривиальные причина и следствие.
Собственно, известные случаи людей-маугли (и просто отдаленные слаборазвитые народы с ограниченной речью) показывают, что не имея возможности много говорить и обучаться с использованием речи, они сильно отстают в развитии. Причем, по большей части, именно по логике.
Люди так и учатся — от животных унаследовали умение понимать динамику трехмерного мира, и много-много-много говорят (слушают, читают) для развития интеллекта. Поэтому когда появится приемлемый фреймворк для обучения динамики реального мира (пока такого просто не существует, хотя начальные наработки уже имеются, например в распознавании 3д формы объектов по 2д картинкам), то в объединении с GPT-3, вполне может получиться сильный ИИ. Обучение динамики мира, по сути, означает создание embedding'ов для каждой наблюдаемой ситуации. Поэтому с архитектурой трансформера эти визуальные наблюдения могут быть достаточно легко объединены. Так как там текст на входе тоже сначала преобразуется в embedding'и, которые уже дальше идут по сети.
А что касается возможностей трансформеров в логике, то вот недавний GPT-f, в котором архитектуру трансформер применили к математическому языку для автоматического вывода доказательств. Во-первых, эта нейросеть достигла SOTA, а во-вторых, нашла несколько более коротких логических цепочек в математических доказательствах, чем были известны до этого. Так что с логикой у этой нейросетевой архитектуры потенциально все ок.
Это мультиязычная модель. Там скорее всего на входе просто пример диалога на китайском. Имитирующий заботливую тётушку/бабушку. Видимо, забавность такой ситуации и позволила им получить бета доступ к API. Так-то OpenAI (теперь ее уже называют ClosedAI) не разрешает свободные обращения к GPT-3. Вот народ и изворачивается, как может. То как генератор текста для игры в подземелья использовали, то как фитнес инструктора. Теперь вот разговор с заботливой тётушкой. Во всех случаях это стандартная GPT-3, только инициализированная разным начальным текстом. Но потом можно относительно легко сменить контекст и поэкспериментировать свободно.
Если сравнивать с Алисой, то Алиса не генерирует текст, а выбирает из готовых фраз (так говорили разработчики). Что резко снижает интерес к ней как к чат-боту, когда знаешь что она в принципе не может ничего ответить, кроме готовых предложений. Ее надо было назвать Эллочкой ). Но для продакшена такой подход конечно лучше, так как там заведомо почти не будет фраз с ругательствами. И бессмысленных наборов букв тоже. Гугл ассистент, кажется, работает так же. Но поговорить именно как с чат-ботом, интереснее с полноценным ботом.
Кстати, я попытался ввести тексты из этой статьи… Ну так себе, немного лучше чем GPT-2, но все равно много несвязанных глупостей. Как диалог получается лучше.
Да это может быть веселее, чем с Алисой :)
AI: Child, you look skinnier. Have you eaten yet?
Me: Знаешь анекдот про трех поросят?
AI: Нет, скажи.
Me: Заходит еврей, русский и англичанин в бар. Как думаешь, что дальше было?
AI: Англичанин? Не знаю, продолжай.
Me: Первый поросенок построил дом из соломы. А потом пришел волк. Ну и все…
AI: А как они разобрались?
Me: Что разобрались, кто из них англичанин?
AI: Потому что англичане против волков.
Me: Почему это?
AI: Солому для них легче из рук выплеснуть.
Me: Не выплеснуть, а сдуть. Волк же!
AI: Не разбирайся в английском, если не знаешь
Кстати, вот еще прикольный недавно появившийся чат с GPT-3: https://nainai.herokuapp.com/
Он на pinyin, но автоматически переводится на английский. Я попробовал вводить русским текстом и GPT-3 начал отвечать на чистом русском :)
Конечно, это не полноценный AI, так что я согласен со всеми критиками. Но все же диалоги иногда впечатляют, в том числе по соблюдению логики и запоминанию контекста разговора. Вот пример только что состоявшегося диалога:
AI: Child, you look skinnier. Have you eaten yet?
Me: нет, а как тебя зовут
AI: меня зовут Jenny.
Me: а может твое имя Анна, ты так не считаешь?
AI: нет.
Me: точно, ты уверена в этом?
AI: уверенна, я знаю свое имя.
Me: И какое же оно?
AI: это Jenny.
Не в этом дело, изменить закон в этом плане дело нескольких дней, так как никаких технических препятствий для такого использования микросот нет. Это же оборудование существующих операторов, а не самодельные пиратские GSM станции.
Дело скорее в том, что наши спасатели либо не пытались проталкивать такую технологию, либо операторы на запросы предоставить фемтосоту отмораживались, ссылаясь как раз на эти недоработанные законы. Либо законотворцы тормозят, игнорируя внесение такого законопроекта. Там ведь надо зарегулировать кому выдавать, при каких обстоятельствах, кто несет ответственность за нецелевое использование (например, за трилатерацию такими станциями частных лиц, как это делают спецслужбы).
В общем, использование фемтосот для поиска заблудившихся людей это добросовестное использование, здесь нельзя ссылаться что это запрещено законом. Наоборот, это закон должен быть приведен в соответствие с действительностью. Во многих странах, кстати, фемтосоты уже давно используются в службах спасения, даже на хабре об этом как-то писали, кажется. Так что юридический образец для этого есть готовый, даже не надо ничего придумывать.
Жизнь человека важнее любых лицензий. Так что с этим как раз все понятно. Непонятно здесь только почему такая ситуация существует в 21 веке.
Более того, солнце нагревает разные участки и объекты на земле, которые еще около двух часов после заката светятся в инфракрасном диапазоне по яркости сравнимо с человеком. А есть еще гниющие пни, животные типа лисиц и кабанов и т.д… В общем, нужны либо идеальные погодные и наземные условия как в ролике выше (и хороший дорогой тепловизор), либо возможность сразу на вертолете облетать сотни или даже тысячи точек с ложными срабатываниями.
Тепловизор конечно хорошая штука, но насколько я знаю, пока для поиска именно людей в лесах широкого разнообразия (а не в тепличных условиях как на ролике выше), его еще никому не удалось нормально применить. Наш опыт несколько лет назад с тепловизором за 10 млн тоже провалился по перечисленным выше причинам.
В интерфейсе два поля для голосования: первое настоящее и второе для теневого голоса. По сути, проводятся параллельно два голосования. И для каждого выводится свой ключ для проверки потом своего голоса.
А вот как избежать коррупционной проверки, если начальники будут иметь прямой доступ к правильному блокчейну, а не просто к общему интерфейсу проверки для обычных людей… Вот это хороший вопрос! Как показало электронное голосование по прошедшему недавно конституционному перевороту, во многих фирмах у руководства были списки еще не зарегистрировавшихся на электронном голосовании и по этим спискам они принуждали работников голосовать. Т.е. какая-то инсайдерская информация разработчиками явно сливалась на сторону. Видимо, в российских условиях это не сработает. Слишком высокий уровень коррупции в высших ветвях власти.
Так что спасет только параллельный подсчет голосов конкурентами, имхо. Тем более, что он делается элементарно в рамках текущей системы электронного голосования. Вот этот обезличенный зашифрованный бюллетень, прошедший авторизацию на госуслугах (и поэтому гарантированно единственный для каждого избирателя и обезличенный), должен отправляться сразу на несколько серверов оппозиции, которые их подсчитывают независимо. А для защиты от тотальной фальсификации, когда реальная оппозиция вообще не допущена к выборам, также любым желающим быть наблюдателями. Open-source софт, который можно запустить на своем сервере, и всего лишь заранее добавив себя в список кому надо рассылать бюллетени во время голосования.
P.S. Таааак… я дико извиняюсь, но похоже и это не панацея. Ничего не мешает генератору бюллетеней (госуслугам) нагенерировать фальшивых бюллетеней с нужным голосом и отправить их всем наблюдателям. Нет в мире совершенства =). Почему бы населению самому не обеспечить сменяемость власти, чтобы властям наконец можно было доверять, и все эти трудности просто не требовались бы?
И все таки, почему не дать возможность считать голоса всем желающим? Как минимум, всем участвующим в выборах кандидатам. А также любому желающему внешнему наблюдателю. Какая разница отправлять зашифрованный и не привязанный к избирателю бюллетель в одну точку, или сразу на несколько серверов?
Выборы считать состоявшимися, если результаты подсчета у всех кандидатов сходятся.
Если у кого-то отличается от остальных и он уверен в фальсификации с других сторон, то просит своих сторонников проверить свой голос в блокчейне (да, такая возможность необходима, а для защиты от принуждения надо иметь теневой голос, т.е. два ключа для проверки своего голоса, и только пользователь знает какой настоящий. а теневой можно показывать работодателю).
А, главное — просит выйти этих людей на митинг. Значимые фальсификации — это десятки тысяч голосов. Это число гарантия, что такое количество людей невозможно подкупить. Далее следствие и суды просто набирают из этой толпы достаточное число людей, которые под присягой дают показания в уголовном деле против фальсификаторов.
Митинг необходим, чтобы продажные суды и полиция не делали липовые дела. Так как выход десятков тысяч людей, проверивших свои голоса, это гарантия что была фальсификация.
Единственная возможность здесь сжульничать — это если кто-то из кандидатов убедит своих последователей дать ложные показания (десятки тысяч человек, под угрозой уголовного преследования за ложные показания, серьезно?!). Но и это решается тем, что остальные кандидаты попросят выйти своих последователей. Чья толпа больше, тот и победил. Не думаю, что можно заставить солгать большую часть населения. Большинство людей хорошие.
А позднее, в цивилизованных условиях, у всех кандидатов будут сходиться результаты подсчета, и все будет ок.
Надо просто вырыть под реактором шахту глубиной в километр, и при всех нештатных ситуациях тупо сбрасывать его туда. Опасность ведь представляет не сам взрыв (точнее, расплавление реактора, хотя и радиоактивное облако тоже опасно), а что потом вся эта масса будет десятилетиями греться и загрязнять почву, воду, воздух. И ничем невозможно ее заглушить. А так получится автоматическое захоронение, хехе. Технически, реактор можно подвесить над шахтой на балках, которые расплавятся при повреждении реактора, и он упадет.
Нет, не бессмысленным. YOLO3 одна из лучших нейросетей и идёт вровень с десятком других современных архитектур. Так что ее выбор полностью оправдан. Просто удивили такие странные результаты сравнений в статье, такого не должно быть.
Новые архитектуры регулярно появляются, но там нет такой большой разницы, улучшения максимум на единицы процентов, а не в разы. А основная и самая трудоемкая работа для практического применения всегда заключается в дообучении какой-нибудь современной нейросети под свой датасет. Так что с этим в статье все нормально, стартап имеет право на существование. Там ведь ещё огромная сложность с выбором минимального score, по которому отсекать результаты. Для этого тоже нужен довольно большой свой датасет. Чтобы по нему выбрать что важнее — детектировать все объекты, но при этом будет много ложных срабатываний, или надёжное срабатывание без ложных целей, но при этом часть объектов будет пропущена. Кроме того, простая замена 80 категорий на 1-2 (как, видимо, сделали в статье) резко уменьшает размер нейоросети и ускоряет ее работу. Если не считать провокационного заголовка и некорректного сравнения с какими-то жутко устаревшими сетями (подозреваю, там mobilenet какой-нибудь, возможно даже первый, если в cloud сервисе крутится на CPU), то ребята все сделали правильно. Результат тоже очень хорош, лучшего на текущем этапе развития нейросетей особо и не добиться.
Какие нейросети используются в "Google AI" и "Microsoft Computer Vision"? Потому что вот прямо сейчас взял довольно старую разработку от Google "EfficientDet D7" с COCO 2017 (80 категорий объектов) и она без всякого дообучения выдает сравнимое качество распознавания:
Другие более менее современные нейросети тоже не сильно уступают: CenterNet: https://habrastorage.org/webt/xq/eb/ke/xqebkeq1owrwjpm2jytlfhi86lm.jpeg, Faster R-CNN: https://habrastorage.org/webt/1g/rs/96/1grs96te3un9p5n_diajm5g27na.jpeg. Не стал вставлять картинки, чтобы не загромождать комментарий.
Так как исходных картинок в статье нет, то пришлось вырезать прямо из скриншотов в этой статье. Первая (https://habrastorage.org/webt/vy/ya/sf/vyyasfjdaozweeurigu_gdwszco.jpeg) получилась всего 557х413 пикселей и вторая (https://habrastorage.org/webt/2d/3f/ny/2d3fnyuny7qj97ohz_jctgrnvgq.jpeg) 450х254 пикселей. Хотя в статье видно, что оригинальные картинки были как минимум в два раза больше по разрешению. Думаю, с оригиналами получилось бы еще лучше.
Но использовать YOLO3 и дообучать под свой датасет это правильно, конечно. Хотя уже вышел YOLO4 (и какой-то левый YOLO5, но на самом деле это примерно как YOLO4). Кроме того, для вида сверху (без перспективы) есть сетки с Oriented Box и соответствующие датасеты/соревнования (такие как DOTA, пример сетки ), которые не чувствительны к поворотам.
P.S. Эти примеры запустил в браузере через этот Google Colab, ссылка для желающих повторить: https://colab.research.google.com/github/tensorflow/hub/blob/master/examples/colab/tf2_object_detection.ipynb. А здесь список нейросетей в нем (выбираются из списка в самом Colab ноутбуке): https://tfhub.dev/tensorflow/collections/object_detection/1
Это если исходить, что к обычной ракете (т.е. первой ступени) приделываются крылья. Но ведь вся ракета может быть крылом. Грубо говоря, поверните длинную цилиндрическую ракету на 90 градусов, немного сплющите ее, и получите крыло с огромным удлинением. А значит очень эффективное в плотных слоях атмосферы. Экономия топлива на первых десятках км может быть до 20 раз, т.к. аэродинамическое качество почти линейно зависит от удлинения. На практике, конечно, в таком крыле возникнут большие нагрузки на изгиб, а вот это уже потребует большого увеличения массы. Плюс мешает очень низкий кпд ракетных двигателей на малых скоростях (пока выгоднее поскорее проскочить атмосферу, не дающую своим сопротивлением разогнаться).
Поэтому более реалистичные проекты подразумевают форму первой ступени в виде треугольника, т.е. в виде несущего корпуса. Там изгибающие нагрузки от подъемной силы минимальные. А вот с шасси, точнее, усилением конструкции под шасси, проблема конечно остается… Впрочем, шасси может быть распределенным и снимать эту проблему. Просто этого никто еще не делал.
Я к тому, что самолетная первая ступень — это не ракета с крыльями. Это скорее сплющенная по длине и растянутая в ширину ракета, чтобы получился треугольник с таким же внутренним объемом. Поэтому, теоретически, его масса может быть сравнима с обычной ракетой. Или даже меньше, так как в компактной конструкции проще обеспечить прочность. У длинной ракеты с типичными нагрузками на сжатие, есть понятие потери устойчивости тонкостенной конструкции и другие специфические проблемы (все это увеличивает массу). С другой стороны, пока самолетные схемы по итоговой массе уступают ракетной посадке. Но это не значит, что теоретически их нельзя сделать выгодными. До Маска серийную вертикальную посадку тоже никто не делал, а российские космические специалисты дружно утверждали, что это невыгодно.
Ну, справедливости ради, под планирующим парашютом ракету можно раскачать и поставить на землю вертикально с околонулевой вертикальной скоростью. Не думаю, что вычислительно это такая уж трудная задача (потому что она уже давно решена на небольших RC самолетах). Другое дело, что парашют не позволяет еще находясь в космосе снизить скорость вхождения в атмосферу. Да и сама масса парашютной системы наверно сравнима с остатками топлива, необходимыми для вертикальной посадки, поэтому большого смысла в этом наверно нет...
С номерами 1, 2 и 4 =)
Ну, это ж первые шаги. Потенциал виден, хоть и не без недостатков. Это не тупиковое направление, как может показаться из других комментариев.
Это как было с первым GPT, уже тогда было понятно что примерно будет выдавать GPT-3. Так же как сейчас понятно, к чему приведет GPT-3 в своих следующих версиях.
Это надо рассматривать как обычный детектор. Результат можно вывести текстом, а можно нарисовать наглядную картинку для доктора. Сути это не меняет.
Предполагается, что этих 25% данных достаточно для постановки диагноза (и в исследовании это доказывается, см. ниже). Это ведь не первые 25% данных, а потом пустота. Скорее съемка ведется просто с более редким шагом или вроде того. Человек не может в такой шумной картинке что-то увидеть, а компьютеру этого достаточно.
Да, технически нейросеть дорисовывает картинку, заполняя пустоты, вы правы. Но не фантазируя от себя, а используя диагноз из тех 25% данных, которых достаточно для постановки диагноза. Доказательством этому служит то, что доктора не смогли отличить реальный снимок со 100% данными и сгенерированный нейросетью на основе 25%. Они получаются одинаковые.
Причем, обратите внимание, сюда как раз входят нетипичные, уникальные случаи болезней, о которых вы говорите. Ведь тестовую выборку, на которой это проверяется, нейросеть не видела. Если бы она заполняла их чем-то типичным, то снимки отличались бы, так как в тестовой выборке попались бы уникальные случаи. А в работе утверждается, что они получаются одинаковыми.
Но риск ошибочного диагноза конечно сохраняется (как и от живого доктора), поэтому наиболее разумно использовать эту технологию как экспресс тест. С возможностью потом провести полноценное исследование. Или хотя бы применять для хоть какой-то помощи в случаях, где полноценное исследование невозможно.
Это работает и в обратную сторону — если на МРТ есть малейшие симптомы болезни, то нейросеть может дорисовать типичную картину. То есть это надо воспринимать как экспресс тест — если сразу показало проблему, то нужно лечить. А если ничего нет, то делать полное обследование. Не зря там упоминаются экстренные случаи (инсульты, дети), когда нет возможности ждать обычный час.