Как стать автором
Обновить
13
10.1

Пользователь

Отправить сообщение

У Яна Лекуна в статье есть отличная цитата: "Большие языковые модели (LLM), похоже, обладают удивительно большим объемом фоновых знаний, извлеченных из письменного текста. Но большая часть человеческих знаний здравого смысла не представлена ни в одном тексте и является результатом нашего взаимодействия с физическим миром. Поскольку LLM не имеют прямого опыта с базовой реальностью, тип знаний здравого смысла, который они демонстрируют, очень поверхностен и может быть оторван от реальности".

Лекун пишет о том какими ухищрениями можно попробовать научить LLM здравому смыслу о мире, но это все равно далеко от вопроса достоверности, поскольку даже если эти ухищрения приведут к результату, все равно останется вопрос насколько база данных здравого смысла достоверна.

На данный момент все разработчики LLM утверждают, что их датасеты достоверны, но это очевидно не так, поскольку в них не раз обнаруживались фейки, а у самих разработчиков вообще нет критерия достоверности информации.

Позиция "моя база данных или онтология достоверна потому что она моя" не может быть основой достоверности. Поэтому будущее для меня лично довольно просто и определяется следующей логикой:

  1. Галлюцинации и конфабуляции искусственного интеллекта принципиально неустранимы https://www.mdpi.com/1099-4300/26/3/194

  2. Перекрестное взаимообучение LLM на галлюцинациях друг у друга неизбежно ведет к "коллапсу нейросетей" и деградации знаний людей, которые их применяют https://arxiv.org/abs/2305.17493v2 и https://gradual-disempowerment.ai

  3. Любая физическая деятельность в реальном мире связана именно с физикой всего мироздания, и иногда малейшая ошибка в понимании этих взаимосвязей заканчивается летальным исходом. Миллион примеров можно посмотреть на видео, посвященных производственной технике безопасности. Именно поэтому любая галлюцинация робота с искусственным интеллектом без опоры на реальный опыт реальных людей с реальными знаниями о мире, закончится повреждением робота и убытками разной степени для работодателя, вплоть до катастрофических.

Отсюда вывод — на людях лежит главная ответственность за связь с реальностью. И чем сложнее будут вопросы, которые будут решать нейронки, тем серьезнее будет ответственность человека за своевременное выявление все более тонких и неуловимых галлюцинаций. Для этого нужны люди с глубочайшими знаниями, причем не с зазубренными из-под палки в школе, а с реальным опытом практически по любым вопросам.

Сколько будет задач у нейронок, столько должно быть и суперпрофи по этим задачам. А для суперпрофи нужны просто профи и помощники профи и ученики помощников профи.

И для всего этого необходим рейтинг достоверности знаний, чтобы знать кто профи, а кто не профи.

А без критерия достоверности информации и рейтинга достоверности знаний любую LLM (и вообще любую искусственную систему согласно доказательству Майкла Левина) ожидает неминуемый коллапс.

Противопоставить искусственному интеллекту можно только коллективную нейросеть всех умов человечества. Для взаимной проверки и совершенствования больших языковых моделей и человека нужна возможность сопоставления знаний искусственного интеллекта с коллективным интеллектом. Это единственное, что может нас вытащить из персональных туннелей реальности и личных информационных пузырей, в которых мы все глубже застреваем поодиночке.

https://habr.com/ru/articles/874440

CyberPravda.com — глобальная интернациональная мультиязычная платформа для краудсорсинга достоверной информации, которая помогает интернет-пользователям в возрасте от 16 лет со всего мира (109 языков и 5 континентов) в ситуации, когда количество информации в Интернете растет экспоненциально, в сети находится огромное количество фейков и искусственно созданных утверждений, в которых теряется истина, а нейросети генерируют огромное количество высококачественного искусственного контента, который с каждым днем выглядит все более достоверным, отличить правду от лжи, увидеть альтернативные точки зрения и понять, кому можно доверять с помощью блокчейн-экосистемы всеобщего ежедневного применения с независимым математическим алгоритмом объективного анализа достоверности утверждений и оценки репутации их авторов без предвзятости админов, экспертов, оракулов, сертификатов государств и корпораций, галлюцинирующего искусственного интеллекта, кликбейтных лайков/дизлайков или токенов для голосования, которыми можно подкупить любого пользователя, что позволяет преодолеть кризис доверия и поляризацию общества, дает удовольствие переспорить своих оппонентов и возможность получить репутацию эксперта, которую в виде цифрового сертификата можно опубликовать в своих соцсетях, сделать ставки на разные версии событий и монетизировать свои знания, зарабатывая на публикации достоверной информации для широкой аудитории.

А также позволяет решить проблему галлюцинации больших языковых моделей и коллапса нейросетей с помощью коллективной нейросети всех умов человечества для сопоставления знаний искусственного интеллекта с коллективным интеллектом реальных людей, обладающих подлинными знаниями и опытом, что позволяет достичь взаимной проверки и самосовершенствования LLM и человека.

Мы впервые в мире алгоритмически реализовали критерий фальсифицируемости Поппера, который является основой научного метода.

https://habr.com/ru/articles/874440

О том, что в блокчейне можно хранить вредоносное ПО или нелегальный контент давным-давно известно. Об этом еще десять лет назад предупреждал Интерпол на конференции Black Hat Asia 2015, проходившей в Сингапуре. И способов стереть эту информацию исследователи безопасности, работавшие на Интерпол, не нашли.

Проблему можно решить только через репутацию источников информации, которая на фундаментальном уровне связана с достоверностью информации, поскольку высокая репутация может быть только у тех, кто говорит то, что делает и делает то же, что и говорит. В общем, это длинная цепочка причин и следствий и здесь предстоит большая коллективная работа, общий план которой подробно описан в этой статье https://habr.com/ru/articles/874440

Мы сейчас как раз над этим работаем. Это очень перспективная задача, но у нас очень мало ресурсов

Я думаю, каждый проект и каждая команда, которые хотят что-то сделать, при желании будут выпускать свою крипту и своими планами и стратегиями аргументировать ее перспективы роста и полезность для общественных задач. А люди, убедившиеся в репутации и доверии к организаторам таких проектов, будут инвестировать в их криптовалюту, финансируя таким образом перспективные организации.

Можете предоставить список этих доверенных институтов?

Потому что доверие должно быть прозрачным

Если кому интересно, мы делаем для этой цели систему коллективного интеллекта, которая дополняет возможности искусственного интеллекта знаниями реальных живых экспертов с реальным профессиональным опытом. Если интересно — пишите в личку, расскажу подробнее.

Как российские разработчики заставили GPT предсказывать биржевые котировки https://habr.com/ru/articles/861492

Мало кто понимает, что для максимального подобия результатов генерации реальности, в любую LLM в саму ее основу на очень фундаментальном принципиально неустранимом уровне встроена случайность.

У Яна Лекуна в статье https://openreview.net/pdf?id=BZ5a1r-kVsf есть отличная цитата: "Большие языковые модели (LLM), похоже, обладают удивительно большим объемом фоновых знаний, извлеченных из письменного текста. Но большая часть человеческих знаний здравого смысла не представлена ни в одном тексте и является результатом нашего взаимодействия с физическим миром. Поскольку LLM не имеют прямого опыта с базовой реальностью, тип знаний здравого смысла, который они демонстрируют, очень поверхностен и может быть оторван от реальности".

Лекун пишет о том какими ухищрениями можно попробовать научить LLM здравому смыслу о мире, но это все равно далеко от вопроса достоверности, поскольку даже если эти ухищрения приведут к результату, все равно останется вопрос насколько база данных здравого смысла достоверна.

Ник Сен-Пьер (креативный директор и неофициальный представитель Midjourney), еще полгода назад заявлял, что по его данным галлюцинациями заражены уже все датасеты, поскольку никто не предполагал высокой скорости заражения и не принимал в расчет наличие мультипликатора — заражения от уже зараженного контента.

На данный момент все разработчики LLM утверждают, что их датасеты достоверны, но это очевидно не так, поскольку в них не раз обнаруживались фейки, а у самих разработчиков вообще нет критерия достоверности информации. Позиция "моя база данных или онтология достоверна потому что она моя" не может быть основой достоверности. Поэтому будущее для меня лично довольно просто и определяется следующей логикой:

  1. Галлюцинации и конфабуляции искусственного интеллекта принципиально неустранимы https://www.mdpi.com/1099-4300/26/3/194

  2. Перекрестное взаимообучение LLM на галлюцинациях друг у друга неизбежно ведет к "коллапсу нейросетей" и деградации знаний людей, которые их применяют https://arxiv.org/abs/2305.17493v2

  3. Любая физическая деятельность в реальном мире связана именно с физикой всего мироздания, и иногда малейшая ошибка в понимании этих взаимосвязей заканчивается летальным исходом. Миллион примеров можно посмотреть на видео, посвященных производственной технике безопасности. Именно поэтому любая галлюцинация робота с искусственным интеллектом без опоры на реальный опыт реальных людей с реальными знаниями о мире, закончится повреждением робота и убытками разной степени для работодателя, вплоть до катастрофических.

Отсюда вывод — на людях лежит главная ответственность за связь с реальностью. И чем сложнее будут вопросы, которые будут решать нейронки, тем серьезнее будет ответственность человека за своевременное выявление все более тонких и неуловимых галлюцинаций. Для этого нужны люди с глубочайшими знаниями, причем не с зазубренными из-под палки в школе, а с реальным опытом практически по любым вопросам.

Сколько будет задач у нейронок, столько должно быть и суперпрофи по этим задачам. А для суперпрофи нужны просто профи и помощники профи и ученики помощников профи.

И для всего этого необходим рейтинг достоверности знаний, чтобы знать кто профи, а кто не профи.

А без критерия достоверности информации и рейтинга достоверности знаний любую LLM (и вообще любую искусственную систему согласно доказательству Майкла Левина) ожидает неминуемый коллапс.

Проект рейтинга достоверности знаний, над которым мы сейчас работаем, описан в нашем манифесте https://habr.com/ru/articles/802419

Изобрести мало. Нужно реализовать. Какой из этих пунктов вы лично сами реализовали?

Пришло время для проектов, которые поставят предельно возможную планку по независимости, объективности и непредвзятости свободы слова:

—  система должна быть абсолютно независима от предвзятых админов, наемных экспертов, специальных кураторов контента, оракулов, сертификатов государств и корпораций, галлюцинирующих и предвзято настроенных алгоритмов искусственного интеллекта, кликбейтных лайков/дизлайков или токенов для голосования, которыми можно подкупить любого пользовате

—  система должна быть глобальной, интернациональной, мультиязычной и бесплатной, чтобы быть доступной для пользователей всего мира    

—  система должна быть непредвзята ко всем авторам и открыта к публикации любых мнений     

—  система должна быть объективна и чисто математически оценивать все факты и аргументы без исключения по принципу «всех со всеми» немедленно сразу же в тот момент как они были опубликованы    

—  система должна быть децентрализована и криптографически защищена настолько, чтобы даже ее создатели не имели ни малейшей возможности повлиять на ее результаты    

—  система должна быть в любой момент доступна всем желающим для аудита и проведения независимой проверки

Если вас интересуют инвестиции, могу поделиться всеми подробностями при личной встрече. Заодно покажу и результаты моделирования алгоритма.

Давайте для начала разберемся что такое вообще "знания"? И если вы упомянули "низкорейтинговые источники", то какие вы тогда считаете высокорейтинговыми? Какие наукометрические рейтинги кроме Хирша у вас есть? Прошлый год поставил рекорд по числу отозванных научных публикаций — их было более 10 тысяч. Вы считаете индекс Хирша единственным высокорейтинговым критерием и боитесь мнения всех, у кого его нет? Означает ли отсутствие индекса Хирша отсутствие знаний???

Мы как раз и делаем систему коллективного интеллекта для краудсорсинга достоверной информации от реальных специалистов с реальными, а не заученными знаниями и опытом. Поэтому у нас не искусственный интеллект. У нас коллективный интеллект всего человечества.

То, о чем вы пишите, легко сделать на примере одной научной публикации или одной ветки форума. Но Киберправда оценивает результаты игры "вдолгую". А вот здесь никакой XRumer не поможет, поскольку цепочки знаний, основанные на цепочках знаний, основанных на цепочках знаний, принципиально отличаются от единичных постов в соцсетях или спамерских объявлений.

Не пойму, к чему вы придираетесь. Мы как раз и делаем систему для объективного и непредвзятого вскрытия недостоверности, которая позволит разобраться где именно наши умопостроения основаны на недостоверных результатах. Это как раз и позволит понять где искать, где копать и куда деньги выделять на более подробные исследования, чтобы наука двигалась вперед, а не тормозила человечество устаревшими концепциями и догматами.

Простите, а вы на какой основе критикуете климатологов? У вас есть какие-то факты, которые они исказили или скрыли? Так что же вы сидите? Киберправда создается глобальным общемировым сообществом людей, у которых есть знания. Вот и опубликуйте свои знания в виде графа. А алгоритм проверит этот граф на взаимную непротиворечивость со всеми другими фактами по принципу "всех со всеми".

1) Вы прямо Капитан Очевидность. Однако, очевидно, что те, у кого есть знания, делают это более упорядоченно и системно, а научное сообщество более упорядоченно и системно им оппонирует. С точки зрения математики алгоритма в этом есть принципиальное отличие от хаотических бессистемных мнений неучей, ботов и троллей.

2) У невоспроизводимых результатов низкая достоверность. И конкуренция нескольких невоспроизводимых результатов с низкой достоверностью приводит хрупкому равновесию нескольких версий с еще более низкой достоверностью. И эта деградация будет продолжаться, пока кто-то не получит воспроизводимые результаты, подтверждаемые фактами, у которых есть свои подтверждаемые факты, у которых есть свои подтверждаемые факты. Это обрушит рейтинг достоверности невоспроизводимых результатов оппонентов и поднимет достоверность воспроизводимых результатов настоящих ученых. Кризис воспроизводимости есть, но из него есть выход. Вопрос в том, будете ли вы сидеть в жопе и жаловаться на кризис, или приложите усилия, чтобы из нее выбраться.

Информация

В рейтинге
5 527-й
Зарегистрирован
Активность