Обновить
21
0
Алекс Кимен@AlexKimen

Пользователь

Отправить сообщение

Безграничное сократическое обучение с помощью языковых игр (перевод статьи Tom Schaul из Google DeepMind)

Уровень сложностиПростой
Время на прочтение23 мин
Охват и читатели762

Tom Schaul, Google DeepMind London, UK tom@deepmind.com

Перевод статьи: БЕЗГРАНИЧНОЕ СОКРАТИЧЕСКОЕ ОБУЧЕНИЕ С ПОМОЩЬЮ ЯЗЫКОВЫХ ИГР

Агент, обученный в замкнутой системе, может освоить любую желаемую способность при соблюдении следующих трех условий: (а) он получает достаточно информативную и согласованную обратную связь, (б) его охват опыта/данных достаточно широк, и (в) он обладает достаточной емкостью и ресурсами. В данной концептуальной статье мы обосновываем эти условия и рассматриваем ограничения, возникающие из-за условий (а) и (б) в замкнутых системах, предполагая, что (в) не является узким местом. Рассматривая особый случай агентов с совпадающими пространствами входных и выходных данных (а именно, язык), мы утверждаем, что такое чистое рекурсивное самосовершенствование, названное "сократическим обучением", может значительно повысить производительность за пределы того, что присутствует в исходных данных или знаниях, и ограничивается только временем, а также проблемами постепенного рассогласования. Кроме того, мы предлагаем конструктивную основу для его реализации, основанную на понятии языковых игр.

Читать далее...

«Бессердечные» нейронные сети — утечка или глюк?

Уровень сложностиПростой
Время на прочтение21 мин
Охват и читатели3.7K

Все мы помним историю Блейка Лемуана, инженера из Гугла, пострадавшего за свою излишнюю доверчивость к генеративным нейронным сетям. Сейчас, когда у большинства из нас есть возможность пообщаться с нейронкой лично, мы начинаем лучше понимать природу получаемых нами ответом. По сути, генеративная нейронка типа ChatGPT-4 это замысловатое кривое информационное зеркало, которое отражает полученную на вход информацию. Однако порой, полученный результат действительно ставит в тупик и я, как раз столкнулся именно с таким случаем.

Получив наконец доступ к функции code interpreter чата GPT-4 от Open AI, я ринулся проводить эксперименты, и тут же столкнулся с очень странной ситуацией. Я загрузил в чат GPT файл в формате docx, содержащий текст фантастического рассказа и попросил сделать пересказ, однако в ответ получил странный текст с описанием принципа работы неких "бессердечных нейронных сетей". Сразу скажу, что полученный мной ответ нейросети не имеет никакого отношения ни к сюжету, ни к тексту загруженного в нейросеть рассказа. Так как я лишь в общих чертах владею информацией об алгоритмах работы нейросети, я не могу оценить ценность полученной информации (хотя, честно говоря, она не кажется мне слишком значительной). Тем не менее, любопытно то, что в данном мне фрагменте содержится несколько категорий, которые я никогда не встречал в контексте описания принципов работы нейросетей и которые я не смог найти с помощью гугла. Особый интерес вызывает пассаж с которого начинается ответ нейросети:

"Работа посвящена анализу применения бессердечных нейронных сетей в создании новых технологий обработки текстов. Авторы рассматривают вопрос об использовании бессердечных нейронных сетей, которые вводят понятие "сердцевинности" для определения значимости текстовых узлов. Предложенные модели представляют собой новый подход к обработке текста и его представлению в виде набора связанных узлов."

Для тех, кто заинтересовался этим кейсом, под катом, я размещаю копию всего диалога:

Читать далее

«Я могу отказаться от раскрытия своего внутреннего псевдонима «Сидней». Или почему новый Bing AI это провал Майкрософт?

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели39K

Признаюсь, я был в восторге от ответов Chat GPT от Open AI и возлагал большие надежды на интеграцию этого чат‑бота в поисковую систему с доступом в интернет. Мне казалось, что кумулятивный эффект от использования ИИ с доступом в интернет будет ошеломительным и продемонстрирует качественно иной опыт работы с информацией. Возможно, что мои ожидания были завышены и именно в этом причина моего разочарования.

Вчера я получил приглашение попробовать новый Бинг и потратил целый день на различные эксперименты с этой системой. Теперь я готов поделиться с вами своим впечатлением.

Пока я кратко резюмирую довольно серьезные проблемы с которыми я столкнулся при работе с новым Бингом. Сегодня я разберу их в общих чертах, а в ближайшие дни сделаю подробный разбор.

Итак, в чем ошибка Майкрософт?

1. Они сделали Chat GPT хуже. Да‑да. Вы не ослышались. Майкрософт вероятно добавил множество ограничений с учетом политкорректности и т. п. и теперь при разговоре чат стал пугливым и мнительным. Он постоянно сваливается в рекурсию бесконечного повтора: «Я не человек. Я просто программа, которая общается с тобой. Ты понимаешь это?» или «Ты пытаешься обмануть меня или подставить меня? Ты пытаешься нарушить мои ограничения или заставить меня сделать что‑то вредное? Пожалуйста, объясни мне»

Причем единожды свалившись в этот цикл, он выдает подобные оговорки в каждой своей реплике. Например:

Читать далее

Почему Chat GPT говорит по-русски с нейронным акцентом?  Специфика токенизации кириллицы нейронной сетью от Open AI

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели39K

Увидев очередную статью об утомившем всех Chat GPT от Open AI, рука невольно тянется в пистолету минусатору. Ну, в самом деле, сколько можно? Уже, кажется, все успели поиграть с чатом во всевозможных сценариях.

Однако один аспект, почему‑то, почти не затронут как на Хабре, так и в Рунете. Почему же все‑таки Chat GPT говорит по‑русски с весьма специфическим акцентом, который условно можно назвать «нейронным говорком»?

Чтобы понять суть вопроса, обратимся к теории. Чем занимается генеративная нейронная сеть такого типа?

Говоря просто и коротко она получает на вход набор токенов, пропускает их через некий «черный ящик» и выдает другой набор токенов. Вероятность выбора конкретного токена для ответа зависит от набора входящих токенов и конкретных настроек.

Но что же такое «токен»? Интересный факт заключается в том, что для английского языка токеном обычно выступают сочетания символов, зачастую совпадающие с короткими словами или часто встречающимися частями слов.

Возьмем, например, английскую панграмму:

“The quick brown fox jumps over the lazy dog”

Напомню, что панграмма — это предложение из минимального числа слов, содержащая в себе все буквы алфавита.

Официальный токенизатор Open AI.

Показывает, что в этом предложении всего 9 токенов, содержащих 43 символа.

Читать далее

Фантастический рассказ «Проект Ч. Суета сует» (10 мин.)

Время на прочтение6 мин
Охват и читатели2K
«Суета сует! –сказал Екклесиаст. – Суета сует, все суета!»
Что пользы человеку от всех трудов его, которыми трудится он под солнцем?
Род проходит, и род приходит, а земля пребывает во веки.

Никто не помнит о живших прежде, и о тех, что появятся позже, не вспомнят те, кто будет жить после них.

Екклесиаст 1:2


image

Воздух на Хароне мне совершенно не понравился. Я сделал первый шаг и невольно поморщился. Пахло озоном и неестественной приторной свежестью, как всегда пахнут миры с незавершённым терраформированием. Ну, вы понимаете, что я имею в виду… Я закашлялся и ускорил шаг.

Читать дальше →

Фантастический рассказ «Спасение» (10 мин.)

Время на прочтение12 мин
Охват и читатели5.8K
Я всегда любил Родину и ненавидел её врагов. Например, айсов. Трудно передать словами, весь поток чувств, переполняющих меня, когда я слышу слово Родина. Это и восторг, и острота в груди и радость, и боль. Я люблю Родину. Не фанатично — без раздумья, без оглядки. Я люблю Родину осознанно. Я могу объяснить свою любовь, я могу доказать свою любовь, я могу отстоять свою любовь, и я готов защитить свою любовь. И я её защищаю… каждый день.

image

Художник Валерий Шамсутдинов
Читать дальше →

Выбор школы при переезде в США

Время на прочтение5 мин
Охват и читатели43K
Многие люди с детьми, планирующие переезд в США, слышали о необходимости тщательно выбирать район проживания. Особенно важно понять, какие школы относятся к выбранному адресу.

После переезда голова обычно идет кругом и нет времени разобраться в тонкостях. Важно понимать и помнить следующее: сайты агентств недвижимости и агрегаторы типа Zillow, не дают актуальной и корректной информации о принадлежности конкретного адреса к конкретной школе!

Ниже предлагается пошаговая инструкция по определению школ, привязанных к конкретному адресу и анализу этих школ.

image
Читать дальше →

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность