Pull to refresh
9
0
Send message

На скрине выбран режим Balanced. Я написал про Precise (по-русски "Точный"). В нем он стабильно дает правильный ответ.

Зачем мне что-то подделывать, что за глупость? У вас Copilot стоит в режиме Creative, измените на Precise и пробуйте снова. Я об этом уже писал выше.

Именно по этому вопросу есть множество подтверждений среди пользователей на GitHub и на Reddit.

А можно увидеть хотя бы одну ссылку на достоверное подтверждение? Или привести хотя бы один достоверный повторяющийся пример различий, который можно воспроизвести?

Ответ Copilot с первого же раза корректный:

Вы понимаете, что у Copilot есть разные режимы и разные ответы в соответствии с ними? А так же осознаете, что даже GPT-4 может варьировать свои ответы из раза в раз, иногда отвечая неправильно? Ваш пример, получается, подтверждает, что используется GPT-4? Есть еще примеры? (к слову, на мои личные бенчмарк вопросы GPT-4 и Copilot отвечает почти всегда одинаково, в отличии от GPT-3.5, которая стабильно допускает больше ошибок и неточностей)

Это можно проверить с помощью вопросов, на которые реальный GPT-4 даёт правильные ответы.

Можно пример таких вопросов, позволяющих однозначно увидеть, что Copilot это не GPT-4?

Copilot использую как в боковой панели Windows, так и на непосредственно сайте Bing. Это тот же самый переименованный Bing Chat.

Я пару месяцев назад сравнивал GPT-4, Bing Copilot и GPT-3.5 на списке личных бенчмарк-вопросов, по которым пытаюсь отслеживать качество начиная с GPT-3. GPT-4 и Bing Copilot (режим "стандартный" и "точный") отвечают одинаково. GPT-3.5 им уступает.

gpt4 используют по полной слабую gpt3.5 (которая не скрываясь пишет что основана на данных 2021г)

Ограничение данных до 2021 года не является свидетельством использования GPT-3.5. Цитата с сайта OpenAI:

"GPT-4 generally lacks knowledge of events that have occurred after the vast majority of its data cuts off (September 2021), and does not learn from its experience."

Так что хоть 3.5, хоть 4 используют датасет, ограниченный сентябрем 2021. Более актуальными данными обладает лишь GPT-4 Turbo.

Есть какие-то еще доказательства того, что Bing Copilot хотя бы иногда использует GPT-3.5?

ChatGPT не разумен. Он не демонстрирует даже минимальных признаков сильного интеллекта, даже намёков на него. Мы понятия не имеем, удастся ли нам создать сильный AI, и если да, то когда — но ChatGPT от него столь же далёк, сколь далеки калькулятор и экскаватор.

Он просто очень хорошо предсказывает, какое слово надо поставить следующим во фразе, чтобы человеку эта фраза казалась правильной.

Отвечает Илья Суцкевер, ведущий инженер OpenAI:

Есть еще один комментарий, который я бы хотел упомянуть — о том, что эти модели просто обучаются статистическим закономерностям, и поэтому они не знают, какова настоящая природа мира. Я считаю иначе. Я думаю, что изучение статистических закономерностей — это гораздо более глубокая вещь, чем кажется на первый взгляд. Предсказание — это статистическое явление. Но чтобы предсказывать, нужно понимать глубинный процесс, который породил данные — вам нужно все больше и больше понимать мир, который стоит за ними. Если наши генеративные модели станут очень хорошими, то они будут обладать, как я считаю, шокирующей степенью понимания мира и всех его тонкостей. Да, это будет мир увиденный через призму текста. Модель будет знать все больше и больше о мире через проекцию мира на пространство текста, выраженного человеческими существами в Интернете. Но этот текст выражает настоящий мир.

***

Если задуматься, то что значит достаточно хорошо предсказать следующий токен? На самом деле этот вопрос гораздо глубже, чем кажется. Хорошее предсказание следующего токена означает, что вы понимаете лежащую за ним реальность, которая привела к созданию этого токена. Хотя это и статистика, но что за статистика? Для того, чтобы впитать эту статистику, чтобы сжать ее, вам нужно понять, что именно в мире создает этот набор статистических данных. И это требует настоящего понимания мира.

***

Я хотел бы привести аналогию, которая, надеюсь, прояснит, почему более точное предсказание следующего слова приводит к большему пониманию — настоящему пониманию. Давайте рассмотрим пример. Скажем, вы читаете детективный роман со сложным сюжетом, сюжетной линией, разными персонажами, множеством событий и загадками и подсказками. Все непонятно. Затем допустим, что на последней странице книги детектив собрал все улики, собрал всех людей и говорит: «Я собираюсь раскрыть личность того, кто совершил преступление, и этого человека зовут...» И предсказывает имя убийцы. Предсказывает единственное правильное слово! Было много разных вариантов, много разных имен, [но было выбрано единственно верное]. Таким же образом, все более точное предсказание слов, требует все более глубокого понимания текста [и стоящей за ним реальности].

Оригинал ответа:

There is another comment I want to make about which is that these models just learn statistical regularities and therefore they don't really know what the nature of the world is.

I have a view that differs from this. I think that learning the statistical regularities is a far bigger deal than meets the eye.

Prediction is a statistical phenomenon. Yet to predict you need to understand the underlying process that produced the data. You need to understand more and more about the world that produced the data.

As our generative models become extraordinarily good, they will have, I claim, a shocking degree of understanding of the world and many of its subtleties. It is the world as seen through the lens of text. It tries to learn more and more about the world through a projection of the world on the space of text as expressed by human beings on the internet.

But still, this text already expresses the world.

***

Because if you think about it, what does it mean to predict the next token well enough? It's actually a much deeper question than it seems. Predicting the next token well means that you understand the underlying reality that led to the creation of that token. It is statistics but what is statistics? In order to understand those statistics to compress them, you need to understand what is it about the world that creates this set of statistics?

***

So, I'd like to take a small detour and give an analogy that will hopefully clarify why more accurate prediction of the next word leads to more understanding - real understanding. Let's consider an example. Say you read a detective novel with a complicated plot, a storyline, different characters, lots of events, and mysteries like clues. It's unclear. Then let's say that at the last page of the book, the detective has gathered all the clues, gathered all the people, and is saying, "Okay, I'm going to reveal the identity of whoever committed the crime, and that person's name is..." Predict that word. Predict that word exactly! My goodness, right? Yeah. Now, there are many different words, but by predicting those words better and better and better, the understanding of the text keeps on increasing. GPT-4 predicts the next word better.

Невозможно каждый раз "просто правильно вставлять слова и фразы", не обладая при этом пониманием лежащих за словами паттернов, которые, в конечном итоге, отражают реальный мир. Вы совершаете ту же ошибку, что совершил Сёрл со своей "Китайской комнатой". Команта, включающая человека, как система в целом, в действительности, понимает китайский.

закаливание позволяет реже болеть ОРВИ, но более основательные исследования этого не подтверждают.

Можно ссылку на "более основательные исследования" по этому поводу? Я с ходу нашел одно и другое, как раз опровергающие цитату. А исследований подтверждающих с ходу не обнаружил.

А вот что отвечает на ваши каверзные вопросы AI чат от Bing, основанный на той же самой GPT-3

Самая простая доказано универсальная машина Тьюринга - это Wolfram's 2-state 3-symbol Turing machine. Интересно, насколько сложно выглядела бы симуляция процессора на ней и какое было бы сравнительное быстродействие? И какие есть возможности для симуляции на ленте ограниченной длины? (может быть, на какой-нибудь замкнутой кольцевой ленте?). По идее, это было бы универсальное вычислительное устройство, на основе самых простых принципов (проще уже быть не может).

А Western Union, оказывается, основан монгольскими менялами, не знал, не знал...

Отправить 10 баксов из Тюмени в Берлин с помощью WU вы сегодня не сможете.

Вот здесь есть довольно подробный гайд для разных ОС. Для Android есть приложение с уже готовыми пресетами - достаточно их выбрать из списка. Можно для начала попробовать именно его.

Ну и еще хочу добавить, что если уж провал действительно вызван какими-то физиологическими особенностями конкретного уха и интерференцией, то убирать его и не нужно, так как он будет естественен для конкретного человека. Нет в этом проблемы.

Конвертация в mp3 тоже дает невосполнимые потери энергии и информации в исходном сигнале. Весь вопрос в их слышимости. А в нашем случае в том, может ли режекторный фильтр быть заменен обычным пиковым без слышимых изменений на музыкальном сигнале.

А вообще, это все теоретический разговор и придирки, мало относящиеся к практике. Все тезисы в статье основаны на конкретных исследованиях, на практике.

для п.2 у вас нет и не будет пруф. ссылок на англ.яз. источники - ибо ваше утверждение ложно.

Глава 19.2.1 The Audibility of Resonances из книги Sound Reproduction: The Acoustics and Psychoacoustics of Loudspeakers and Rooms:

Слышимость пиков с добротностью 50 начинаются на музыкальном сигнале аж от 10 дБ для частоты 200 Гц. При этом "dips are less noticeable than peaks and that narrow interference dips would be the least noticeable of all". Узкополосные спады детектируются еще хуже пиков. И чем уже пик или спад, тем хуже его слышимость. То есть, слух имеет встроенный сглаживающий фильтр, или, точнее говоря, работает как FFT анализатор (вероятно потому, что количество сенсорных "волосков", приходящихся на каждую частоту в улитке, и их чувствительность - ограничены).

Поймите если синус просто сам с собой сложился в протиофазе то он просто пропал и НИКАКИМИ ушами вы его не услышите и даже вольтметром не измерите и на осцилографе не увидите.

Речь идет о слышимости на музыкальном сигнале, а не отдельном синусе. Так что все эти рассуждения про пропавший синус просто не имеют отношения к вопросу. Для практики, предлагаю вам определить, в каком из файлов по ссылке был применен notch filter с параметрами f = 300 Hz и Q = 1, а где простой peaking filter с параметрами f = 300 Hz, Gain = -34 dB и Q = 7. Надеюсь на вашу честность. Ну и сами поэкспериментируйте с разницей в слышимости notch фильтра и обычного пикового в музыке. И сделайте выводы.

Если у вас проблемы с английским, то наймите переводчика, пусть переведет вам эту часть интервью.

По поводу проблем с фазой я уже писал: можно посмотреть здесь. Или почитать здесь. Пусть переводчик вам поможет и с этим.

Мой тезис - наушники нелинейная система и нельзя скомпенсировать их влияние с помощью линейного фильтра.

Нелинейные искажения, для большинства современных наушников, не являются проблемой, так как находятся за пределами слышимости на музыкальном сигнале. Звучание большинства современных наушников может быть значительно улучшено эквалайзером, независимо от цены. Учите английский, изучайте исследования.

Как вы со сглаживание 1/6 октавы собрались рассматривать пики на АЧХ? Вы в курсе что все графики АЧХ имею сглаживание, да в добавок довольно сильное 1/3 октавы, 1/6 октавы и т.д.

  1. В зависимости от измерительного комплекса, уровень сглаживания можно установить самостоятельно. Например, в бесплатном REW - хоть до 1/48 октавы.

  2. Человеческий слух и сам обладает свойствами сглаживающего фильтра.

  3. Проблема высосана из пальца (наверное, если только мы не имеем дело с самодельными наушниками из говна и палок).

  4. Показываю уже в который раз, как реально измеренные импульсные характеристики и ступеньки предсказываются с помощью одной лишь сглаженной АЧХ: Пример 1 Пример 2 Пример 3 Пример 4

Вы по факту так сами себе противоречите.

По АЧХ я легко увижу пик на 10 кГц или спад ниже 50 Гц. По виду же импульсной характеристике их определить будет крайне сложно. При этом, в случае наушников, никакой иной полезной информации она не содержит. Поэтому гадания по ней - бессмысленны. Так понятно?

Information

Rating
Does not participate
Registered
Activity