Вот именно, почему нет? Почему "Безумное ничто" не может считать, что обладает сознанием? И в своем безумии искать следы сознания у своих галюцинаций. Я про это и говорю.
Золотые слова. В идеале магия должна съежится до размеров электрона, который дергает транзистор в процессоре. А все что выше должно быть понимаемо и объяснимо. Хотя бы на уровне концепций.
OpenAI сами поверили в свою телегу про масштабирование, а инвесторы им дали денег проверить гипотезу. Китайцы в условиях ограниченных ресурсов выдают гораздо более эффективные решения.
Если речь про меня - то для меня - это не гипотеза, это факт, а вот для тебя существование моего сознания - это непроверяемая гипотеза, я могу быть например, твоей галлюцинацией (или ты - моей). Понятно объяснил?
Такое бывает и безо всяких там ИИ. Вендор показывает красивые презентации, в которых описан весь функционал, который нужен заказчику. ЛПР на основании этих презентаций покупает решение, а потом оказывается, что под капотом там техдолг и О(n2) на реальных данных - формочка со списком открывается минуту, а вендор говорит что это нормально так и должно быть.
Для начала надо прийти к консенсусу по поводу определения. Сложно, знаете ли, исследовать природу явления, для которого и определения общепринятого нет.
Мне одному кажется, что буквально последние пару недель стало появляться все больше "анти-хайпа" по теме ИИ и LLM? То агент кому-то БД в проде удалил вместе с бэкапами, то какой-то блоггер из кремниевой долины рассказывает прохладную историю о том, как компания сократила персонал, а потом за пару месяцев слила на токены бюджет больше чем годовой ФОТ уволенных сотрудников, то Антропик мухлюет с качеством, подсовывая премиум пользователям днищенские модели по цене топовых, а доказать никто не может.
Я думаю перейти с C# на развитие уже зрелого, хорошо документированного Java-проекта не составит труда. Подходы знакомые, вы правильно подметили, ибо .NET развивался подглядывая за Java и беря оттуда лучшее. Другой разговор - это если надо начать проект на Java с нуля. В .NET есть столбовая дорога Visual Studio, ASP.NET, EF... - это всё уже есть из коробки, продуманные, документированные и вылизанные до блеска решения. В Java как сейчас дела обстоят - не знаю, но когда-то давно пытался вкатиться в мир Java-разработки и на каждом шагу были какие-то грабли, начиная c выбора среды разработки. С тех пор испытываю некое отторжение к Java и стараюсь держаться подальше, но это уже личное.
Я не знаю, как у вас сделано, но в обычно в LLM сеть на выходе выдает распределение вероятности следующего токена, а на основании этого распределения сэмплер уже выбирает, какой следующий токен выдать. Можно сэмплер настроить таким образом, чтобы он всегда выдавал токен с максимальной вероятностью, но в общем случае так не делают.
Со стандартными настройками сэмплеров ответ всегда будет носить вероятностный характер. Там прямо в архитектуру генератор случайных чисел заложен. Чтобы получить детерминированный ответ - надо либо фиксированный сид, либо очень нестандартные настройки сэмплеров.
При повторных запросах модели часто используют более высокую случайность генерации (температуру), чтобы выдать не тот же самый ошибочный ответ.
Очень сомнительное утверждение. Я могу конечно себе представить себе обвязку, которая меняет температуру в процессе диалога, но в общем случае это не так.
Забыли добавить?
Вот именно, почему нет? Почему "Безумное ничто" не может считать, что обладает сознанием? И в своем безумии искать следы сознания у своих галюцинаций.
Я про это и говорю.
Золотые слова. В идеале магия должна съежится до размеров электрона, который дергает транзистор в процессоре. А все что выше должно быть понимаемо и объяснимо. Хотя бы на уровне концепций.
OpenAI сами поверили в свою телегу про масштабирование, а инвесторы им дали денег проверить гипотезу. Китайцы в условиях ограниченных ресурсов выдают гораздо более эффективные решения.
Да. Но на выходе какая-то ерунда получается )))
Если речь про меня - то для меня - это не гипотеза, это факт, а вот для тебя существование моего сознания - это непроверяемая гипотеза, я могу быть например, твоей галлюцинацией (или ты - моей). Понятно объяснил?
Такое бывает и безо всяких там ИИ. Вендор показывает красивые презентации, в которых описан весь функционал, который нужен заказчику. ЛПР на основании этих презентаций покупает решение, а потом оказывается, что под капотом там техдолг и О(n2) на реальных данных - формочка со списком открывается минуту, а вендор говорит что это нормально так и должно быть.
Похоже что китайцы, как обычно, смогли в демпинг лучше всех.
По инерции крутится. Но недолго осталось, судя по всему.
Как и само сознание )))
Для начала надо прийти к консенсусу по поводу определения. Сложно, знаете ли, исследовать природу явления, для которого и определения общепринятого нет.
Наличие сознания у кого-либо (чего-либо?) кроме тебя, читатель этого сообщения, это лишь непроверяемая гипотеза. Живи теперь с этим ))
Это ближе к осени я думаю, будет.
Мне одному кажется, что буквально последние пару недель стало появляться все больше "анти-хайпа" по теме ИИ и LLM? То агент кому-то БД в проде удалил вместе с бэкапами, то какой-то блоггер из кремниевой долины рассказывает прохладную историю о том, как компания сократила персонал, а потом за пару месяцев слила на токены бюджет больше чем годовой ФОТ уволенных сотрудников, то Антропик мухлюет с качеством, подсовывая премиум пользователям днищенские модели по цене топовых, а доказать никто не может.
Похоже пузырь начинает сдуваться...
Я думаю перейти с C# на развитие уже зрелого, хорошо документированного Java-проекта не составит труда. Подходы знакомые, вы правильно подметили, ибо .NET развивался подглядывая за Java и беря оттуда лучшее. Другой разговор - это если надо начать проект на Java с нуля. В .NET есть столбовая дорога Visual Studio, ASP.NET, EF... - это всё уже есть из коробки, продуманные, документированные и вылизанные до блеска решения.
В Java как сейчас дела обстоят - не знаю, но когда-то давно пытался вкатиться в мир Java-разработки и на каждом шагу были какие-то грабли, начиная c выбора среды разработки. С тех пор испытываю некое отторжение к Java и стараюсь держаться подальше, но это уже личное.
Я плюсанул. Кажется, что вещь описана очевидная, но текст помечен как простой, для начинающих может быть полезным.
Я не знаю, как у вас сделано, но в обычно в LLM сеть на выходе выдает распределение вероятности следующего токена, а на основании этого распределения сэмплер уже выбирает, какой следующий токен выдать. Можно сэмплер настроить таким образом, чтобы он всегда выдавал токен с максимальной вероятностью, но в общем случае так не делают.
Со стандартными настройками сэмплеров ответ всегда будет носить вероятностный характер. Там прямо в архитектуру генератор случайных чисел заложен. Чтобы получить детерминированный ответ - надо либо фиксированный сид, либо очень нестандартные настройки сэмплеров.
Очень сомнительное утверждение. Я могу конечно себе представить себе обвязку, которая меняет температуру в процессе диалога, но в общем случае это не так.
И подать в суд на рустор за ущемление верующих ))