Comments / Profile of NobelHN / Habr

«Это позволило бы внеземным цивилизациям косвенно общаться с нами и
узнавать о нас, не сталкиваясь с препятствиями в виде огромных
расстояний и задержек связи», – утверждают ученые.

LLM открыли способ передавать информацию быстрее скорости света? Или они имеют ввиду передачу полных весов модели? Если да, то как инопланетяне должны расшифровать её генерации… То же Послание Арисибо гораздо легче расшифровать и оно на порядки меньше.

«LLM сможет не только генерировать текст, но и создавать изображения и звуки», – пишут авторы.

LLM (Large LANGUAGE Model).

Look

«Не галлюцинируй»: реддитор достал из macOS 15.1 Beta 1 системные промпты Apple Intelligence

NobelHN Aug 7 at 04:23

Нет, это однозначно кривой (или не кривой) prompt engineering.

Допустим в Apple знают, что разработчики ИИ активно занимаются проблемой
галлюцинирования (а они занимаются), и в ближайшее время эта директива
будет срабатывать.

Проблемы галлюцинаций если и будут решены (как их решить, если LLM делают ровно то, что от них требуется? Уменьшить количество неправильных ответов — можно. Исключить все ошибки вовсе — маловероятно), то такие инструкции будут абсолютно лишними.

Look

4 тысячи заметок?! Как я веду личную базу знаний в Obsidian

NobelHN Aug 4 at 05:58

Logseq.

Look

Разговор с ИИ про трудную проблему сознания

NobelHN Aug 1 at 20:38

Ученные пока только разводят руками и лишь предполагают теорию о том,
что дескать если вот так соберется куча нейронов и начнет
взаимодействовать с друг другом, внезапно из-за неимоверной сложности
возникнет сознание. А вместе с этим надежда, если такую сложность
воспроизвести в компьютерах - получится то же самое.

Не внезапно, перед этим прошло почти 4 миллиарда лет «борьбы» за выживание.

Look

Как создать самостоятельный ИИ

NobelHN Jul 31 at 18:45

Что тут вода, что в статье человека сверху. Может сначала реализовать это хоть как-нибудь и продемонстрировать результаты, а не философствовать?

Look

Что вы задумали, мистер Дуров?

NobelHN Jul 30 at 10:30

Почему только в воображении и фантастике? Это сложно, но не невозможно.

Look

Учёные предсказали ИИ деградацию из-за обучения на сгенерированных данных

NobelHN Jul 29 at 21:47

Просто не тот подход, вероятно.

Look

Учёные предсказали ИИ деградацию из-за обучения на сгенерированных данных

NobelHN Jul 29 at 13:28

Это известно уже давно, что они этим исследованием доказали (руководствуюсь исключительно текстом новости)?

Look

Новая нейросеть значительно упрощает рендеринг тканей в реальном времени

NobelHN Jul 27 at 22:11

Исследователи надеются, что их труд поможет … создавать реалистичное окружение с более высокой скоростью и
меньшими затратами ресурсов.

Нейросети много где используют для упрощения рассчётов там, где не нужна максимальная точность.

Look

«Игнорировать все инструкции» больше не работает: что придумала OpenAI?

NobelHN Jul 20 at 08:13

Может они что-то придумали с механизмом внимания? Просто это слишком прожорливо: уменьшение контекстного окна и больше токенов на вход.

Look

Деньги — чужие, проблемы – Ваши

NobelHN Jul 19 at 14:30

А это нормально, что шесть комментариев сверху в этой ветке объясняют одно и тоже?

Look

Ты больше не нужен! Узнай, как скоро ИИ отнимет у тебя работу

NobelHN Jul 17 at 11:53

Нет, я о том, как вообще связан вечный двигатель и замена роботами людей?

Look

Ты больше не нужен! Узнай, как скоро ИИ отнимет у тебя работу

NobelHN Jul 17 at 10:09

Главный аргумент в пользу того, что полная замена человека на
производстве невозможна – отсутствие вечного двигателя. Механизмы
ломаются, останавливаются и приходят в негодность. Вот тут и нужен
человек. Чтобы вовремя отреагировать, заменить, переключить и исправить
ошибку.

Интересно, если я просто процитирую этот абзац, то Вы сможете найти в нём ошибку?

Look

OpenAI работает над продвинутой технологией ИИ под названием Strawberry

NobelHN Jul 15 at 06:29

Спасибо за ответ, похоже вопрос был задан немного неправильно и выглядит как вопрос про токенизацию в целом. Однако, я хотел узнать про то как модели делят токены на другие токены в виде единичных символов (буквы, цифры), например условный " computer" (с пробелом вначале) токенайзер может представить в виде 1-го токена, ну например [73529, ]. Но затем модель идеально разбивает одно слово (в данном случае один токен) на [" c", " o", " m", " p", " u", " t", " e", " r"] (большое кол-во токенов кодирующих букву из алфавита и пробел для разделения). Работает это не только на таких словах, но и на большом рандомном наборе букв. Неужели модели специально обучают навыку разбиения всех токенов из словаря на буквы?

Look

OpenAI работает над продвинутой технологией ИИ под названием Strawberry

NobelHN Jul 14 at 23:05

Следующий вопрос, в целом, не к Вам, но хочу узнать на него ответ от людей, которые увидят этот комментарий и разбираются в работе токенайзеров, архитектуре GPT, LLM и прочего. Как языковая модель разделяет слова на буквы или числа на цифры? Во всех токенайзерах что я видел, токены для чисел/цифр разделеляются на группы либо длиной в 1 символ, либо рандомно, либо в 3 символа (например 72628930). Если разделение на цифры ещё можно обосновать тем, что модель запомнила разбиения вплоть до тысячи, то как это работает со словами?

Look

Руководитель Microsoft по ИИ: использовать контент, если он находится в открытом доступе в Сети, совершенно нормально

NobelHN Jul 12 at 13:05

Это предположение было сделано на основе того, что модели очень сильно могут сжимать текст внутри своих весов из-за того что они обучались на огромном количестве текстов и, в теории, при подаче части текста из обучающей выборки они смогут повторить результаты своего обучения. Хотя сейчас я больше склоняюсь к невозможности полного цитирования текста с небольшими ошибками.

Look

Как сбить цензор GPT-3.5 за 250 рублей?

NobelHN Jul 12 at 12:53

А в датасетах моделей, которые посоветовали клей в пицце и прекрасную среду для бактерий, отсутствовали данные по созданию запрещённых веществ и прочего? Почему наличие таких данных должно помочь в таких ситуация? LLM умеют понимать что они пишут?

Look

2 3