Как стать автором
Обновить
1
0

Пользователь

Отправить сообщение

Синтаксический анализатор — модифицированный Shunting Yard

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров289

Алгоритм синтаксического анализа кода на основе Shunting Yard — скажем "нет" рекурсии

Преимущество модифицированного Shunting Yard над рекурсивным спуском заключается в его способности эффективно работать с более сложными синтаксическими конструкциями и грамматиками, которые не поддерживаются рекурсивным спуском. Благодаря использованию стеков для управления состояниями и операторами, алгоритм избегает проблем с глубокой рекурсией и может обрабатывать конструкции, требующие динамического изменения контекста. Это делает его более универсальным и производительным решением для построения абстрактного синтаксического дерева (AST) без ограничений на тип грамматик, характерных для рекурсивного спуска.

Читать далее
Всего голосов 4: ↑3 и ↓1+6
Комментарии0

Устранение галлюцинаций в LLM

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров6.8K

Поговорим о том, почему LLMs говорят неправду и как это исправить

Перевод статьи Сергея Саввова.

Large Language Models (LLMs) на данный момент могут генерировать быстрые ответы на различные запросы пользователя. Однако их склонность подтасовке фактов (или галлюцинациям) порой подрывают доверие.

Читать далее
Всего голосов 8: ↑8 и ↓0+8
Комментарии6

Синдром информационной усталости: болезнь, которой (пока) нет в МКБ

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров27K
Недуг, которого причину
Давно бы отыскать пора…

/А.С.Пушкин/


Помните шутки вроде: «Ну откуда столько вирусологов, хорошие же биржевые аналитики были»? В каждой шутке есть доля правды: многие из нас не просто потребляют новости, но и пытаются разобраться в проблеме. Никого не удивляет, когда в кафе сидят филолог, кредитный специалист, капитан полиции и все они вместе спорят до хрипоты, цитируя PubMed, Lancet и обсуждая рекомбинантные вакцины. С другими темами происходит примерно то же самое с поправкой на эмоциональный компонент или личный опыт (как, например, в биржевом деле). Однако за такой осведомлённостью, включённостью и эрудированностью скрывается коварная штука, которую некоторые эксперты называют синдромом информационной усталости. Всё линейно: мы живём в сверхмощном информационном потоке, потребляем колоссальное количество контента и постепенно перегружаем свой центральный процессор. Который, как известно, любит отдыхать и готов буквально принудить нас к передышке. Конечно, не чума XXI века, но та ещё пандемия. 


Читать дальше →
Всего голосов 40: ↑37 и ↓3+51
Комментарии29

Как (быстро) сделать русский локальный ChatGPT

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров41K

Эта история началась в начале марта этого года. ChatGPT тогда был в самом расцвете. Мне в Telegram пришёл Саша Кукушкин, с которым мы знакомы довольно давно. Спросил, не занимаемся ли мы с Сашей Николичем языковыми моделями для русского языка, и как можно нам помочь.

И так вышло, что мы действительно занимались, я пытался собрать набор данных для обучения нормальной базовой модели, rulm, а Саша экспериментировал с существующими русскими базовыми моделями и кустарными инструктивными наборами данных.

После этого мы какое-то время продолжали какое-то время делать всё то же самое. Я потихоньку по инерции расширял rulm новыми наборами данных. Посчитав, что обучить базовую модель нам в ближайшее время не светит, мы решили сосредоточиться на дообучении на инструкциях и почти начали конвертировать то, что есть, в формат инструкций по аналогии с Flan. И тут меня угораздило внимательно перечитать статью.

Читать далее
Всего голосов 70: ↑69 и ↓1+88
Комментарии54

Информация

В рейтинге
Не участвует
Откуда
Россия
Зарегистрирован
Активность