Обновить
2

Пользователь

-0,1
Рейтинг
Отправить сообщение

гибко настраивать параметры монтирования (например, индивидуальное сжатие для разных каталогов)

Зачем разное сжатие может понадобиться? Есть идеи? Понять могу отсутствие сжатия и сжатие для 2 каталогов (фильмы и jpg не жать). Но разная степень сжатия зачем?

Есть список таких контор? Хочется вайбкодить не заглядывая в код. Вместо тех кто любит заглядывать в код. Приветствую "как только меня заставят писать ллмками, я просто уйду"!

Ваши агенты ищут синтаксические и типизированные баги, но не логические.

Баги бизнес-логики агенты не умеют искать? Или всё же бывают такие агенты и SKILL?

ни один разработчик, которого я знаю, не удалил IDE с рабочего компьютера


Если в Вашем информационном пузыре это так, то попробуйте найти тех кто удалил и тех кто даже не ставил. За ненадобностью. Изначально стартовав как разраб в терминале.

Сколько нужно примеров таких разработчиков, чтобы убедить, что IDE устарели как кареты и брички когда-то (в традиционном смысле, не в смысле IDE for AI Agent = автомобили)?

Пишите свои бенчмарки в комментарии к этой статье.

Добавтье инструкцию по запуску бенчмарка.

Оптимизация парсинга без AVX2.

Интересует avx1 (aka avx-128) и neon в termux

может показаться, что если ИИ пишет код, то учить язык программирования уже не обязательно. На практике всё наоборот. Чем больше кода пишет ИИ, тем важнее уметь этот код читать, понимать и проверять. Если разработчик не знает язык, стек, архитектурные паттерны и принципы проектирования, он не сможет отличить хорошее решение от плохого. Он будет принимать на веру всё, что сгенерировала модель. А это опасно.

ИИ может ошибаться. Может придумывать несуществующие API.

уметь этот код читать? Точно нужно? Много кода. Зачем? Ведь вы учите проверять тестами, разве эти тесты не поймают нагаллюцинированные апишки? Насколько снизилась ценность навыка читать код?

Тот, кто никогда не был квалифицированными специалистами, впадает в эйфорию, воображая, что теперь он может решать задачи, не обладая необходимыми знаниями.

Почему воображая? Решают же задачи. Не обладая знаниями, а только доступом к модели. 10 раз из 10. Быстрее в разы, чем знающие.

Это будет работать до тех пор, пока действительно знающие люди стоят у руля разработок. А вот когда им на смену придут освоившие взаимодействие с ИИ, но не обладающие необходимой квалификацией для трезвой оценки результатов

Модели учатся не у тех кто стоит у руля.
Оценить результат большинстве случаев проще, чем реализовать сложную систему его достижения. Ракета попала в цель - оценить проще, чем спроектировать её.

к моменту публикации уже может частично устареть, или утечь

А как сделать не устаревающий и не утекающий бенч (принципиально)? *Со звёздочкой задача - сохранив при этом воспроизводимость (на уровне отдельных прошлых прогонов). Не публиковать месяцами закрытую часть проверочных данных (только доступ по API) - так себе выход - есть что получше?

берём минимальный чек-лист действий

Все 6 пунктов не страхуют от “бенчмаксинга”. Как застраховать?

Менее процента это не стерильность - сразу смертельной заболеть риск тот же. Суперинфекция возникнет не в быту, а в больничках или сельхоз (антибиотики для набора веса).

Выезды на природу это от энцефалита прививаться надо, не городские инфекции. Другие страны - отдельные прививки, не пересекаются с экономикой заявленных этим фондом 5%.

около 5% жизни человек проводит больным простудой или гриппом

До 2% снизить можно банальным запретом рукопожатий (традиция вредная, из времён варваров).

до 1%, если еще масочки все распространители надевать привыкнут в местах скопления (как в дисциплинированом Китае).

Останется процент по причине скоплений в детсадах и школах, но только в семьях тех, кто вынужден сдавать туда деток ради работы (вместо домашнего обучения и няни). Удалёнщикам - менее процента.


По магазинам и рынкам бродить - тоже нездоровый древний обычай. Здоровая альтернатива -доставка курьерами до двери.

Установку УФ-фильтров в лифтах могу только приветствовать. Ценнее чем бачки для слива в общественных туалетах )

экономию времени видят лишь 13% компаний

Почему время не сократилось? Приятно наблюдать как течет вода, горит огонь, работает женщина и ИИ! Растягивают удовольствие, смакуют )

Самое горькое всплыло в расследовании Time: часть уволенных — технические писатели и инженеры, которых в прошлом году просили документировать рабочие процессы для обучения внутренних ИИ-моделей Oracle. Они помогали учить тот самый ИИ, который затем стал поводом их сократить.

Почему же горькое? Если твоя работа может быть автоматизирована, то туда ей и дорога. Идеально!

>В отличие от Obsidian, AI-ассистент встроен и работает с Ollama для полной приватности.

На llama.cpp насколько просто заменить? Не нашел сходу ответа на этот вопрос. По идее должно быть так же легко как прописать порт (default 8080 llama.cpp) вместо дефолтного олламовского 11434. Оллама не удобна, поскольку меньше контроля и не такая уж она и локальная. По умолчанию оллама ломится в сеть слишком часто, если не запускать сервер с определенными флагами, синтаксис которых мало кто помнит

Qwen3.5-27B был выбран среди других генераторов с открытым исходным кодом по результатам обучения на тестовом наборе данных, охватывающем все типы вопросов...

Как выбор происходил? Среди каких моделек выбирали?

Дистилляция китайцев по сути этот корпус 3,25 млн пар «вопрос-ответ», поскольку судья тоже Qwen 4-миллиардный. Наследует предвзятость выбора данных корпорацией Алибаба. Не прозрачно, ведь они не поделились своими датасетами.

Как Вы думаете, отсекает какие возможности такой однобокий выбор модели генератора? Пробовали ли оценить метриками отсечённые возможности (bias)?

https://huggingface.co/onnx-community/Pleias-RAG-350M-ONNX Fully supported languages include English, French, Spanish, German, Italian, Dutch, Latin and Portuguese.
Язык - Количество Токенов: Английский 808 Б Французский 266 Б Немецкий 112 Б Испанский 46 Б Латинский 34 Б Голландский 29 Б Итальянская 24 Б Польский 11 Б Греческий 11 Б Португальский 9 Б

>Семь из 18 диагнозов оказались, по сути, переоткрытиями: опасный вариант уже значился в открытых базах данных, но не попал в ту карту пациента, которую изучала команда. Это показывает, что дело часто не в нехватке знаний, а в том, что данные о больном разбросаны по разным базам с несовместимыми форматами, и собрать их вместе вручную тяжело даже специалисту.

То есть генеративный ИИ не нужен по сути, а достаточно бардак в данных упорядочить (алгоритмически + традиционной инфраструктурой, без ИИ). Только как дополнительный эшелон помог, избыточность.

>предположила, что в этом месте генома не хватает целого фрагмента, — состояние, известное как синдром ДиДжорджи. Догадку подтвердило повторное прочтение

Не всякая семья заплатит за повторное секвенирование. Часто обрывается диагностический поиск на нежелании пациентов доп анализы проводить. Хотя уже на финишной прямой, только подтвердить находку, сделанную ин-силико.

>вариантом, его признавали болезнетворным

"патогенным" переводить на русский лучше, устоявшийся термин в классификациях. Болезнетворный это по бытовому (+ коннотации с инфекциями)

>o3 заметила цепочку плохо прочитанных участков на 22-й

а человек почему не заметил? Человеческий фактор - ошибка специалиста в рутинном контроле качества? Нет ничего прорывного, никаких открытий не сделала нейросеть, просто лишний глаз по рутинному чеклисту. Не тянет на "раскрыть" в смысле научного открытия.

>Чем больше будет выявлено и исправлено дыр в датасете - тем лучше она будет генерить код.

Пайплайн верификации автоматом не пробовали развернуть? Алгоритмический, детерминированными инструментами желательно, а не вероятностными.

Тогда есть шанс расширить датасет с 3500 до миллиона или сколько есть компьюта на верификацию. Верификатор бутылочным горлышком станет, а не человек, курирующий датасет.

возможно здесь найдутся люди, которые дадут хорошие советы по реализации моих идей.

14B-модель. При контексте max_seq_length = 4096 (необходимо для длинных скриптов) я столкнулся с OOM

Заменить токенизатор не пробовали?

Нужен меньшего размера словарь в токенизаторе (выкинуть иероглифы, оставить минимал рус, англ и все идиомы этого специфического языка). Такой словарь с идиомами языка позволит полностью покрыть весь доменно специфический язык. Вместо max_seq_length = 4096 использовать seq_length = 512 покрывая длинные конструкции языка.

>На саму тренировку: написание скриптов, создание среды, выставление настроек и выбор модели у меня ушла пара дней. На составление датасета - 2 мес

Освободить от рутины - говорили они.. )

Рутины как раз прибавилось с появлением ЛЛМ, творческие(ака требующие фантазии, немножко галлюцинаций высокотемпературных) задачи берут на себя, а людям оставляют рутину. Терпеливая кропотливая вычистка данных для дообучения.

"как ни странно, выбор файлов из репозиториев с более чем 5 тысячами звезд на GitHub значительно снижает производительность"

https://arxiv.org/abs/2301.03988

1

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Инженер по производительности, Инженер по обеспечению качества
Linux
Bash
Высоконагруженные системы
Базы данных
Английский язык
AWK
Rust
Julia