Pull to refresh
8K+
8
Pavel Lepin@WhiteBehemoth

User

8,9
Rating
2
Subscribers
Send message

Рынок 2027: что будет и почему

Я бы к тенденциям будущего добавил "ИИ безопасность". С внедрением нового всегда идут новые риски. А тут риски от внедрения ИИ у себя + риски от внедрения ИИ у хакеров...

я начал было подобный коммент писать, но бросил. Хотя так подробно всё равно бы не получилось.
По сути статья - мусорная, похоже на выдержку из личного чата "стоит ли мне переходить с OpenClaw".
Если уж автор хотел поделиться, можно было просто новость/пост сделать и дать ссылку на readme на вполне хорошем русском. https://github.com/nextlevelbuilder/goclaw/blob/dev/_readmes/README.ru.md

Что-то учитывается (то есть как я понимаю, это не просто сравнение объёма доступной видео памяти и размера весов). Но вот что именно, - я не смотрел. Но думаю, закладываются "не сильно".

 LM Studio есть очень полезная функция - при загрузке модели она автоматически подсказывает версию с оптимальной квантизацией для вашего железа

в Hugging Face в профиле можно ввести своё железо, а потом в карточке модели видеть, какое квантование влезет в GPU (зелёная точка), а какое - нет (красная).

Скрытый текст

llama.cpp ...

Минусы - Терминал. Не все готовы с ним работать.

так пишет какая-нить LLM, обученная на данных до ноября 2024 года (когда у LLama.cpp вышел уже нормальный Web UI)

В апреле 2026, Web UI у llama.cpp - быстрый, функциональный, с поддержкой переключения моделей, подключения MCP серверов, истории чатов и других настроек.

Хорошая статья. На мой взгляд, наглядно показывающая, что LLM - не магия, а инструмент. И использовать его нужно так же, как и раньше, про любом улучшении бизнес процесса. Типа

  1. понять, какие метрики мы улучшаем, выраженное через измеряемое (быстрее, дешевле, надежнее), а не абстрактное "удобнее".

  2. метрики контроля процесса и результата

  3. стоимость внедрения всего этого (ожидаемая, понятно)

Количество часов на русском для до-обучения прямо радует. Качество генерации - на отлично, акцента нет, знаки препинания держит. Жаль, что ударения через "+" поставить нельзя на омографы. Заявлена поддержка phonemes, но не указан формат.

И API ни у кого не бесплатный. Если делаешь что-то своё, надо или платить за токены, или ставить локально. Так что "доступ в интернет" не решает всех проблем.

GigaChat, QWen, DeepSek Gogle Ai решают все проблемы

... в рамках настроенной цензуры/безопасности.

а вот Uncensored модель в локальной установке, можно спрашивать о чем хочешь.

можно даже и без службы, просто postmessage / sendmessage через старый ламповый Inter-Process Communication (IPC)

(ред: пропустил детали, "просто", при такой задачи не получится).

Это - вполне рабочее решение. Проверено на себе. (не сейчас, 10+ лет назад) И да, поначалу жутко бесила необходимость писать java/c/псевдо код на бумаге. Но по факту - было намного более продуктивно, чем первая "вышка" за 10 лет до того, с красивыми распечатками "самостоятельных" работ.

И нет универсального алгоритма определения "ключевых вопросов". Особенно в отрасли, где каждый год вносит существенные коррективы в индустрию.

я опоздал на 3 минуты, чтоб он был первым комментом, было бы красивее...

так-то в https://habr.com/ru/docs/companies/design/ отдельной стройкой советуется Типограф как раз для длинных тире.

dotnet (hosted app), на базе https://github.com/microsoft/agent-framework. В идеале, если сильно тормозить не будет - положу на старенький rPI 3b. Общение - телеграм бот. У агента есть доступ к дом. сети, sqlite для памяти и фактов, web поиск, напоминалки (разовые и и по графику). Это то, что уже есть.
Еще в хотелках добавить аналитики по своим документам через RAG, тут я еще думаю о вариантах.

для оценки полученных знаний есть решение простое и очевидное. Повысить веса и частотность письменных работ. Тогда и разницы особой не будет как писалась "домашняя" работа - если студент имея только бумагу и ручку хорошо отвечает на ключевые вопросы - знания есть.

Заодно и запоминать материал стимула больше.

спасибо за статью, за открытый код и отдельное - за реализацию не на питоне.

проголосовал за крон-таски - и безопасно, и несложно в реализации и добавляет функционала. Но это - со стороны стороннего наблюдателя, я, пользуясь постулатом "написать агента может каждый", - пишу своего, под себя.

задачи, типичные для руководителя среднего звена (команда 5–30 человек). Промпты написаны так, как пишет реальный менеджер – без оптимизации, без специальных техник. Это показывает, как инструмент работает при повседневном использовании.

Я бегло просмотрел странице, но не нашел, примеров самих вопросов. Есть ли где-то список (или пример) тестовых заданий?

Хотел попробовать, было интересно качество STT, но программе нужен Soniox API и нет опции просто транскриптера.

Скажите, вы просто направляете поток в распознавалку или сами бьете на фразы по паузам?

Надо все делать хорошо и не делать плохо. Читать белую книгу и не читать черную. И все, человечество в безопасности.

Спасибо за мудрые мысли, записал в книжечку.

1
23 ...

Information

Rating
875-th
Location
Montreal, Quebec, Канада
Date of birth
Registered
Activity

Specialization

Десктоп разработчик, Бэкенд разработчик
Ведущий
C#
.NET
SQL
Git
Docker
CI/CD
Python
ООП