О да, причем не только технические лендинги, этим страдают практически все. Открываешь там что то про продукт, награды, премии и куча всего что пользователь который заинтересован уже ищет во вкладке характеристики. Порой доходи до абсурда - я вижу какой то революционный продукт (электронный прибор) читаю и не могу понять что это вообще такое :)
Очень полезно. Сохранил себе, завтра для Линкедин на этой основе тоже пост напишу, а то там каждый второй скиллы бесплатно впаривает пользователям и сколько им не говори что это не безопасно но там хоть колом чеши +
А пока платить будет пользователь которому не хватало 20$ для работы и он создавал еще пару мультиаков и тратил 60 он будет платить 200$. А чтобы “закомнадзорится” надо хотя бы две вещи - чтобы Claude (Anthropic) начал предоставлять свои услуги в РФ, а OpenAI начал принимать платежи с РФ - так что пользователям из РФ максимально фиолетово на эти требования, потому что компании сидят на локальных обученных моделях, а пользователям вполне достаточно QWEN которые легко уделал ChatGPT и предпоследние модели Claude на бенчах.
Antropic не сможет отключить вам QWEN CODE - потому что разработкой модели Qwen (Tongyi Qianwen) и всех связанных с ней инструментов, включая Qwen Code, занимается лаборатория Tongyi Lab, которая является частью Alibaba, которая ни имеет никакого отношения в американской компании. На Хабре набег ботов судя по комментам
Описанные проблемы с преобразование текста в RAG и дальнейшая настройка и адаптация - это самая приятная работа для тех кто работает с RAG по тех. документации. Просто праздник для разработчика. Почему? Потому что в большинстве случаев работа по документации напоминает лютый трэш. Допустим заказчик передает тебе документацию на 2000 страниц в PDF и она содержит не просто текст, а еще формулы LaTeX по которым высчитываются какие либо параметры которые в PDF вообще как изображение а не полноценная таблица. Это просто вынос мозга - и тут вручную их надо конвертировать в ASCII формат для эмбендинга, а потом прописывать, вывод в нормальном виде при обнаружении по запросу. Также там присутствуют диаграммы Mermaid которые частенько отображают последовательности действий, например определения кода ошибок оборудования, шаги тестирования и.т.д. - и тут опять - “ручками” :) Ну конечно же программные коды для проведения диагностики и\или настройке или программированию устройства. Так вот - это нельзя так просто нарезать на чанки, и вот тут начинается истинная жесть. Поэтому выражаю огромную благодарность тем производителям которые создают документацию в markdown формате. Это конечно не панацея - но серьезно ускоряет процессы “обогащения” корпоративной RAG
Если ваш финдир увидит такой коммент он реально сократит время доставки, вашей зарплаты, причем может даже оптимизировать и исключить должность сотрудника который не понимает кто и за что в компании отвечает и какие несет обязаности.
А потом придет CISO и скажет - теперь с вас 200% к расходам на проверку вашего AI который надо валидировать на соответствия отраслевым нормам, правилам и законам.
Отлично, ждем несколько дней, а оказывается что это было критическое обновления безопасности и пока ты не сном и духом, а твой “пакетчик” ждал заданный промежуток времени - у тебя слили базу, поставили бэкдор и воткнули майнер.
Ближайшие реалии, после того как Майкрософт внедрит Windows Agent Runtime (WAR)
Отличная работа. Здесь закончилась карма для лайка - поставил звездочку в репо.
Шикарный разбор, благодарствую, очень актуально и доходчиво.
-2400 “запой” - это ПЯТЬ ! :)
О да, причем не только технические лендинги, этим страдают практически все. Открываешь там что то про продукт, награды, премии и куча всего что пользователь который заинтересован уже ищет во вкладке характеристики. Порой доходи до абсурда - я вижу какой то революционный продукт (электронный прибор) читаю и не могу понять что это вообще такое :)
Благодарю, как раз искал список живых форумов для тестов
Очень полезно. Сохранил себе, завтра для Линкедин на этой основе тоже пост напишу, а то там каждый второй скиллы бесплатно впаривает пользователям и сколько им не говори что это не безопасно но там хоть колом чеши +
А пока платить будет пользователь которому не хватало 20$ для работы и он создавал еще пару мультиаков и тратил 60
он будет платить 200$. А чтобы “закомнадзорится” надо хотя бы две вещи - чтобы Claude (Anthropic) начал предоставлять свои услуги в РФ, а OpenAI начал принимать платежи с РФ - так что пользователям из РФ максимально фиолетово на эти требования, потому что компании сидят на локальных обученных моделях, а пользователям вполне достаточно QWEN которые легко уделал ChatGPT и предпоследние модели Claude на бенчах.
Antropic не сможет отключить вам QWEN CODE - потому что разработкой модели Qwen (Tongyi Qianwen) и всех связанных с ней инструментов, включая Qwen Code, занимается лаборатория Tongyi Lab, которая является частью Alibaba, которая ни имеет никакого отношения в американской компании. На Хабре набег ботов судя по комментам
Описанные проблемы с преобразование текста в RAG и дальнейшая настройка и адаптация - это самая приятная работа для тех кто работает с RAG по тех. документации. Просто праздник для разработчика. Почему? Потому что в большинстве случаев работа по документации напоминает лютый трэш. Допустим заказчик передает тебе документацию на 2000 страниц в PDF и она содержит не просто текст, а еще формулы LaTeX по которым высчитываются какие либо параметры которые в PDF вообще как изображение а не полноценная таблица. Это просто вынос мозга - и тут вручную их надо конвертировать в ASCII формат для эмбендинга, а потом прописывать, вывод в нормальном виде при обнаружении по запросу. Также там присутствуют диаграммы Mermaid которые частенько отображают последовательности действий, например определения кода ошибок оборудования, шаги тестирования и.т.д. - и тут опять - “ручками” :) Ну конечно же программные коды для проведения диагностики и\или настройке или программированию устройства. Так вот - это нельзя так просто нарезать на чанки, и вот тут начинается истинная жесть. Поэтому выражаю огромную благодарность тем производителям которые создают документацию в markdown формате. Это конечно не панацея - но серьезно ускоряет процессы “обогащения” корпоративной RAG
Если ваш финдир увидит такой коммент он реально сократит время доставки, вашей зарплаты, причем может даже оптимизировать и исключить должность сотрудника который не понимает кто и за что в компании отвечает и какие несет обязаности.
Посыл поста прост - хотите сделать дипломку при помощи ИИ - даже не пытайтесь, топикастер даже пост не смог запромтить :)
А потом придет CISO и скажет - теперь с вас 200% к расходам на проверку вашего AI который надо валидировать на соответствия отраслевым нормам, правилам и законам.
Стиль комментариев и стиль текста это разные уровни - самовлюбленный гопник и академический тимлид. Вообще пора на Хабре запретить постить ИИ сказки
Отлично, ждем несколько дней, а оказывается что это было критическое обновления безопасности и пока ты не сном и духом, а твой “пакетчик” ждал заданный промежуток времени - у тебя слили базу, поставили бэкдор и воткнули майнер.
Супер. Тоже пишу книгу, давно, никак не могу закончить. Также идея для большой серии - ваш рассказ мотивировал!
Спасибо, работаю над RAG по документации и ваша статья реально помогла
Мне вас жаль