Комментарии / Профиль Front-Den / Хабр

Пользователь

0,1

Рейтинг

Говорю: «Найди!» — и он находит. Как я устал искать ответы в базе знаний и сделал себе помощника

Здравствуйте! А какую модель использовали? Система работает как вопрос-ответ-обнуление или память в рамках диалога есть? Сколько в среднем занимает контекст при одном вопросе-ответе?

В 2026 году Nvidia не выпустит ни одной новой видеокарты

Front-Den 7 фев в 07:03

Пару недель собрал ПК с 5070 Ti, 7700, 64DDR5. Вообщем жаба душит что переплатил по сравнению с летними ценниками. Но теперь уже отпустило, на фоне все новых и новых новостей. Кто собрал ПК - берегите его, оберегайте, сдувайте пылинки. То ли еще будет

Запускаем AI-ассистента на бесплатном CPU: Qwen2.5 + Gradio + Hugging Face Spaces

Front-Den 5 фев в 18:15

3b, 3-7t/s... А зачем? Эмбеддеры нормальные больше параметров имеют, а тут языковая на 3, которая даже json просто оформить не может. Ну запустить можно, а какой смысл ? Какую задачу она решит? Баги править? В обратную сторону разве что...

Мы в три раза снизили цены на GigaChat для бизнеса

Front-Den 4 фев в 09:20

GigaChat 2 Max = 650р 1млн токенов

DeepSeek-V3.2 = 28-42р за 1млн токенов вход/выход. + У дипсика есть кеширование, цена еще смешнее получается.

Какие причины переплачивать за гигачад, если не брать требование гос. сектора?

В правительстве РФ предложили блокировать сайты с готовыми домашними заданиями и ответами на тесты ЕГЭ и ОГЭ

Front-Den 25 янв в 11:39

Что там еще "полезного" могут предложить... Ну будут через ИИ искать решения, через Perpexlity, в крайнем случае Алиса или локальные модели, хотя последние два варианта будут давать ответы сомнительного качества. Хотя если всех этих "предлогаторов" в правительстве заменить самыми дубовыми ЛЛМ 2022 года, с тремя параметрами(не миллиардов) качество работы "предлогаторов" не пострадает, а экономия явно станет заметно выше.

СМИ: с начала года банки РФ заблокировали миллионы карт и счетов физлиц в рамках выявления мошеннических операций

Front-Den 19 янв в 06:07

Только вчера собрал на авито корзину комплектующих для ПК, перешел в к оплате и блокировка... Заказывал не первый раз, довольно популярные магазины с тысячей отзывов 5*. Отличные алгоритмы, спасибо Сбербанк 🤝 главное чтобы потом красиво отчитались о 10 миллионах предотвращения мошенничества.

+12

Embedder для ИТ-крестьянина

Front-Den 12 янв в 20:14

На самом деле в таких статьях часто можно найти действительно полезный опыт. Не все умеют вручную писать RAG пайплайны и часто это делается полностью вайбкодингом через крупные модели, которые на вопрос "какой эмбеддер посоветуешь для русского языка, из самых крупных и продвинутых", советует bge-m3 или multilingual-v... и ты с чистой душой его вставляешь в RAG. Потом удивляешь плохим результатам и пытаешься понять в чем проблема. На своем опыте убедился что бенчмарки и тем-более советы ИИ совсем не последняя инстанция. Спасибо, Дмитрий! Я вот тоже уже не первый месяц прохожу этот путь и пытаюсь настроить пайплайн для техпода, не имея опыта в этом 😁 начиналось с простого, - запихнуть все в контекстное окно и ждать ответа, потом уровень выше - встроенные RAG инструменты в UI обёртки для LLM, потом следующий уровень, - собрать все документы разных форматов в одну кучу, начанковать 1000/200 и по лексике топ=10 пихать в ИИ. Получилось прям ужасно... Месяцы этого занятия, чтения хабра и таких статей и уже docking+чанкование через ИИ+гибридный поиск с метаданными и уже приносит пользу. Так что пишите, это важно, для новеньких и особенно для не профильных ИИ-шников.

-1