Комментарии / Профиль ENick / Хабр

Пользователь

ENick 4 ноя 2024 в 10:58

"Цель статьи заключалась в демонстрации минималистичного подхода к использованию моделей эмбеддинга, векторных хранилищ и LLM для обработки пользовательских запросов " - это называется RAG. Логичнее соответственно озаглавить представленную статью и теги начать с RAG

Немного про Chain-of-Thoughts (Цепочку размышлений)

ENick 4 ноя 2024 в 08:35

Раньше этот алгоритм назывался иначе: "Step by step"

AI и Spring Petclinic: Внедрение ИИ-ассистента с Spring AI (Часть II)

ENick 2 ноя 2024 в 17:41

Это типа LangChain ?

Краткий свод концепций Tensor Flow

ENick 2 ноя 2024 в 17:04

Если "Статья для программистов из других областей ", то ожидаемо сравнение с PyTorch

Зачем нужны эмбеддинги?

ENick 2 ноя 2024 в 16:42

"Данное небольшое исследование наглядно иллюстрирует важность выбора и комбинирования различных методов для точного поиска и анализа данных ". Логичнее в названии статьи указать "Семантический поиск и альтернативные методы".

Prompt Me One More Time. Учим LLM строить графы знаний из текстов

ENick 2 ноя 2024 в 15:40

"Измеренная метрика intersection over union (IoU)..." Метрики нельзя измерять, их можно только рассчитывать. Почему привели расчетную формулу только для (IoU), а не для всех применяемых метрик? Все приведенные метрики одинаково азбучны, но это придирки по стилю.

Не азбучный вопрос: как рассчитали доверительные интервалы для метрик? Что являлось причиной разброса и смещения, как их считали?

Зачем нужна этика ИИ?

ENick 31 окт 2024 в 10:01

Я заранее соглашусь с тем Кодексом, который подпишет Константин Вячеславович Воронцов.

Насколько хороши LLM?

ENick 31 окт 2024 в 09:38

Позвольте не согласиться. Позиция авторов определена цитатой К.В.Воронцова: "Генеративные модели текста – это не интеллект, а новый языковой интерфейс "

Синхронизация речи и действий: голосовой AI ассистент

ENick 31 окт 2024 в 07:31

Развитие этого проекта может быть очень интересным и для взрослых

Уделите внимание токенизаторам — и вот почему

ENick 31 окт 2024 в 06:42

В разделе по векторизации логично упомянуть embeddings.
С инвойсами игры с токенизацией дали эффект?

Как научить LLM понимать видео? Часть 2

ENick 25 окт 2024 в 16:15

Почему выбрали LLaMA 3.1 8b Instruct ? "Поддерживаемые языки: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский". Хотя в примечании указывают: "Llama 3.1 была обучена на более широком наборе языков, чем 8 поддерживаемых языков". Модели типа "deepvk/USER-bge-m3" достоверно хуже? Сам сравнить не могу: "Ваш запрос на доступ к этому репозиторию был отклонен авторами репозитория. "

Партнёрство между Microsoft и OpenAI начинает давать трещины

ENick 25 окт 2024 в 16:00

Всё логично - у крупных компаний и проблемы масштабные

Эксперимент: даём ChatGPT полный доступ к компьютеру

ENick 24 окт 2024 в 14:20

Спасибо, интересно!

Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито

ENick 24 окт 2024 в 14:02

На каком железе модели запускали? Какие временные затраты?

Stability AI представила Stable Diffusion 3.5: Тестируем новую модель на реальных задачах и сравниваем с SDXL и FLUX

ENick 23 окт 2024 в 15:55

Кстати, сегодня получил сообщение от email.stability.ai:

Stable Diffusion 3.5 Medium (будет выпущен 29 октября) : с 2,5 миллиардами параметров, улучшенной архитектурой MMDiT-X и методами обучения эта модель предназначена для работы «из коробки» на потребительском оборудовании, обеспечивая баланс между качеством и простотой настройки. Она способна генерировать изображения с разрешением от 0,25 до 2 мегапикселей.

Полнотекстовый поиск vs. Векторный поиск

ENick 23 окт 2024 в 13:13

"превращает запросы и документы в математические модели, называемые векторами, или эмбеддингами ". Неправильное понимание как рассчитываются эмбеддинги

"Эти векторы размещаются в многомерном пространстве, что позволяет векторному поиску понимать смысл слов". Нет там понимания смысла, нам есть косинусное сходство или иные метрики.

Уважаемый автор, так нельзя, уважительнее надо относиться и к себе и к читателям

ИИ в диагностике рака кожи

ENick 23 окт 2024 в 12:53

"Наконец, производительность оценки риска...", в статье рассматриваются значения метрик чувствительности и специфичности, причём здесь производительность. У авторов цитированной работы: "We believe that fusing these newly found risk factors and new risk score with image data will further boost the AI model performance for suspicious skin lesion detection" Слово "performance" в данном контексте переводится иначе.

ИИ в диагностике рака кожи

ENick 23 окт 2024 в 12:31

Корректнее указывать авторов и год публикации работы при первом упоминании, а в конце текста приводить полную ссылку

Правильные слова для правильного результата: история внедрения сервиса GigaChat в Luxms BI

ENick 23 окт 2024 в 12:17

"RAG (генерацию с дополненной выборкой)" , может быть не отходить от классики: RAG (Retrieval Augmented Generation)

Правильные слова для правильного результата: история внедрения сервиса GigaChat в Luxms BI

ENick 23 окт 2024 в 11:47

Компания, которая специализируется в визуализации данных, приводит результаты тестирования ИИ в виде картинки отвратительного качества. Это прикол???