Статьи / Закладки / Профиль Look-ash / Хабр

Александр Лукашевич@Look-ash^{read⁠-⁠only}

Пользователь

ПрофильЗакладки4

Bright_Translate 22 июн 2025 в 09:01

Простой механизм поиска с нуля

14 мин

9.1K

Блог компании RUVDS.comПоисковые технологии * Поисковая оптимизация * Машинное обучение * Браузеры

Туториал

Перевод

Мы с Крисом недавно «с нуля» буквально за пару часов создали механизм поиска для моего блога. Основную часть проделал именно Крис, так как до этого с word2vec я был знаком лишь отдалённо.

Разработанный нами поисковик основывается на векторных представлениях (эмбеддингах) слов. Принцип здесь следующий. Функция получает слово и отображает его в N-мерное пространство (в данном случае N=300), где каждое измерение отражает определённый оттенок смысла. Вот хорошая статья (англ.) о том, как обучить собственную модель word2vec, и её внутреннем устройстве.

Суть работы созданного нами поиска заключается в преобразовании моих статей, а точнее составляющих их слов, в эмбеддинги, сохраняемые в общем пространстве. Затем при выполнении конкретного поиска текст его запроса преобразуется аналогичным образом и сопоставляется с векторами статей. В результате этого сопоставления, используя метрику косинусного сходства, мы ранжируем статьи по их релевантности запросу.

Уравнение ниже может показаться пугающим, но в нём говорится, что косинусное сходство, представляющее косинус угла между двух векторов cos(theta), определяется в виде скалярного произведения, поделённого на произведение величин каждого вектора. Разберём всё это подробнее.

+56

suncru 12 июн 2025 в 08:07

Как устроены LLM-агенты: архитектура, планирование и инструменты

14 мин

28K

Блог компании SelectelАлгоритмы * Искусственный интеллектМашинное обучение * Читальный зал

Всем привет! С вами Кирилл Филипенко, сисадмин из Selectel, и сегодня мы погрузимся в тему LLM-агентов. Сейчас об этих самых «агентах» кричат буквально из каждого утюга, поэтому пришло время наконец-то разобраться, что это такое, как они работают и с чем их, собственно, едят. Прыгайте под кат, будет интересно!

Читать дальше →

+65

suncru 20 мар 2025 в 08:45

Reasoning-LLM: архитектура и обзор передовых моделей

24 мин

22K

Блог компании SelectelIT-компанииВысоконагруженные системы * Искусственный интеллектМашинное обучение *

Reasoning-LLM — это большие языковые модели, нацеленные на логическое рассуждение при решении сложных задач. В отличие от обычных LLM, которые часто выдавали ответы сразу, такие модели способны «думать» пошагово — как человек, анализируя задачу и выстраивая цепочку вывода.

Появление reasoning-LLM связано с тем, что традиционные LLM (например, GPT-4 или Llama 3.1) хотя и хорошо справляются с языковыми и энциклопедическими запросами, нередко ошибались в задачах, требующих сложных вычислений, планирования или логического вывода. В этой статье мы подробно разберем, как работают reasoning-LLM, их внутреннее устройство (Transformer, self-attention, механизмы «мышления»). А еще — рассмотрим передовые модели (OpenAI o1, DeepSeek R1 и Claude 3.7 Sonnet), факторы, влияющие на их точность, и дадим практические рекомендации по применению.

Читать дальше →

+23

snakers4 22 сен 2022 в 08:54

OpenAI решили распознавание речи! Разбираемся так ли это…

7 мин

18K

Машинное обучение * Искусственный интеллектNatural Language Processing *

Вчера OpenAI выпустили Whisper. По сути они просто опубликовали веса набора больших (и не очень) рекуррентных трансформеров для распознавания речи и статью (и самое главное, в статье ни слова про compute и ресурсы). И естественно уже вчера и сегодня утром мне в личку начали сыпаться сообщения, мол всё, распознавание речи решено, все идеально классно и быстро работает, расходимся.

Постараемся разобраться под катом. Короткий ответ, если вам лень читать - для языков, кроме английского, скорее всего это далеко от правды (проверил я на русском). На английском наверное стоит сделать отдельный и чуть более подробный разбор, если эта статья наберет хотя бы 50 плюсов.

Итак, поехали!

+22

Простой механизм поиска с нуля

Как устроены LLM-агенты: архитектура, планирование и инструменты

Reasoning-LLM: архитектура и обзор передовых моделей

OpenAI решили распознавание речи! Разбираемся так ли это…

Информация

Специализация