Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

TOOF4CK 24 июн в 12:30

HandReader и Znaki — лучшая архитектура и самый большой набор данных для распознавания русского дактиля

Средний

10 мин

1.5K

Блог компании СберМашинное обучение*Обработка изображений*Искусственный интеллект

Всем привет! Ранее мы уже писали о нашем наборе данных Bukva — первом наборе данных для распознавания русского дактильного языка в изоляции, который содержит более 3 700 видеороликов, разделённых на 33 класса, каждый из которых соответствует одной букве русского алфавита.

Эта статья посвящена распознаванию непрерывного дактильного языка. Мы расскажем о наших моделях, которые добиваются наилучших результатов на наборах данных непрерывного американского дактильного языка ChicagoFSWild и ChicagoFSWild+, а также о нашем новом наборе данных Znaki — первом открытом наборе данных непрерывного русского дактильного языка, содержащем более 37 000 видео.

+22

GrishinAlex 24 июн в 08:01

Векторный поиск внутри PostgreSQL: что умеет и где может пригодиться pgvector

Простой

9 мин

7.6K

Блог компании SelectelPostgreSQL*Машинное обучение*Системное администрирование*Хранение данных*

Обзор

Итак, ваш проект вырос и вам потребовалась новая функциональность, будь то рекомендательный движок, база знаний или автоматизированная первая линия техподдержки. Для всего этого можно использовать векторный и/или семантический поиск, а также интегрировать в проект LLM. Поздравляю — теперь вам нужно еще и хранить embedding-векторы, а также искать по ним ближайшие объекты. Решений два: внешняя векторная БД или интеграция всего этого богатства в существующий стек. Второй путь проще на старте, немного быстрее и обычно дешевле — разумеется, если вы уже используете PostgreSQL.

Привет, Хабр! Меня зовут Александр Гришин, я руководитель по развитию продуктов хранения данных в Selectel и отвечаю за развитие: облачных баз данных и S3-хранилища. В этой статье я расскажу о pgvector — расширении для PostgreSQL, которое позволяет добавить векторный поиск без внешних сервисов, пересборки архитектуры и большого количества работы. Материал пригодится продуктовым командам, архитекторам, бэкенд-разработчикам и инженерам данных.

Читать дальше →

+55

xonika9 24 июн в 07:01

Иллюзия мышления: Почему «думающие» модели на самом деле не думают (и что об этом говорит новое исследование Apple)

Средний

8 мин

4.7K

Искусственный интеллектМашинное обучение*

Аналитика

Новое исследование Apple шокирует: «рассуждающие» нейросети лишь имитируют мышление, проваливаясь на сложных задачах. Но Anthropic в ответ заявляет, что проблема не в ИИ, а в некорректных тестах. Разбираемся в главном споре о возможностях современных языковых моделей.

+14

runaway_llm 23 июн в 18:01

9 коротких промптов, которые делают работу с ChatGPT (и любым другим ИИ) проще и веселее

Простой

3 мин

92K

Машинное обучение*Искусственный интеллект

Туториал

Привет! Как и многие в 2025 году, я постоянно работаю с ChatGPT и Gemini: они помогают мне в работе, отвечают на сотни вопросов и просто развлекают. За время работы с ИИ у меня накопилась целая коллекция мини-промптов, которые делают процесс проще, результативнее и даже веселее. Сегодня делюсь с вами.

+87

averkij 23 июн в 14:17

Как Cursor устроен изнутри. Часть 2

Средний

11 мин

7.1K

Высоконагруженные системы*Искусственный интеллектМашинное обучение*Программирование*Текстовые редакторы и IDE*

Обзор

Перевод

Полная версия платной статьи, публикуется с разрешения автора. Первая часть здесь.

В этой части поговорим о сложностях, с которыми столкнулась команда при лавинообразном росте нагрузки, как разваливался бекенд, а архитекторы из AWS пожимали плечами.

5. Инженерные вызовы

Рост нагрузки и его влияние на выбор технологий

Тип технологических решений, которые принимает команда, диктуется в первую очередь паттернами чтения и записи (Cursor всю дорогу синхронизирует струкутру проектов от миллионов пользователей без перерыва, об этом говорили в первой части. Прим. пер.):

Работа с кодом: транзакции с низкой задержкой. Для фичей, связанных с кодом (дополнения по tab'у, индексация, пересчет хеш-деревьев), рабочая нагрузка представляет собой череду чтений и записи. Задержка для этих операций должна быть как можно ниже. Изначально Cursor использовал Pinecone для семантической индексации и поиска, но затем перешел на Turbopuffer.

Также важно иметь серверы поближе к пользователю. Рабочие нагрузки распределены по нескольким регионам, таким как западное и восточное побережье США, Великобритания, Европа, Япония.

+24

21_copilots 23 июн в 10:39

15 минут — и у тебя бесплатная ИИ-модель для генерации кода, текста, чтения иллюстраций

Простой

11 мин

69K

Блог компании MinervasoftИскусственный интеллектТестирование IT-систем*Машинное обучение*Open source*

Туториал

Я устал платить за GPT и думать, куда уходят данные. Нашёл Gemma 3 12B от Google и LM Studio — установил всё за 15 минут. В статье — подробная инструкция и советы, как запустить свою Gemma даже без опыта в ML.

+45

kostanew 23 июн в 09:04

Глубокое обучение для квантовой химии. Часть I. Основы

Средний

13 мин

2.6K

Блог компании AIRIФизикаХимияИскусственный интеллектМашинное обучение*

FAQ

Всем привет! Меня зовут Константин, и я занимаюсь вопросами глубокого обучения в естественных науках в AIRI.

Среди всех достижений глубокого обучения большие языковые модели — пожалуй, самые заметные. Однако помимо работы с текстами у нейросетей есть хорошие перспективы в области биологии, химии, физики и других наук. Можно вспомнить, например, последние Нобелевские премии за архитектуру AlphaFold.

Мы в AIRI активно интересуемся этим прогрессом, в особенности применением глубокого обучения для квантовой химии. Недавно нашу статью про предсказание электронной плотности с помощью нейросетей приняли в Journal of Cheminformatics [1], и мне бы хотелось рассказать, что именно мы там сделали.

Но в первой части своего рассказа я хотел бы сделать введение в тему, в частности, поговорить о том устроены целевые значения для предсказания свойств молекул, и что такое геометрические графовые нейронные сети.

Приятного чтения

+13

Bright_Translate 22 июн в 09:01

Простой механизм поиска с нуля

14 мин

5.3K

Блог компании RUVDS.comМашинное обучение*Поисковая оптимизация*Поисковые технологии*Браузеры

Туториал

Перевод

Мы с Крисом недавно «с нуля» буквально за пару часов создали механизм поиска для моего блога. Основную часть проделал именно Крис, так как до этого с word2vec я был знаком лишь отдалённо.

Разработанный нами поисковик основывается на векторных представлениях (эмбеддингах) слов. Принцип здесь следующий. Функция получает слово и отображает его в N-мерное пространство (в данном случае N=300), где каждое измерение отражает определённый оттенок смысла. Вот хорошая статья (англ.) о том, как обучить собственную модель word2vec, и её внутреннем устройстве.

Суть работы созданного нами поиска заключается в преобразовании моих статей, а точнее составляющих их слов, в эмбеддинги, сохраняемые в общем пространстве. Затем при выполнении конкретного поиска текст его запроса преобразуется аналогичным образом и сопоставляется с векторами статей. В результате этого сопоставления, используя метрику косинусного сходства, мы ранжируем статьи по их релевантности запросу.

Уравнение ниже может показаться пугающим, но в нём говорится, что косинусное сходство, представляющее косинус угла между двух векторов cos(theta), определяется в виде скалярного произведения, поделённого на произведение величин каждого вектора. Разберём всё это подробнее.

+56

autumr 21 июн в 09:15

Почему LLM не знают, что такое «помидор», и как не дать себя обмануть?

Простой

6 мин

12K

Машинное обучение*Искусственный интеллект

Из песочницы

В последнее время в научных и научно‑популярных изданиях стали появляться материалы, посвящённые тому, как большие языковые модели могут воспроизводить конспирологические нарративы и поддерживать иррациональные, порой мистические системы убеждений. Более того, для некоторых пользователей взаимодействие с такими моделями способно существенно исказить восприятие реальности. Эти наблюдения побудили меня задуматься о причинах подобных эффектов и о возможных способах защиты от них. Один из ключевых шагов, на мой взгляд, — формирование у широкой аудитории базового понимания того, как устроены языковые модели и каковы границы их применимости. Эта статья посвящена именно этому.

Любая нейронная сеть представляет собой алгоритм, который получает данные на входе и выдаёт преобразованный результат на выходе. В случае LLM (large language models) главная особенность заключается в работе с текстовым представлением информации. Как именно модели вроде ChatGPT или DeepSeek формируют ответы на пользовательские запросы? Возьмём, к примеру, слово «помидор». Для большинства из нас это круглый предмет, часто пригодный в пищу. Для языковой модели это всего лишь вектор — набор чисел, формально описывающий положение слова в абстрактном многомерном пространстве. Вектор может быть разной размерности, то есть содержать в себе разное количество признаков, например: 2 признака, или 700, или даже 4000.

Если у слова 700 признаков, что это значит? Признак (компонент вектора) — это скрытая характеристика слова. Признаки бывают разными, например: семантическими (фрукт или ягода), лингвистическими (вероятность нахождения рядом с прилагательными «красный»/»сладкий»; синтаксическая роль — подлежащее; связи с глаголами и т. д.), онтологическими (природность, органичность, целостность), физическими (круглый, твердый) и др.. По каждому признаку в векторном представлении слова хранится значение: красный 0.90,..., наречие -0.64. Вектор слова «помидор» может иметь вид, например: [0.90, -0.23, -0,01,..., 0.55]. Как уже было сказано ранее, каждое слово в векторном виде занимает своё место в векторном пространстве, рассмотрим простейший пример, для наглядности:

+39

dmitrifriend 21 июн в 05:00

Андрей Карпатый: Swift? Не слышал! Как я iOS-приложение на чистом «пожалуйста» написал

Простой

11 мин

9.6K

Блог компании BotHubПрограммирование*Искусственный интеллектМашинное обучение*Будущее здесь

Аналитика

Перевод

Что если создать мобильное приложение, не зная ни строчки кода на Swift? Добро пожаловать в мир вайбкодинга — нового стиля программирования «по настроению», где естественный язык и LLM заменяют синтаксис и компиляторы.

Во второй части выступления Андрея Карпатого мы также поговорим о новом типе «пользователей» — LLM‑агентах («духах людей») и о том, как адаптировать нашу инфраструктуру (документацию, API, сайты) для их удобства с помощью... llms.txt. Готовы ли вы кодить «в потоке» и строить для нечеловеческих интеллектов?

+18

dmitrifriend 20 июн в 16:07

Андрей Карпатый: «ПО снова меняется (и опять радикально)»

Простой

12 мин

13K

Блог компании BotHubПрограммирование*Искусственный интеллектМашинное обучение*Будущее здесь

Аналитика

Перевод

Представьте карту всего кода в мире: GitHub, Hugging Face... Но что, если я скажу, что самая захватывающая часть этой карты сейчас даже не код, а промпты? Программное обеспечение снова меняется радикально, и на этот раз естественный язык становится новым языком программирования.

В этой статье, записанной по выступлению Андрея Карпатого на конференции AI Startup School, мы разберём, как радикально меняются парадигмы разработки, почему LLM — это не просто «новое электричество», а сложные экосистемы и как концепция «частичной автономии» определяет будущее приложений. Будущее ПО уже здесь, и оно говорит на вашем языке.

+19

averkij 20 июн в 14:07

Как Cursor устроен изнутри. Часть 1

Средний

10 мин

31K

Программирование*Машинное обучение*Искусственный интеллектВысоконагруженные системы*Текстовые редакторы и IDE*

Перевод

Вторая часть статьи здесь

Всего за год нагрузка на Cursor выросла в 100 раз: более 1 млн запросов в секунду и миллиарды автодополнений кода каждый день. Подробный разбор архитектуры — вместе с сооснователем Суалехом Асифом.

Cursor — это IDE с кодогенерацией на AI-агентах, которая сейчас пользуется наибольшей популярностью среди разработчиков. В прошлогоднем опросе, Cursor был самым частым ответом на вопрос «Назовите вашу любимую IDE с генеративными функциями, помогающими в работе».

Стартап, стоящий за Cursor — Anysphere, был основан в 2022 году, а в марте 2023 года запустил Cursor. Недавно Anysphere сообщила, что привлекла $900 млн, при оценке компании в $9.9B. Годовой доход (автор имеет в виду годовой повторяющийся доход, Annual Recurring Revenue, ARR. Прим. пер.) уже превысил $500M. Ни одна другая компания в сфере инструментов для разработчиков, которую я знаю, не достигала этого рубежа в течение первых 2 лет после запуска первого продукта. Поспособствовало этому и то, что Cursor используется более чем половиной из 500 крупнейших технологических компаний из списка Fortune 500.

Я встретился с сооснователем Cursor, Суалехом Асифом, чтобы узнать, как работает Cursor и как команда этот инструмент создает. Обсудили следующие темы:

Технологический стек. TypeScript, Rust и куча облачных провайдеров — Turbopuffer, Datadog, PagerDuty и другие.

Как работает автодополнение. Устройство low-latency движка для передачи зашифрованного контекста на сервер для инференса.

+59

KirillKhrylchenko 20 июн в 08:00

ARGUS: как масштабировать рекомендательные трансформеры

29 мин

8.7K

Блог компании ЯндексМашинное обучение*Искусственный интеллектАлгоритмы*Анализ и проектирование систем*

Привет! Меня зовут Кирилл Хрыльченко. Я руковожу командой, которая занимается R&D для рекомендательных технологий в Яндексе. Одна из наших основных задач — развивать трансформерные технологии в контексте рекомендательных систем, и мы активно занимаемся этим уже примерно пять лет. Не так давно у нас произошёл новый виток в развитии рекомендательных технологий, которым мы хотим поделиться с вами в этой статье.

Актуальность рекомендательных систем в мире и для Яндекса обосновать несложно: количество контента растёт очень быстро, всё просматривать самостоятельно невозможно, поэтому для борьбы с информационной перегрузкой нужны рексистемы. Рекомендации музыки, фильмов, книг, товаров, видеороликов, постов, друзей — бо́льшая часть этого есть и у нас в Яндексе. При этом важно не забывать, что эти сервисы помогают не только пользователям, но и создателям контента, которым нужно искать свою аудиторию.

Мы уже внедрили новое поколение рекомендательных трансформеров во множество сервисов — Музыку, Алису, Маркет, Лавку — и активно работаем над внедрением в другие. Везде получилось значительно улучшить качество рекомендаций. Если вы рекомендательный инженер — надеюсь, что после этой статьи у вас появятся идеи, как сделать что‑то похожее для вашей рекомендательной системы. А если вы пользователь рекомендаций — то у вас есть возможность побольше узнать о том, как работает та самая рекомендательная система.

+41

Wonderlove 19 июн в 14:06

Нейро-дайджест: ключевые события мира AI за 2-ю неделю июня 2025

Средний

14 мин

1.9K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение*IT-компанииБудущее здесь

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась интересной: выход o3-pro, думающая модель от Mistral, презентации от Apple и AMD, интересные спейсы на HuggingFace, видеогенератор от ByteDance, который круче Veo 3 а Disney и Midjourney ждёт суд.

Всё самое важное — в одном месте. Поехали!

+21

iovodov 19 июн в 11:06

Жестовый язык: похожее в непохожем и наоборот

Средний

9 мин

1.6K

Блог компании СберМашинное обучение*Обработка изображений*Искусственный интеллект

Привет, Хабр! Наша команда RnD CV продолжает приближать момент, когда компьютер по видео сможет распознавать жестовый язык (ЖЯ) глухих так же качественно, как речь.

Сегодня мы расскажем, как собрали один из самых больших в мире датасетов изолированного русского жестового языка Logos, чем различаются визуально одинаковые жесты, как мы с помощью нашего датасета обучили универсальную модель-энкодер и попутно заняли первую строчку в бенчмарке распознавания американского жестового языка. По итогам этой работы мы опубликовали препринт.

+29

Timeweb_Cloud 19 июн в 11:00

Почему в 2025 году важно уметь писать промпты, даже если вы не технарь. Без этого навыка уже никуда

Простой

9 мин

14K

Блог компании Timeweb CloudИскусственный интеллектКонтент и копирайтинг*Машинное обучение*Исследования и прогнозы в IT*

Обзор

Вы можете не быть разработчиком, не знать Python и ни разу не запустить нейросеть локально. Но если вы пишете тексты, работаете с данными, ищете маркетинговые идеи, готовите презентации или просто хотите автоматизировать рутину — в 2025 году вам стоит разобраться с тем, что такое промпты. Об этом наша новая статья.

+34

ntyazh 19 июн в 10:06

FActScore-turbo: инструмент для верификации фактов

Средний

8 мин

1.3K

Блог компании VKМашинное обучение*Искусственный интеллект

Кейс

Привет, Хабр! Я Наталья Тяжова, бакалавр ПМИ ФКН, NLP-исследователь. В VK занималась проектом про фактологическую точность LLM. А после выступила на DataFest с докладом, который лёг в основу этой статьи.

Я расскажу про FActScore-turbo — инструмент, который призван улучшить фактологическую точность больших языковых моделей. Я пришла к этой теме, когда занималась исследованием в VK. Мы изучали природу галлюцинаций языковых моделей — ложных или некорректных фактов, которые они выдают с высокой уверенностью. Примеры таких ошибок повсюду, и если вы работаете с LLM, то наверняка сталкивались с ними.

FActScore-turbo — одна из попыток научить модель чаще генерировать правдивые, непротиворечивые и подтверждаемые утверждения. Идея мощная, но реализация... скажем, нестандартная. Расскажу всё по порядку.

+40

osanwe 19 июн в 09:40

Как мы научились прогнозировать грозы на карте осадков в Яндекс Погоде

6 мин

Блог компании ЯндексМашинное обучение*Алгоритмы*Геоинформационные сервисы*Исследования и прогнозы в IT*

Экстремальные погодные явления оказывают большое влияние на нашу жизнь. Это может проявляться в бытовых вещах, просто чтобы не попасть под сильный ливень или грозу. А ещё — в обеспечении бизнеса. Например, в прошлом году в Европе из‑за града погиб один из самых старых виноградников.

Именно поэтому мы решили улучшить наш прогноз экстремальных погодных явлений. Прежде всего мы сфокусировались на суперкраткосрочном прогнозе молний на карте осадков, также известной как наукаст, чтобы расширить нашу технологию прогнозирования погоды Meteum. Таким образом мы стали первыми в России, кто сделал карту наукаста гроз на ближайшие два часа с шагом 10 минут. Дело в том, что экстремальные погодные явления часто связаны с конвективными явлениями в атмосфере, которые сложно прогнозировать на долгий срок. То есть если в прогнозе есть гроза, то часто вместе с ней будет ожидаться сильный дождь и ветер, а в некоторых регионах и град.

Меня зовут Пётр Вытовтов. Я руководитель группы ML и качества прогноза в Яндекс Погоде. Сегодня я хочу рассказать вам о том, как мы добавляли прогноз молний в нашу модель наукаста с использованием данных со спутников, метеорологических радаров и применением трансформерных моделей.

+22

dmitrifriend 19 июн в 08:00

Потеря работы из-за ИИ: насколько реальна угроза? Мнение Демиса Хассабиса

Простой

12 мин

3.7K

Блог компании BotHubКарьера в IT-индустрииМашинное обучение*ИнтервьюНаучно-популярное

Интервью

Перевод

Имя Демиса Хассабиса — синоним амбициозных проектов в области ИИ. От разработки легендарной игры Theme Park до создания AlphaFold, решившей «нобелевскую» задачу биологии, и теперь — к AGI, искусственному интеллекту уровня человека. Глава DeepMind утверждает: шанс увидеть AGI в ближайшее десятилетие — 50/50. Этот прогноз одновременно восхищает и пугает. Ведь за ним маячит призрак массовой потери работы из‑за ИИ.

Насколько реален апокалипсис профессий? И есть ли свет в конце тоннеля общего искусственного интеллекта? Погружаемся в мысли одного из главных архитекторов нашего будущего.

+21

krakotay 19 июн в 04:50

Почему гуманоидные роботы — не пустохайп, а прорыв робототехники

4 мин

4.1K

Искусственный интеллектМашинное обучение*Робототехника

Мнение

Гуманоидные роботы на ИИ. То что раньше казалось наивной фантастикой, оказалось уже наступившим будущем. Но почему-то в русскоязычном интернете об этом почти не говорят.

+13

1 2 3 4 5

7 8 ...

242 243

Машинное обучение *

HandReader и Znaki — лучшая архитектура и самый большой набор данных для распознавания русского дактиля

Векторный поиск внутри PostgreSQL: что умеет и где может пригодиться pgvector

Иллюзия мышления: Почему «думающие» модели на самом деле не думают (и что об этом говорит новое исследование Apple)

9 коротких промптов, которые делают работу с ChatGPT (и любым другим ИИ) проще и веселее

Как Cursor устроен изнутри. Часть 2

15 минут — и у тебя бесплатная ИИ-модель для генерации кода, текста, чтения иллюстраций

Глубокое обучение для квантовой химии. Часть I. Основы

Простой механизм поиска с нуля

Почему LLM не знают, что такое «помидор», и как не дать себя обмануть?

Андрей Карпатый: Swift? Не слышал! Как я iOS-приложение на чистом «пожалуйста» написал

Андрей Карпатый: «ПО снова меняется (и опять радикально)»

Как Cursor устроен изнутри. Часть 1

ARGUS: как масштабировать рекомендательные трансформеры

Ближайшие события

Нейро-дайджест: ключевые события мира AI за 2-ю неделю июня 2025

Жестовый язык: похожее в непохожем и наоборот

Почему в 2025 году важно уметь писать промпты, даже если вы не технарь. Без этого навыка уже никуда

FActScore-turbo: инструмент для верификации фактов

Как мы научились прогнозировать грозы на карте осадков в Яндекс Погоде

Потеря работы из-за ИИ: насколько реальна угроза? Мнение Демиса Хассабиса

Почему гуманоидные роботы — не пустохайп, а прорыв робототехники

Вклад авторов