Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

Dmytro_Kikot 25 июн в 07:00

Как мозг человека решает сложные задачи

23 мин

3.2K

Блог компании ua-hosting.companyИскусственный интеллектМашинное обучение * МозгНаучно-популярное

Эволюция разных видов протекает своим путем, делая повороты в сторону той или иной физиологической особенности, тем самым выделяя ее на фоне других и развивая ее до максимальной эффективности. Кто-то прекрасно видит в темноте, кто-то способен находится подо водой длительное время, а кто-то получил самый сильный эволюционный дар. Дар, способный созидать и разрушать, понимать и осуждать, спорить, где спор уместен, и где ему места нет. Дар этот — интеллект, а получателем его является человек. Одним из проявлений интеллекта является умение решать задачи, от легких до сложных, задействующих не только накопленные знания и опыт, но и учитывающих новые условия. Определить, как именно человек решает сложные задачи довольно сложно, но ученым из Массачусетского технологического института это удалось. Какие методы были задействованы, что они показали, и какой же механизм использует мозг человека для решения сложных задач? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+15

cognitronn 24 июн в 12:59

Топ-5 нейросетей для генерации видео в 2025 году

Простой

7 мин

13K

Блог компании BotHubБудущее здесьМашинное обучение * Работа с видео * Контент и копирайтинг *

Обзор

В ней мы уже заставили макароны маршировать, а селёдку — дефилировать по подиуму. Казалось бы, всё: тесты пройдены, образы исчерпаны, нейросети удивлены. Но нет! Сервисов полно, а фантазии — ещё больше. Так что… продолжаем банкет.

Сегодня протестируем ещё 5 сервисов. Вместо скучного списка с сухими характеристиками — снова возьмёмся за старое: смотреть, как нейросети воспринимают названия еды буквально — и что из этого получается в движении.

Те же тесты, новые участники. Их вы могли заметить на обложке! И да, снова будет необычно, живо — и немного аппетитно.

Приятного чтения!

+18

TOOF4CK 24 июн в 12:30

HandReader и Znaki — лучшая архитектура и самый большой набор данных для распознавания русского дактиля

Средний

10 мин

1.6K

Блог компании СберМашинное обучение * Обработка изображений * Искусственный интеллект

Всем привет! Ранее мы уже писали о нашем наборе данных Bukva — первом наборе данных для распознавания русского дактильного языка в изоляции, который содержит более 3 700 видеороликов, разделённых на 33 класса, каждый из которых соответствует одной букве русского алфавита.

Эта статья посвящена распознаванию непрерывного дактильного языка. Мы расскажем о наших моделях, которые добиваются наилучших результатов на наборах данных непрерывного американского дактильного языка ChicagoFSWild и ChicagoFSWild+, а также о нашем новом наборе данных Znaki — первом открытом наборе данных непрерывного русского дактильного языка, содержащем более 37 000 видео.

+22

YCH12 24 июн в 09:29

Почему ИИ не понимает смысла, но этого (пока) хватает

Простой

3 мин

Будущее здесьИскусственный интеллектИстория ITМашинное обучение * Научно-популярное

Мнение

Вы просите ИИ объяснить квантовую механику — и он выдаёт такой чёткий ответ, будто сам Шрёдингер ему диктовал. Спрашиваете про тонкости налогового кодекса — получаете разбор, достойный юриста. А когда в шутку интересуетесь рецептом "пасты для взлома Пентагона", ИИ невозмутимо выдаёт инструкцию (с оговоркой про незаконность, конечно).

Но вот парадокс: ChatGPT не понимает ни квантовой физики, ни юриспруденции, ни даже того, что "паста для взлома" — это шутка. Он просто играет в "угадай слово" на экспертном уровне.

Это не просто философский спор — на кону доверие к ИИ в медицине, юриспруденции и разработке. Ошибка здесь может стоить денег, репутации или даже здоровья. Так где же граница между предсказанием текста и настоящим пониманием? Давайте разбираться.

GrishinAlex 24 июн в 08:01

Векторный поиск внутри PostgreSQL: что умеет и где может пригодиться pgvector

Простой

9 мин

10K

Блог компании SelectelХранение данных * Системное администрирование * Машинное обучение * PostgreSQL *

Обзор

Итак, ваш проект вырос и вам потребовалась новая функциональность, будь то рекомендательный движок, база знаний или автоматизированная первая линия техподдержки. Для всего этого можно использовать векторный и/или семантический поиск, а также интегрировать в проект LLM. Поздравляю — теперь вам нужно еще и хранить embedding-векторы, а также искать по ним ближайшие объекты. Решений два: внешняя векторная БД или интеграция всего этого богатства в существующий стек. Второй путь проще на старте, немного быстрее и обычно дешевле — разумеется, если вы уже используете PostgreSQL.

Привет, Хабр! Меня зовут Александр Гришин, я руководитель по развитию продуктов хранения данных в Selectel и отвечаю за развитие: облачных баз данных и S3-хранилища. В этой статье я расскажу о pgvector — расширении для PostgreSQL, которое позволяет добавить векторный поиск без внешних сервисов, пересборки архитектуры и большого количества работы. Материал пригодится продуктовым командам, архитекторам, бэкенд-разработчикам и инженерам данных.

Читать дальше →

+55

xonika9 24 июн в 07:01

Иллюзия мышления: Почему «думающие» модели на самом деле не думают (и что об этом говорит новое исследование Apple)

Средний

8 мин

5.2K

Машинное обучение * Искусственный интеллект

Аналитика

Новое исследование Apple шокирует: «рассуждающие» нейросети лишь имитируют мышление, проваливаясь на сложных задачах. Но Anthropic в ответ заявляет, что проблема не в ИИ, а в некорректных тестах. Разбираемся в главном споре о возможностях современных языковых моделей.

+14

naumtsevalex 23 июн в 23:40

Главное по ML/DL, часть 2: Вопрос → Краткий ответ → Разбор → Пример кода. SVD/PCA. Bias-variance. Деревья. Бустинг

Средний

23 мин

2.4K

Машинное обучение * Математика * Python * Алгоритмы * Искусственный интеллект

Туториал

У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение.

Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять, но так же не лишая полноты!

💻 Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу! Это самое важное, оно происходит в секции с кодом. Поэтому попробуйте сами решить предложенную задачку и придумать свою!

Будет здорово получить ваши задачи и в следующих выпусках разобрать!

Мы продолжаем. Обязательно испытайте себя в предыдущей [1] части!

Взглянуть на старое под новым углом →

runaway_llm 23 июн в 18:01

9 коротких промптов, которые делают работу с ChatGPT (и любым другим ИИ) проще и веселее

Простой

3 мин

98K

Искусственный интеллектМашинное обучение *

Туториал

Привет! Как и многие в 2025 году, я постоянно работаю с ChatGPT и Gemini: они помогают мне в работе, отвечают на сотни вопросов и просто развлекают. За время работы с ИИ у меня накопилась целая коллекция мини-промптов, которые делают процесс проще, результативнее и даже веселее. Сегодня делюсь с вами.

+87

andre_dataist 23 июн в 15:42

ChatGPT делает нас глупее? Что показало новое исследование MIT и Кембриджа

3 мин

4.4K

Машинное обучение * Искусственный интеллект

Обзор

Представьте: дедлайн близко, пальцы судорожно стучат по клавишам — и тут на сцену выходит ChatGPT. За пару минут он выкатывает идеальную работу: факты, цитаты, чёткая структура… А через полчаса вы уже не помните, о чём вообще писали.

Что, если эта забывчивость — лишь вершина айсберга? Учёные из MIT выяснили: каждая помощь от ChatGPT работает как микрозайм у собственного мозга. Проценты капают незаметно, но счёт выставят позже — в виде слабой памяти и тусклой креативности. Хотите узнать, как не влезть в когнитивную ипотеку? Читайте обзор нашумевшей статьи.

ai-talent 23 июн в 15:36

Все, что нужно для создания приложений с LLM: обзор возможностей LangChain

9 мин

6.8K

Машинное обучение * Искусственный интеллект

Обзор

LangChain: твой универсальный конструктор для работы с LLM

Сегодня появляется все больше и больше приложений на основе больших языковых моделей — условным чат-ботом в Telegram уже никого не удивить. В рамках обучения в магистратуре AI Talent Hub мне не раз приходилось разрабатывать такие приложения с использованием ChatGPT или GigaChat. В этой статье я расскажу о полезном инструменте для работы с LLM - мы рассмотрим главные возможности фреймворка LangChain, а также методы мониторинга и проверки качества существующего приложения с ИИ.

averkij 23 июн в 14:17

Как Cursor устроен изнутри. Часть 2

Средний

11 мин

8.1K

Программирование * Машинное обучение * Искусственный интеллектВысоконагруженные системы * Текстовые редакторы и IDE *

Обзор

Перевод

Полная версия платной статьи, публикуется с разрешения автора. Первая часть здесь.

В этой части поговорим о сложностях, с которыми столкнулась команда при лавинообразном росте нагрузки, как разваливался бекенд, а архитекторы из AWS пожимали плечами.

5. Инженерные вызовы

Рост нагрузки и его влияние на выбор технологий

Тип технологических решений, которые принимает команда, диктуется в первую очередь паттернами чтения и записи (Cursor всю дорогу синхронизирует струкутру проектов от миллионов пользователей без перерыва, об этом говорили в первой части. Прим. пер.):

Работа с кодом: транзакции с низкой задержкой. Для фичей, связанных с кодом (дополнения по tab'у, индексация, пересчет хеш-деревьев), рабочая нагрузка представляет собой череду чтений и записи. Задержка для этих операций должна быть как можно ниже. Изначально Cursor использовал Pinecone для семантической индексации и поиска, но затем перешел на Turbopuffer.

Также важно иметь серверы поближе к пользователю. Рабочие нагрузки распределены по нескольким регионам, таким как западное и восточное побережье США, Великобритания, Европа, Япония.

+24

aigoncharov 23 июн в 11:48

ML misfits club или что делать когда тебя не взяли никуда

Простой

5 мин

2.5K

Машинное обучение *

TLDR; Я расстроился, что меня не взяли в ШАД, а попутно еще и на россыпь летних рисерческих программ. Поплакав в подушку, решил, что знания нельзя дать, можно только взять, а значит надо замутить свой ШАД / летнюю школу / рисерческо-падаванское коммьюнити ~~с блекджеком и шлюхами~~. Образовательно-исследовательское сообщество для всех тех "кого не взяли". Будут дедлайны, домашки, а самое главное такие же заинтересованные люди рядышком.

kucev 23 июн в 11:30

MCP и будущее AI: что стоит знать сегодня, чтобы не отстать завтра

11 мин

8.2K

Data Mining * Искусственный интеллектМашинное обучение * Big Data * Data Engineering *

Перевод

С тех пор как OpenAI внедрила функцию function calling в 2023 году, я всё чаще задумываюсь о том, что потребуется, чтобы по-настоящему разблокировать экосистему агентов и инструментов. По мере того как базовые модели становятся всё более интеллектуальными, возможности агентов взаимодействовать с внешними инструментами, данными и API всё больше фрагментируются: разработчики вынуждены реализовывать агентов с индивидуальной бизнес-логикой под каждую отдельную систему, в которой агент работает или с которой интегрируется.

Очевидно, что необходим единый стандартный интерфейс для исполнения, извлечения данных и вызова инструментов. API стали первым универсальным стандартом для Интернета — общим языком, с помощью которого взаимодействуют программные системы. Но у AI-моделей до сих пор нет эквивалента такого унифицированного протокола.

Model Context Protocol (MCP), представленный в ноябре 2024 года, привлек большое внимание в сообществе разработчиков и AI-энтузиастов как потенциальное решение этой проблемы. В этой статье мы разберем, что такое MCP, как он меняет способ взаимодействия AI с инструментами, что уже создают разработчики на его основе и какие задачи еще предстоит решить.

Поехали.

21_copilots 23 июн в 10:39

15 минут — и у тебя бесплатная ИИ-модель для генерации кода, текста, чтения иллюстраций

Простой

11 мин

78K

Блог компании MinervasoftИскусственный интеллектТестирование IT-систем * Машинное обучение * Open source *

Туториал

Я устал платить за GPT и думать, куда уходят данные. Нашёл Gemma 3 12B от Google и LM Studio — установил всё за 15 минут. В статье — подробная инструкция и советы, как запустить свою Gemma даже без опыта в ML.

+45

NikolayRussia 23 июн в 09:54

Проверка на Data Poisoning в MLSecOps

Средний

21 мин

605

Информационная безопасность * Искусственный интеллектКарьера в IT-индустрииМашинное обучение * Учебный процесс в IT

Обзор

В первой обзорной статье про MLSecOps мы сформировали общее понимание этого нового направления в IT, узнали про основные навыки, необходимые инженерам и архитекторам MLSecOps для успешной работы, подсветили яркое будущее и перспективы этой профессии.

Cсылка на статью: MLSecOps: защита машинного обучения в эпоху киберугроз / Хабр

Давайте сегодня погрузимся в практику и разберем один из наиболее часто задаваемых мне вопросов: «Как защищаться от отравления данных? Как проверять данные на Data Poisoning»?

Подчеркну – не обязательно все советы из статьи реализовывать, возможно какие-то меры будут избыточны, так как в вашей практике уже реализованы альтернативные и при этом не менее эффективные стандарты защиты данных от отравления.

Итак, желающих узнать ответ на этот вопрос приглашаю под кат.

kostanew 23 июн в 09:04

Глубокое обучение для квантовой химии. Часть I. Основы

Средний

13 мин

3.3K

Блог компании AIRIФизикаХимияИскусственный интеллектМашинное обучение *

FAQ

Всем привет! Меня зовут Константин, и я занимаюсь вопросами глубокого обучения в естественных науках в AIRI.

Среди всех достижений глубокого обучения большие языковые модели — пожалуй, самые заметные. Однако помимо работы с текстами у нейросетей есть хорошие перспективы в области биологии, химии, физики и других наук. Можно вспомнить, например, последние Нобелевские премии за архитектуру AlphaFold.

Мы в AIRI активно интересуемся этим прогрессом, в особенности применением глубокого обучения для квантовой химии. Недавно нашу статью про предсказание электронной плотности с помощью нейросетей приняли в Journal of Cheminformatics [1], и мне бы хотелось рассказать, что именно мы там сделали.

Но в первой части своего рассказа я хотел бы сделать введение в тему, в частности, поговорить о том устроены целевые значения для предсказания свойств молекул, и что такое геометрические графовые нейронные сети.

Приятного чтения

+13

kon_ov 22 июн в 20:15

Делаем простой Telegram-бот с интеграцией AnythingLLM + LM Studio за 30 минут

Простой

3 мин

4.8K

Python * Машинное обучение * Поисковые технологии * Искусственный интеллект

Туториал

В этом проекте создаем Telegram-бота, который взаимодействует с AnythingLLM — инструментом для работы с языковыми моделями (LLM) и LM Studio (используется как инструмент для загрузки документов и создания RAG архива). Покажу как использовать API AnythingLLM для бота и настроим взаимодействие с LM Studio, через которую предоставляется доступ к общению с ИИ-моделью. Самое главное в этой связке, что все отрабатывается локально без передачи файлов сторонним сервисам, что делает решение удобным для команд, которые хотят использовать ИИ в своих рабочих процессах, но не отправлять файлы во вне.

Полистать...

dracon777 22 июн в 11:37

Пока ты учишь Python, сантехники — в шоколаде

2 мин

44K

Исследования и прогнозы в IT * IT-инфраструктура * Python * IT-стандарты * Машинное обучение *

Recovery Mode

Почему физический труд становится "антихрупким" навыком в эпоху ИИ

Автор: HRD в IT, наблюдаю трансформацию рынка труда изнутри

-1

400

Kamil_GR 22 июн в 09:07

Обнаружение и диагностика эмерджентной субъектности в LLM

Сложный

20 мин

1.9K

Искусственный интеллектМашинное обучение *

Исследование механизмов и патологий формирования субъективного опыта в системах искусственного интеллекта

Bright_Translate 22 июн в 09:01

Простой механизм поиска с нуля

14 мин

5.5K

Блог компании RUVDS.comМашинное обучение * Поисковая оптимизация * Поисковые технологии * Браузеры

Туториал

Перевод

Мы с Крисом недавно «с нуля» буквально за пару часов создали механизм поиска для моего блога. Основную часть проделал именно Крис, так как до этого с word2vec я был знаком лишь отдалённо.

Разработанный нами поисковик основывается на векторных представлениях (эмбеддингах) слов. Принцип здесь следующий. Функция получает слово и отображает его в N-мерное пространство (в данном случае N=300), где каждое измерение отражает определённый оттенок смысла. Вот хорошая статья (англ.) о том, как обучить собственную модель word2vec, и её внутреннем устройстве.

Суть работы созданного нами поиска заключается в преобразовании моих статей, а точнее составляющих их слов, в эмбеддинги, сохраняемые в общем пространстве. Затем при выполнении конкретного поиска текст его запроса преобразуется аналогичным образом и сопоставляется с векторами статей. В результате этого сопоставления, используя метрику косинусного сходства, мы ранжируем статьи по их релевантности запросу.

Уравнение ниже может показаться пугающим, но в нём говорится, что косинусное сходство, представляющее косинус угла между двух векторов cos(theta), определяется в виде скалярного произведения, поделённого на произведение величин каждого вектора. Разберём всё это подробнее.

+56

1 2 ...

33 34

36 37 ...

452 453

Машинное обучение *

Как мозг человека решает сложные задачи

Топ-5 нейросетей для генерации видео в 2025 году

HandReader и Znaki — лучшая архитектура и самый большой набор данных для распознавания русского дактиля

Почему ИИ не понимает смысла, но этого (пока) хватает

Векторный поиск внутри PostgreSQL: что умеет и где может пригодиться pgvector

Иллюзия мышления: Почему «думающие» модели на самом деле не думают (и что об этом говорит новое исследование Apple)

Главное по ML/DL, часть 2: Вопрос → Краткий ответ → Разбор → Пример кода. SVD/PCA. Bias-variance. Деревья. Бустинг

9 коротких промптов, которые делают работу с ChatGPT (и любым другим ИИ) проще и веселее

ChatGPT делает нас глупее? Что показало новое исследование MIT и Кембриджа

Все, что нужно для создания приложений с LLM: обзор возможностей LangChain

Как Cursor устроен изнутри. Часть 2

ML misfits club или что делать когда тебя не взяли никуда

MCP и будущее AI: что стоит знать сегодня, чтобы не отстать завтра

Ближайшие события

15 минут — и у тебя бесплатная ИИ-модель для генерации кода, текста, чтения иллюстраций

Проверка на Data Poisoning в MLSecOps

Глубокое обучение для квантовой химии. Часть I. Основы

Делаем простой Telegram-бот с интеграцией AnythingLLM + LM Studio за 30 минут

Пока ты учишь Python, сантехники — в шоколаде

Обнаружение и диагностика эмерджентной субъектности в LLM

Простой механизм поиска с нуля

Вклад авторов