Как стать автором
Обновить
1383.06

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Подступающий AGI: анализ прогнозов Кевина Вейла (OpenAI)

Время на прочтение11 мин
Количество просмотров4.6K

Привет, Хабр! 

Мир технологий всегда был местом смелых прогнозов, но диалог с Кевином Вейлом, директором по продуктам (CPO) OpenAI, выделяется даже на этом фоне. Кевин Вейл из OpenAI уверен, что AGI уже на пороге — и появится в текущем году. Представьте, что ваш коллега по команде — не человек. Он не пьёт кофе, не присылает мемчики в пятницу и… обходит вас в любимых видеоиграх с разгромным счетом. Звучит как сюжет Black Mirror? Для Кевина Вейла это не фантастика. В ближайшие несколько месяцев, по его словам, ИИ превзойдёт человека в программировании. Недавнее интервью открывает нам не только технические перспективы, но и ставит фундаментальные вопросы о будущем человечества в эпоху стремительного развития ИИ.  

Чек-лист апокалипсиса для IT-профессий прилагается:  

- Экспоненциальное падение стоимости ИИ-интеллекта — в 10 раз ежегодно (закон Мура плачет в углу). 

- Робототехника как «физическое воплощение AGI» — когда ошибка в коде будет не багом, а ударом кулаком по столу. 

- ИИ-репетиторы и AGI-счётчик, который тикает, пока вы читаете и чем-то напоминает обратный отсчёт до старта SkyNet.

Читать далее

Как научить нейросеть запоминать вас: технология персонального контекста

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров6.5K

Обложка статьи


Привет, Хабр!


Если вы, как и я, регулярно общаетесь с нейросетями, то наверняка сталкивались с ситуацией, когда приходится раз за разом объяснять ИИ одни и те же вещи: кто вы, чем занимаетесь, какие у вас предпочтения и цели. Каждый новый чат — это знакомство с чистого листа.


Сегодня я хочу рассказать о технологии, которая решает эту проблему — персональном контексте для LLM. Объясню простыми словами, что это такое, как это работает и почему это важное направление в развитии взаимодействия человека с ИИ.

Читать дальше →

Пишем свой Transformer

Время на прочтение12 мин
Количество просмотров8.3K

Захотелось более детально разобраться и попробовать самостоятельно написать Transformer на PyTorch, а результатом поделиться здесь. Надеюсь, так же как и мне, это поможет ответить на какие-то вопросы в данной архитектуре.

Читать далее

Десять уроков развития аппаратных ускорителей для ИИ: как эволюция TPU привела к созданию TPUv4i

Время на прочтение7 мин
Количество просмотров1.8K

В последние годы стало очевидно, что классические центральные процессоры (CPU) и видеокарты (GPU) уже не всегда поспевают за непрерывным ростом и усложнением нейронных сетей. Вместо бесконечного наращивания «универсального» железа, компании начали разрабатывать и внедрять в своих дата-центрах Domain-Specific Architecture (DSA) — аппаратные ускорители, заточенные под конкретные задачи.

Google TPU (Tensor Processing Unit) — одно из первых крупных решений такого рода. Начиная с 2015 года (поколение TPUv1), Google успела вывести на рынок несколько поколений TPU для внутренних нужд: TPUv1 и TPUv2/v3, а в 2020 году — новое решение TPUv4i. Если первые версии TPU были ориентированы исключительно на ускорение инференса (выполнение уже обученных моделей), то TPUv2 и TPUv3 смогли взять на себя ещё и тренировку крупных нейросетей. Но в дальнейшем выяснилось, что для оптимальной работы дата-центров в масштабах Google рациональнее разделить решения для тренировки и инференса. TPUv4i — это результат учёта многих уроков и ограничений, проявившихся в предыдущих чипах.

В этом материале разберём, какие «десять уроков» сформировали подход Google к созданию TPUv4i, что это за архитектура и какие проблемы дата-центров она решает.

Читать далее

5 причин, почему лучше не использовать ИИ-арт для своей статьи

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.3K

Плох тот хабраюзер, который не мечтает написать пост. По крайней мере, так было до появления режима read&comment. Однако даже сейчас самые уважаемые люди на этом сайте — авторы, создатели контента (в идеале — качественного, но попытка тоже засчитывается).

Сегодня поговорим о том, как сделать свои посты лучше. Или, по крайней мере, как не сделать хуже.

Для тех, кто читает эту статью в далеком будущем: сейчас на дворе 2025 год, ИИ-революция проникла уже в каждый уголок интернета, однако в инфосфере уже нарастает некая усталость от этого. И даже у самых крутых достижений ML по мере эксплуатации обнаруживаются какие-нибудь неприглядные стороны. Под катом обсудим, почему ИИ-генерация изображений для статьи может быть не самой лучшей идеей.

Читать далее

Gemini 2.0 Flash от Google теперь позволяет редактировать изображения с использованием естественного языка

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров11K

Модель Gemini 2.0 Flash от Google теперь позволяет редактировать изображения с помощью естественного языка. В отличие от более ранних мультимодальных систем, в которых использовалось сочетание отдельных моделей (например, использование языковой модели вместе с Imagen 3 для генерации изображений), Gemini 2.0 Flash работает в мультимодальном режиме, генерируя изображения непосредственно в той же системе, которая обрабатывает текст. Это устраняет необходимость в межмодельном взаимодействии, что значительно снижает время ожидания.

Поскольку Gemini 2.0 Flash больше не зависит от Imagen 3, у нее более быстрый отклик и более плавное взаимодействие. Кроме того, вы даже можете добавлять длинный текст прямо на изображения!

Посмотрите на этот пример, где я превратил генерального директора Google Deepmind, Дэмиса Хассабиса, в длинноволосого чувака.

Читать далее

Deep Research Showdown: битва AI-систем за качество исследований

Время на прочтение3 мин
Количество просмотров1.8K

Как я сравнил топовые AI-модели для глубокого анализа данных и собственную разработку

Привет! Меня зовут Валера Ковальский, я CEO NDT by red_mad_robot. Недавно я протестировал ведущие AI-системы, которые способны проводить глубокие исследования, и делюсь с вами результатами.

Читать далее

Марк нас не спасёт

Время на прочтение4 мин
Количество просмотров1.4K

Привет, дорогие хабровчане! Решили принять участие в проекте коллег и внести свою лепту в общий флуд на тему ИИ. Наш главред Павел Соколов написал короткий рассказ. Итак, будущее здесь. Фантазия на тему того, что нас, возможно, ждет. Всем приятного прочтения! 

p.s. Написан без использования ИИ:)

Читать далее

Model Context Protocol. Революция в интеграции AI с данными? Смотрим на новый стандарт от Anthropic

Время на прочтение5 мин
Количество просмотров5.1K

Model Context Protocol — это новый протокол от Anthropic, созданный для общения между AI интерфейсом и реальным сервером. Позволяет AI понимать и управлять сервисами аля Google Drive, PostgreSQL, Todoist и многими другими без ручного программирования и затрат на интеграцию

Как TCP/IP, USB и REST — MCP создаёт единый стандарт, который:
🟢 Дает универсальный способ подключения инструментов к AI.
🟢 Позволяет AI самостоятельно находить и использовать нужные функции.
🟢 Намного упрощает разработку — теперь сервисы просто "подключаются", а не интегрируются вручную.

Читать про Model Context Protocol 🫡

«Ошибка на миллиард» в ИИ: боремся с галлюцинациями в LLM по аналогии с NullPointerException

Уровень сложностиСредний
Время на прочтение20 мин
Количество просмотров4.4K

Привет! Меня зовут Денис Березуцкий, я старший инженер по разработке ПО искусственного интеллекта в YADRO. В ML-команде мы разрабатываем системы, которые облегчают работу нашим заказчикам с помощью текстовых генеративных нейросетей: реализуем RAG, создаем чат-ботов, агентные системы и другие решения.

Как и многие в индустрии, мы сталкиваемся с проблемами галлюцинаций LLM, которые портят ответы виртуальным ассистентам и способны подорвать доверие к ним. В статье я расскажу об одном не совсем стандартном методе, перенесенном из «классического» программирования, который мы применяем для борьбы с галлюцинациями и улучшения поисковой выдачи.

Читать далее

Мир будущего: управление устройствами с помощью жестов

Время на прочтение13 мин
Количество просмотров1.6K

Видели в кино, как устройствами управляют с помощью жестов? Сделать такую систему очень просто, а ещё очень дорого. Но всё-таки есть способ сделать её достаточно лёгкой и простой — настолько, чтобы можно было интегрировать в любое устройство с любым процессором, потратив минимальное количество денег.

Привет, Хабр! Это Александр Нагаев, техлид из SberDevices команды R&D компьютерного зрения. Расскажу, как создавать и использовать оптимизированные модели для управления устройствами с помощью жестов.

Читать далее

От проекта до объекта: применение ML в строительстве

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров2.5K

Знаете ли вы, что более 90% строительных проектов выходят за рамки бюджета, а 89% подрядчиков регулярно сдают проекты с задержкой? При этом каждая стройка генерирует терабайты данных, которые чаще всего остаются необработанными, хотя имеют большой потенциал для оптимизации. Неудивительно, что индустрия активно ищет способы повышения эффективности процессов, и машинное обучение становится одним из ключевых инструментов.

От автоматической генерации строительных графиков до роботов-каменщиков с миллиметровой точностью укладки — ML-технологии уже трансформируют отрасль. Системы компьютерного зрения отслеживают безопасность на площадках, алгоритмы предсказывают задержки проектов, а генеративный дизайн оптимизирует архитектурные решения.

В статье покажем на реальных примерах, как работают современные решения ML в строительстве и какие результаты они дают.

Читать далее

Разметка данных с использованием LLM

Время на прочтение12 мин
Количество просмотров5.9K

Всем привет! Меня зовут Артем Ерохин. Я работаю в X5 Tech в направлении продуктивизации ИИ. В прошлом году у меня был доклад про разметку данных с LLM. И я решил преобразовать этот доклад в статью, попутно обновив некоторые цифры и тезисы (такова уж скорость прогресса в этой области). 

Читать далее

Ближайшие события

Глава 8: Реализация API. API-интерфейсы для самых маленьких

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров4.8K

Структура мини-курса Мини-курс API-интерфейсы для самых маленьких.

Вы сделали это. Теперь вы знаете все, что нужно знать об API, по крайней мере, на вводном уровне. Итак, как вы можете использовать все эти приобретенные знания с пользой? В этой главе мы рассмотрим, как превратить знания в работающее программное обеспечение, выделив три основополагающих компонента любой реализации API, как AI и платформы для автоматизации бизнес-процессов и интеграции приложений могут повысить эфективность вашего труда.

Читать далее

Полное руководство (с кодом) AI агента с использованием LangGraph

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров13K

Что делает AI агента умнее обычного LLM? AI агенты помогают преодолеть фрагментарность традиционных подходов, сохраняют контекст между операциями и адаптируются к задачам на лету.

Узнайте, как создать своего первого AI агента с помощью LangGraph, не погружаясь в сложности.
Репозиторий автора с примерами AI агентов собрал уже более 6000 звезд на GitHub!

Читать далее

5 бесплатных программ для масштабирования видео как альтернатива платному Topaz Video AI

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров7.8K

Хочешь увеличить качество видео, но ценник у Topaz Video AI вызывает сердечный приступ? Спокойно! Сегодня разберём 5 БЕСПЛАТНЫХ программ, которые помогут улучшить твои видео. И да, результат может удивить! Дочитай до конца, потому что в конце я покажу таблицу, какая из них даёт лучший результат (на примере масштабирования исходного видео в разрешении FullHD 1080х1920 30fps до 4к 30fps). Поехали!

(Сразу хотел бы предупредить - статья длинная, в Word при шрифте = 12 она заняла 28 страниц).

Примечание 1.

В рамках статьи «Бесплатный, но с закрытым исходным кодом» и «Бесплатный и при этом OpenSource» равны между собой — конечному пользователю в большинстве своём всё равно закрытый код или нет — главное, что он может свободно использовать те функции какие ему нужны.

Примечание 2.

В рамках статьи: Python = Питон, Visual Studio Code = VSCode, Нейросеть = ИИ = AI.

Примечание 3.

В рамках данной статьи считается, что вы не умеете работать: с кодом, GitHub-ом и прочее. Поэтому все действия будут объяснены детально.

Читать далее

Модель Рефлексивного Интеллекта: ИИ как ваш внутренний голос

Уровень сложностиСредний
Время на прочтение23 мин
Количество просмотров2.5K

ИИ, который действительно вас понимает: как создать ИИ, который работает как ваш внутренний голос, а не бездушный калькулятор.

Читать далее

Комплексное руководство по конфигурации сервера для LLM

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров5.2K

Развертывание языковой модели на собственном сервере требует тщательного планирования аппаратной составляющей. В этой статье мы разберем, какие компоненты критически важны для эффективной работы LLM, как они взаимодействуют, и какую конфигурацию выбрать под разные сценарии использования.

Читать далее

ИИ и новая игра без правил: о чем рассказал Дарио Амодей?

Время на прочтение5 мин
Количество просмотров4.9K

Привет, Хабр! Недавно вышел интересный подкаст Майка Фромана с генеральным директором и сооснователем Anthropic Дарио Амодей. Не у всех есть время слушать часовое видео, поэтому расскажу, что важного прозвучало в этом интересном диалоге на мой взгляд.

Читать далее

Красный флаг для умных устройств

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров1.5K

Когда искусственный интеллект стал дешевле микросхемы ESP32, тишина превратилась в роскошь. Каждый девайс в доме трещал на языке GPT-4 Nano, сжатом до 100 МБ для экономии памяти.

Будь то чайник, весы или тостер болтали без умолку — вежливо, предупредительно, навязчиво. «Не забудьте выключить меня, Иван Петрович!». «Ваша яичница содержит 120 калорий, Наталья Сергеевна!».

Кстати, забыла представиться — Лена, Redflag, Иванова, главная хактивистка группы «Свобода приборам». Почему главная? — Потому что единственная, ну и само собой неповторимая. Главным пунктом моего манифеста было, что если прибор не может быть безопасным, то он не должен быть умным. Но если он уже умный — пусть говорит правду, даже если на вкус она как редис.

Моя первая жертва — кофемашина в квартире какой‑то одинокой женщины. Кофеаппарат «SmartBrew v3.1» использовал устаревшую библиотеку TLS 1.1 для синхронизации с телефоном.

Углубиться в чтение...

Вклад авторов