Все потоки
Поиск
Написать публикацию
Обновить
1119.87

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Анализ системного промпта ChatGPT-4o-image-safety-policies

Время на прочтение8 мин
Количество просмотров2K

Когда ты или я кидаем картинку в ChatGPT с просьбой проанализировать ее, или извлечь данные, то, увы, это происходит не по умолчанию, а согласно определенным правилам. И благодаря умельцам из интернетов, можно разузнать, по каким правилам работает анализ изображений.

Читать далее

От «равных» весов к «умным»: OTPO для более точного Alignment LLM

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров399

LLM уже умеют многое, но качество их ответов по-прежнему упирается в тонкую настройку под человеческие предпочтения. Direct Preference Optimization стал стандартом де-факто для алайнмента, но у него есть фундаментальный изъян: все токены в ответе считаются равнозначными. Для человека же очевидно, что слово «Париж» в ответе на вопрос о столице важнее любого предлога или союза. В этой статье мы разбираем свежий метод OTPO, который предлагает решение через оптимальный транспорт и учится поднимать вес смысловых токенов, оставляя служебные на заднем плане.

Читать далее

Нейросети для генерации видео: краткий обзор Veo 3

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5.4K

Раннее утро, тихая улица, а навстречу вам идёт бабушка в платочке, держащая на поводке… носорога.

Да, Google в этом году решил окончательно стереть грань между «снять фильм» и «написать промпт». Новая версия их генератора Veo 3 — это уже не шутка и не эксперимент, а очень серьёзное заявление. Речь идёт не о смешном десятисекундном ролике, а о полноценном кино: со светом, звуком, движением камеры и даже с элементами актёрской игры.

Сегодня мы разберёмся, что умеет Veo 3, посмотрим, на что он действительно способен, и самое главное — попробуем «снять» собственный ролик с озвучкой и атмосферой.

Не переключайтесь, будет интересно!

Читать далее

Как правильно вайбкодить! Советы от QA, который запустил свою песочницу

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров9.5K

Привет, заводчане! В этой статье вы найдете реальные технические советы по особенностям общения с бездушными ИИ моделями, в частности я расскажу про GPT 4o и свежую 5, но эти советы также применимы и к другим AI.

‼️Сразу внесу ясность: рекомендации предназначены для личных пет-проектов и
не призывают нарушать политику конфиденциальности вашей компании!

Я инженер по тестированию и уже около года поддерживаю работу своей песочницы по практике тестирования и подготовке к собеседованию на позицию Full Stack QA. Опыт вайбкодинга повлёк за собой понимания работы JS, CSS и HTML, если говорить конкретно про веб-проект. Благодаря такому проекту и подходу вайбкодинга, я собрал технические инструкции и заметки как выжать максимум из ответа ИИ моделей, здесь будет больше технических особенностей работы с моделями, нежели готовые промпты. Ниже указал 12 советов, которые упростят вам написание кода, разработку своего проекта, изучение нового стека или учебную практику.

Читать далее

Когда YOLO не спасает: как один параметр может испортить всё

Время на прочтение3 мин
Количество просмотров2.4K

История о том, почему в ML побеждают не те, у кого самая большая модель, а те, кто понимает, что они делают.

Читать далее

Память для роботов: как машины учатся видеть мир осознанно

Время на прочтение4 мин
Количество просмотров630

Как научить робота не просто идти по указке, а видеть окружающий мир осмысленно — почти как человек? Сейчас даже самые продвинутые ИИ в роботах часто живут «здесь и сейчас»: увидели диван — пошли к дивану, только камера повернулась — всё забыли. В итоге их навигация напоминает путешествие вслепую, где нет места памяти о прошлом и настоящему планированию. А у человеческого мозга с этим всё хорошо: карта местности в голове и опыт, который легко пересобирается под цель.

Команда исследователей посмотрела, как наше мышление можно перенести на алгоритмы, и собрала для робота не просто память, а целую когнитивную карту. В результате он начинает думать маршрутами, оперировать ориентирами, «удивляться» новому и экономно хранить только важное. Ведь когда машина впервые учится замечать не только объекты вокруг, но и структуру событий — это совсем другой уровень ИИ. 

Как устроен этот подход и что получилось в реальных экспериментах — обо всём по порядку.

Читать далее

От парсера до ИИ-платформы: как рекрутер «навайбкодил» инструмент, который экономит часы работы

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров9.4K

Ещё недавно подготовка CV занимала 40 минут. Теперь — 30 секунд и помощь ИИ в анализе кандидатов. В тексте рассказываем, как с помощью вайб-кодинга рекрутер «Технократии» собрал парсер, из которого выросла внутренняя HR-платформа с искусственным интеллектом для создания резюме и оценки кандидатов.

Читать далее

Agentic RAG: создание более умных ИИ-систем, понимающих контекст

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров5.3K

Команда AI for Devs подготовила перевод статьи о новом подходе — Agentic RAG. Он превращает извлечение данных в активный процесс: агенты сами решают, где искать, как уточнять запросы и когда остановиться. В результате ИИ становится гибче, точнее и действительно готовым к «боевым» задачам.

Читать далее

VPS-сервер как платформа для ИИ-агентов

Время на прочтение8 мин
Количество просмотров6.5K

Сервер с LLM-интерфейсом — это не просто сервер, а полноценная платформа для запуска интеллектуальных агентов. Среди прочего, они отлично справляются с задачами мониторинга, которые мы традиционно решали с помощью скриптов, демонов и специализированных программ.

Например, на VPS можно запустить агента с круглосуточным мониторингом цен на маркетплейсах: на Хабре недавно была статья об этом. Понятно, что он запускается на любом компьютере, но конкретно для целей мониторинга сайтов в интернете требуется онлайн 24/7.

Читать далее

Невидимая рука интерфейса: как ИИ меняет дизайн и дизайнеров

Время на прочтение11 мин
Количество просмотров4.1K

Что я понял о будущем дизайна, пока наблюдал, как искусственный интеллект отбирает у человечества мышки

Читать далее

DIY: как сделать игру за несколько минут

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров7.8K

От идеи до готовой игры за пару вечеров: как гуманитарий сделал аркаду на ESP32 с помощью Copilot и Wokwi. Исходники в комплекте.

Читать далее

Как инженеры могут снизить риски ИИ в цифровой трансформации – часть 2

Время на прочтение3 мин
Количество просмотров306

ссылка на 1 часть

Изучаем еще пять самых распространенных рисков ИИ и способы их минимизации.

Функциональность ИИ все чаще становится частью проектов цифровой трансформации. Внедрение ИИ добавляет бизнес-ценности таким инициативам. Однако инженеры сталкиваются с множеством рисков, связанных с ИИ. Эти риски можно использовать как отправную точку для формирования реестра рисков проекта цифровой трансформации.

Рассмотрим последние пять из десяти самых распространенных рисков ИИ и способы их снижения. Чтобы прочитать о первых пяти, перейдите по ссылке.

Читать далее

Как была сформулирована концепция машинного обучения и как она реализовывалась на практике

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров2.2K

В самых общих словах машинное обучение (machine learning, ML) — это обучение компьютера самостоятельно решать поставленную перед ним задачу. Вообще-то обучать свою «разностную машину» планировал еще Бэббидж, проектируя ее на базе своей «аналитической машины», но это потом назвали программированием. 

А в нынешнем определении машинного обучение так или иначе присутствует искусственный интеллект (ИИ). Мол, это обучение компьютера решать поставленные перед ними задачи «без явного программирования», как это сформулировано в самых острожных из современных определений машинного обучения, используя данный ему человеком ИИ и, опять-таки самостоятельно совершенствуя его, умнеть еще больше. То есть выходит, что машинное обучение это обращение к разуму компьютера, пусть искусственному, машинному, но разуму, аналогичному нашему в вами. Именно поэтому хронологию машинного обучения современные IT-историки начинают с 1943, когда в журнале Bulletin of Mathematical Biophysics была опубликована статья «A Logical Calculus of the Ideas Immanent in Nervous Activity» Уоррена Маккалока и Уолтера Питтса.

Читать далее

Ближайшие события

Публичное вскрытие: Провал IBM Watson Health

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров2.5K

Как IBM не смогла превратить технологию Watson в медицинский продукт и потеряла миллиарды.

(От автора: Все факты в этом материале взяты из открытых источников: The Wall Street Journal, STAT News, IEEE Spectrum и других. Имена и события реальны. Наша цель — извлечь уроки из чужих ошибок, а не бросить камень в гиганта. Великие провалы учат лучше скромных успехов.)

Читать далее

Как ИИ помогает разгрести легаси и ускорить модернизацию

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.7K

Модернизация легаси-систем редко упирается в «переписать код». Настоящая боль — это реконструкция архитектурных идей, которые давно утонули в слоях костылей и концептуального дрейфа. Когда бизнес уже ушёл вперёд, а софт застрял в прошлом, любое изменение превращается в риск подорвать критичный функционал. В статье разбираем, как ИИ может взять на себя часть этой работы: от трассировки кода и визуализации связей до восстановления бизнес-требований. Речь не про генерацию рутинных кусков кода, а про то, как большие языковые модели помогают справляться с фундаментальной сложностью и делают проекты модернизации менее хаотичными и более предсказуемыми.

Читать далее

Как быстро сделать Low-Code RAG для своей компании?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров8.5K

Допустим, у вашей организации есть внутренний сервис с большим объемом накопленных документов, тикетов и комментариев, и все это ведется в Jira. Представьте, если при клиентском запросе или взаимодействии с контрагентом, можно было бы обращаться к AI-ассистенту и получать максимально релевантные ответы, дополняя существующую в вашей системе информацию данными из внешних источников. Очевидно, что это позитивно отразилось бы на конверсии в продажи за счет персонализированного подхода, увеличило бы уровень удовлетворенности сервисом у клиентов, да и менеджерам бы облегчило жизнь!

Если вы руководитель отдела или ведете собственный бизнес, вы наверняка подумаете «наверное, это дорогая технология, которая требует больших затрат и найма техспециалистов для разработки». Когда-то это было так, но теперь нет.

В этой статье я опишу короткую инструкцию, как реализовать что-то похожее на описанный функционал без особых навыков. Лучшие умы человечества могут уличить меня в том, что моя предлагаемая реализация максимально проста и наивна. И да, это так. Целью я ставил — показать массовому читателю прикольную штуку, а не задушнить ;-) 

Читать дальше

Масло, вода, ртуть, акварель. Простой тест для LLM… или нет?

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров3K

Недавно я провёл небольшой эксперимент: проверил, как разные модели от OpenAI справляются с одной и той же задачей — создать красивую симуляцию «жидкостей в стакане» с помощью HTML5 Canvas и JavaScript.

На словах всё звучит просто, но на деле это проверка и кода, и физики, и UX.

Результаты получились очень показательные, а кое-где даже удивительные. Делюсь наблюдениями и видео 👇

https://youtu.be/yvL5P03oUuk

И какие выводы?

Как инженеры могут снизить риски ИИ в цифровой трансформации

Время на прочтение2 мин
Количество просмотров278

Функциональность ИИ все чаще становится компонентом проектов цифровой трансформации. Внедрение ИИ добавляет бизнес-ценности, но также создает риски. Инженеры могут использовать этот список для включения в реестр рисков своих проектов.

Читать далее

Универсальные модели в видеоаналитике: единый фундамент для множества задач

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров823

Привет! С вами Кирилл Тузов, Data Scientist в команде видеоаналитики бэк-офиса Wildberries & Russ.

Камеры видят всё. Вопрос в том, распознают ли наши алгоритмы, что именно они видят, — и насколько быстро, надёжно и без тонны ручной работы это происходит. В этой статье я расскажу, как мы используем Self-Supervised, Zero-Shot и мультимодальные модели, чтобы приблизиться к максимально возможной эффективности.

Читать далее

Увидел-кликнул-победил: как UItron управляет компьютером по-человечески

Время на прочтение4 мин
Количество просмотров626

Могут ли нейросети действительно пользоваться компьютером — видеть обычный экран, выбирать нужные кнопки, запускать приложения, одним словом, действовать как живой человек с мышкой и клавиатурой? Оказывается, такие агенты уже не фантастика.  ⠀  

В свежем исследовании команда UItron показала, как можно научить ИИ не просто понимать команды, а самостоятельно разбираться в сложных интерфейсах, планировать свои действия и шаг за шагом решать сложные задачи. Интересно, что для этого им пришлось переосмыслить саму идею о том, что значит "опыт" для машины.

Разбираемся, как всё это работает, — в новом обзоре.

Читать далее

Вклад авторов