Обновить
1220.37

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

Основатель Telegram Павел Дуров представил децентрализованную сеть Cocoon (Confidential Compute Open Network), которая будет задействовать искусственный интеллект и блокчейн TON. Проект, запуск которого запланирован на ноябрь 2025 года, предназначен для безопасного и приватного выполнения ИИ-инференса на условиях полной анонимности.

Cocoon представляет собой децентрализованную вычислительную сеть, которая объединяет технологии искусственного интеллекта (ИИ) и блокчейна TON. По словам основателя Telegram, централизованные ИИ-платформы могут собирать и использовать данные пользователей, а Cocoon является альтернативным решением, которое основано на принципах децентрализации и приватности. Владельцы GPU предоставляют создателям ИИ-приложений вычислительные мощности для их работы в обмен на криптовалюту TON, а рядовые пользователи сохранят полную конфиденциальность при работе с ИИ-продуктами. Запуск технологии запланирован на ноябрь 2025 года.

Предполагается, что сеть Cocoon будет работать на основе GPU-майнеров, получающих вознаграждение в Toncoin, а разработчики приложений получат доступ к недорогим ИИ-инструментам. По словам Павла Дурова, Cocoon обеспечит полную приватность и децентрализацию, позволяя интегрировать любые ИИ- агенты, включая DeepSeek и Qwen, без риска утечек.

Примечательно, что на презентации Дуров с иронией добавил, что изначально рассматривал для проекта название Private AI Network, что образует аббревиатуру P.A.I.N. («боль»).

Теги:
0
Комментарии1

Привет, хабровчане! 😊

Недавно я копался в мире ИИ-инструментов для разработки — тех, что помогают писать код быстрее и умнее. Знаете, когда сидишь за проектом и думаешь: "А не взять ли помощника, который подхватит идеи на лету?" Решил поделиться обзором нескольких интересных вариантов на рынке. Это не глубокий разбор с бенчмарками (для этого нужны отдельные тесты), а просто описание, чтобы понять, что можно выбрать под свои нужды. Я опираюсь на личный опыт и отзывы из сообществ — вдруг кому-то пригодится для экспериментов.

Давайте по порядку:

  1. Cursor — это как эволюция VS Code с встроенным ИИ. Он автокомплитит код, генерирует фрагменты по описанию, понимает контекст проекта и даже помогает с отладкой. Подходит для тех, кто любит привычный интерфейс, но хочет ускорить рутину. Работает на Windows, macOS и Linux, есть бесплатная версия, но премиум открывает больше моделей ИИ. Идеально для соло-разработчиков или команд, где нужно быстро итератировать.

  2. Harvi Code — российский продукт, первый в России аналог Cursor, построенный на мощной модели Sonnet 4.5 (от Anthropic, которая славится точностью и скоростью). Это расширение для VS Code и Cursor с удобным интерфейсом, как в знакомых IDE, плюс фокус на хороших ценах (не дерут втридорога за подписку). Подходит для генерации кода, отладки и работы с проектами. Если вы в РФ и ищете локальный вариант без заморочек с платежами — стоит попробовать.

  3. Lovable — здесь акцент на создание веб-приложений без глубокого кодинга. Чат с ИИ: описываешь идею на естественном языке, и он генерирует full-stack app — от фронта до бэка. Удобно для прототипов или MVP, особенно если вы не хотите копаться в деталях. Поддерживает интеграции с базами данных и API. Минус — иногда нужно дорабатывать вручную, но для стартапов или хобби-проектов это спасение.

  4. Bolt (bolt.new) — браузерный инструмент для быстрого создания сайтов, приложений и прототипов. Вводишь промпт — и вуаля, он строит всё от начала до конца, включая деплой. Работает с веб, iOS и Android. Круто для тех, кто хочет экспериментировать без установки софта. Есть интеграции с Expo для мобильных apps. Подходит новичкам или когда нужно быстро проверить концепцию.

  5. Roo Code — это расширение для VS Code и Cursor, как целая команда ИИ-агентов прямо в вашем редакторе. Он анализирует весь проект, предлагает мульти-шаговые решения, ускоряет редактирование в 10 раз. Поддерживает разные модели ИИ (Anthropic, OpenAI), есть инструменты для автоматизации задач. Хорош для сложных проектов, где нужен глубокий контекст — не просто автокомплит, а умный помощник.

  6. Kilo Code — открытый ИИ-агент в виде расширения для VS Code, JetBrains и Cursor. Генерирует код, автоматизирует задачи, предлагает рефакторинг. Есть система инструментов для взаимодействия с окружением (безопасно, с контролем). Бесплатный, с опцией кастомизации. Идеален для тех, кто предпочитает open-source и хочет интегрировать в свой workflow без лишних зависимостей.

В общем, выбор зависит от вашего стиля: если любите браузер — Bolt или Lovable; если вглубь кода — Cursor, Harvi, Roo или Kilo. Я пробовал пару из них на пет-проектах, и реально сэкономил время. Что вы думаете? Пользовались кем-то из списка? Делитесь в комментах, может, вместе разберёмся, какой подойдёт под разные языки или фреймворки. Буду рад обсуждению! 🚀

Ссылки для удобства:

Теги:
+6
Комментарии1

Вице-президент Google выпустил бесплатную интерактивную книгу про интеллект, включая искусственный. «What Is Intelligence?: Lessons from AI About Evolution, Computing, and Minds». Автор Блейз Агуэра-и-Аркас на пальцах объясняет, как работает ваш мозг и как в нём двигаются шестерёнки — это не чудо, а механизм, который можно прокачать. Как мозг «угадывает» следующий шаг и почему это и есть основа интеллекта. Почему эволюция — огромная обучающая система. Чем ИИ на нас похож, а где принципиально другой. Как не путать «интеллект» и «сознание». Чего ждать от развития нейронок и когда нас всех заменят.

Теги:
Рейтинг0
Комментарии1

Технологические хайпы: от UML до ИИ

За 20 лет в IT видел много технологических циклов. Сейчас наблюдаю знакомую картину: ИИ-истерия повторяет паттерн предыдущих хайпов.

1990-2000е: UML и генерация кода

  • Rational Rose и UML-генераторы кода обещали "программирование без программистов"

  • Результат: много шума, мало толку. Разработчиков стало только больше

2000-2010е: Agile-бум

  • Agile стал мантрой, которую повторяли все подряд

  • Консультанты обещали "спасти" любой проект

  • Команды внедряли скрамы, не понимая сути

  • Результат: много шума, мало толку. Разработчиков стало только больше

2010-2020е: Low-code и BPMN

  • BPMN-системы сулили автоматизацию всех бизнес-процессов

  • Low-code платформы обещали заменить разработчиков

  • Результат: много шума, мало толку. Разработчиков стало только больше

Сейчас: ИИ-истерия

  • ИИ решает все проблемы человечества

  • Каждый второй - "эксперт по ИИ"

  • Люди спрашивают ChatGPT, что съесть на завтрак, вместо того чтобы научиться планировать питание

  • Результат: пока тот же

В чем разница:

ИИ - реальная технология с потенциалом изменить все. Но хайп и истерия - те же.

Почему это опасно:

ИИ не всегда прав. По данным исследований, 45% ответов содержат существенные ошибки, 81% - мелкие погрешности. Проблема в том, что ИИ может генерировать убедительно звучащую чушь.

Галлюцинации ИИ:

  • Создает несуществующие источники и цитаты

  • Может "диагностировать" болезни, "составлять" юридические документы

  • Иногда выдает устаревшую информацию как актуальную

  • Неспециалист не отличит правду от выдумки

Мой опыт подсказывает:

Хороший инструмент в руках специалиста дает синергию. В руках дилетанта - часто больше вреда, чем пользы.

Не стоит гнаться за модой. Сначала разберитесь в предмете, потом используйте инструменты. ИИ - мощная штука, но не панацея.

Источники:

Теги:
Всего голосов 14: ↑12 и ↓2+12
Комментарии7

Стратегический консалтинг ушёл в ИИ. McKinsey оказались одним из крупнейших пользователей ChatGPT. Идеи от искусственного интеллекта, включая фейковые статьи и факты, продают клиентам за миллионы долларов.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Делимся горячими новостями нашей платформы Cloud.ru Evolution 🚀

🎁 Акции

  • Работайте бесплатно с 20+ мощными open sourse моделями из Evolution Foundation Models. Все уже готово: вам не придется тратить время на развертывание инференса или код, нужно только подключиться через API. Акция действует до 31 октября.

  • Получите 35 000 бонусов для работы в Evolution Data Platform. Используйте бонусные рубли, чтобы управлять Big Data, собирать данные для бизнеса и ML. Предложение только для юрлиц, действует до 31 декабря 2025 года.

🛡️ Новые сертификаты

Надежность наших сервисов подтверждена регуляторами. Платформа Cloud.ru Evolution теперь в реестре отечественного ПО (РОПО), а еще она получила сертификаты PCI DSS и ФСТЭК России.

🤖 Evolution ML Inference

🧑‍💻 Evolution Notebooks

Что мы добавили в сервис:

🌐 Evolution DNS

💻 Evolution Managed Kubernetes

Управляйте контейнерными приложениями в Kubernetes 1.33 — теперь Evolution Managed Kubernetes поддерживает и эту версию. Что в ней есть:

  • В бета-тесте — использование образов Open Container Initiative (OCI) в качестве томов в подах, а еще In-place resource resize для вертикального масштабирования подов.

  • Общедоступными стали поддержка Sidecar-контейнеров, Multiple Service CIDRs, нового бэкенда nftables для kube-proxy, subresource для kubectl. Полный обзор изменений есть в официальном блоге Kubernetes.

📚 Evolution Managed PostgreSQL

  • Для кластеров в режиме «Бизнес» теперь можно создать отдельный WAL-диск. Так вы сможете увеличить размер как основного, так и WAL-диска.

  • В документации сервиса новый раздел — справочник API. Узнайте, как управлять вашими ресурсами в облаке и получать о них информацию с помощью REST API.

📀 Evolution Object Storage

Улучшили мониторинг: получайте информацию о максимальном объеме бакетов, о внешнем и внутреннем исходящем трафике.

🔋 Evolution Compute

  • Удаляйте и создавайте несколько виртуалок одновременно.

  • Отключайте и подключайте загрузочные диски между ВМ.

  • Переустанавливайте ОС на ВМ, которая работает в данный момент.

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии0

Как AI меняет разработку прямо сейчас — приглашаем на прямой эфир 31 октября в 11:30

«Забудьте всё, чему вас учили в университете!» — построить карьеру, ни разу не услышав этой фразы, не удалось, пожалуй, ещё ни одному разработчику. Сегодня всё, что казалось нам очевидным и понятным, снова ставится под сомнение. Искусственный интеллект стремительно меняет правила игры, пока вы даже не догадываетесь об этом.

Если для вас AI — это просто умный поисковик, который помогает с небольшими задачами, готовьтесь. Впереди вас ждёт дивный новый мир и масса открытий.

Евгений Сатуров, CTO мобильной разработки Surf, расскажет, какие «умные» инструменты уже используют в серьёзной разработке сегодня, что они умеют и как изменят рынок труда и роль разработчика в ближайшие годы.

Бонусы для участников:

1. Вы уйдёте с несколькими практическими советами — как превратить AI из услужливого, но вредного помощника в настоящего ментора, готового работать на вас круглосуточно.

2. Самым активным — приятные призы, которые мы распределим в конце с помощью небольшого челленджа, подробности будут в Telegram.

Когда эфир: 31 октября, 11:30 (МСК).
Где: VK Video.

Теги:
Всего голосов 1: ↑0 и ↓1-1
Комментарии0

Атрофия межушного ганглия

Товарищи, нам с вами надо серьёзно поговорить...

Каждый раз, когда я обнаруживаю, что присланное мне письмо, код или статья сгенерированы нейросетью, меня охватывает глубокое чувство разочарования. Настолько сильное, что я не могу уже дальше это читать, а к автору сего поделия появляется чувство неимоверной брезгливости.

И дело даже не столько в том, что он экономит своё время на написание полотна текста или кода за счёт моего времени чтения и выискивания смысла в мутной воде переполненной неуместными формулировками, странными приседаниями и лютыми галлюцинациями, сколько в том, что он на полном серьёзе считает, что я настолько тупой, чтобы этого не заметить.

И нет, не буду я кочегарить нейросеть, чтобы она резюмировала сей опус. Долбитесь в этот испорченный телефон как-нибудь сами, а мне лучше дайте оригинальный промпт. Даже если он полон очепяток и косноязычия — его я пойму гораздо лучше любой нейросети, и гораздо быстрее, чем продукт её жизнедеятельности.

Нейросетевая аугментация мозга не просто экономит время — это не калькулятор и не автомобиль. Она лишает вас когнитивного развития — умения понимать смысл чужих слов, корректно рассуждать о них, и ясно излагать свои мысли. Мышца, которую не напрягаешь, быстро атрофируется. И если быть худым может и красиво, то с глупым иметь дел не хочется совсем. А хочется только плюнуть в карму и пойти дальше.

Иллюстрация на примере Гипер Бота для сравнения.

Теги:
Всего голосов 14: ↑12 и ↓2+10
Комментарии4

Новые лекции Python + AI выпустили в Microsoft. В них эксперты собрали самую актуальную информацию про кодинг и создание продвинутых нейропомощников на основе последних разработок с подробными презентациями и примерами кода, в том числе RAG, эмбеддинги, агенты и MCP-протокол.

Теги:
Всего голосов 3: ↑2 и ↓1+1
Комментарии0

Открытый проект AI Video Transcriber помогает транскрибировать видеоролики в сжатый и отлично написанный текст. Работает просто, вытаскивает текст из любых видео за секунды, а потом корректирует и делает подробное саммари. Решение поддерживает более 30 самых популярных площадок, в том числе YouTube, TikTok, Bilibili и прочие. Проект не просто вытаскивает текст из видео, но делает настоящее эссе: дополняет фразы и реплики, корректирует факты и мысли, редактирует текст и доводит до идеала. Основа — Fast Whisper (лучшая нейронка для транскрибации видео). Может смотреть видео и сразу же выдавать текстовые материалы и уточнения. Сегментирует видео на 20-минутные отрывки и делит их на разделы, чтобы проще было изучать материал.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии1

OpenAI + Google Studio и немного Python = создаем бесплатную аудиокнигу без лишних заморочек

Ведущая Coral c Openai.fm
Ведущая Coral c Openai.fm

 В своё время моё отношение к аудиокнигам изменилось благодаря легендарному проекту «Модель для сборки» с Владом Коппом. Именно благодаря МДС я понял, что книги можно не только читать, но и прекрасно воспринимать в формате аудио. Аудиоформат даёт возможность знакомиться с произведениями в дороге или во время прогулок. Прекрасно помню времена, как загружал в свой MP3-плеер на 512 МБ выпуски МДС и, вместо того чтобы ехать с работы в тесной маршрутке, устраивал себе полуторачасовые прогулки в компании очередного фантастического рассказа.

Эпоха аудиоизобилия

Сегодня выбор аудиокниг несравним с тем, что было пятнадцать лет назад. В интернете можно найти огромное количество как профессионально озвученных произведений, так и любительских версий. Однако даже при всём этом богатстве выбора нередко встречаются книги, которые до сих пор никто не озвучил.

Например, один из моих любимых циклов — «Зоны мысли» Вернора Винджа. «Пламя над бездной»«Глубина в небе» и «Болтушка» легко найти в сети. А вот заключительную часть — «Дети неба» — увы, никто не озвучил.

Поскольку мы живём в эпоху искусственного интеллекта, решение приходит само собой: если нужной аудиокниги нет — сделай её сам. Требования у меня простые, без претензий:

  1. Качество должно быть приемлемым;

  2. Платить не хочется, поэтому все должно быть полностью бесплатным.

Голос

Вспомнил я про сайт OpenAI FM — демо-площадку голосовой модели gpt-4o-mini-tts . Она звучит естественно и хорошо справляется с русским языком. Выбор из 11 разных дикторов. А так же есть классная фитча - промт инструкции для стиля речи, благодаря чему можно управлять «подачей» — делать её более спокойной, вдохновлённой или нейтральной . Поигравшись с промтами и выбрав голос, переходим к следующему этапу. На сайте можно бесплатно генерировать небольшие аудиофрагменты длиной до 999 символов. Ограничение не стало проблемой. Берем Python + Selenium WebDriver, и получаем программу, которая:

  • делит текст книги на чанки нужной длины,

  • отправляет их на сайт,

  • сохраняет аудиофайлы,

  • затем объединяет всё в одно произведение с помощью FFmpeg.

Результат получился неожиданно достойным. Да, между фрагментами иногда чувствуется разница в тембре, особенно в первые секунды. А ударения не всегда точны и изредка проскакивает лёгкий акцент. Но в целом — получилась полноценная озвученная аудиокнига.

Музыкальная подложка

После того как книга была готова, захотелось добавить фоновую музыку. Можно было просто подобрать подходящий трек, но ради спортивного интереса я решил сгенерировать музыку самостоятельно.

Платные сервисы вроде Suno или Udio я сразу отбросил. Зато вспомнил про Google AI Studio, где в разделе Build есть приложение PromptDJ MIDI. Оно позволяет создавать музыку прямо в браузере — достаточно задать стиль и параметры.

Скопировал прямо в Studio приложение, в промпте указал стиль space ambient и добавил возможность скачивания получившегося трека. Поигравшись с настройками в полученном приложении, получил именно то, что меня устроило.

Оставалось объединить музыкальную дорожку с голосом — снова помог FFmpeg.

Инструменты:

  • OpenAI FM — генерация речи;

  • Google AI Studio (PromptDJ MIDI) — генерация фоновой музыки;

  • Python + Selenium + FFmpeg — автоматизация и сборка.

Затраты: 0 долларов и несколько часов времени.

Итог: Получилась аудиокнига приличного качества с музыкальным сопровождением. Конечно, это не уровень профессиональных дикторов , но для личного использования — IMHO более чем достойно. Плюс абсолютно бесплатно.

Теги:
Всего голосов 8: ↑7 и ↓1+7
Комментарии22

По информации СМИ, OpenAI хочет показывать в ChatGPT таргетированную рекламу прямо в чат-боте на основе переписок с ИИ. Например, если пользователи говорят о спорте, им предложат спортивную форму или добавки. Контекст ИИ будут юзать, чтобы показывать больше рекламы. Если пользователи отключат рекламу, то лишатся всей памяти чат-бота. Контекста больше не будет, всю работу придётся организовать снова.

Теги:
Рейтинг0
Комментарии0

Ближайшие события

На Hugging Face вышел новый инструмент для вайбкодеров. Это среда для создания мощнейших ИИ-агентов openEnv, где можно собирать, подключать, интегрировать, тестировать и масштабировать агентов под свои задачи. Там же можно обучить с подкреплением собственную нейронку. Есть полный комплект для работы: плагины, инструменты, API, контекст и прочее. Результат — автоматизация задач и проектов, целые приложения и сервисы под контролем ИИ, а также системы из связанных ИИ-агентов.

Теги:
Рейтинг0
Комментарии0

Из чего состоит хороший промпт для генерации картинок

Промпт — это текстовая инструкция для нейронки, от его качества напрямую зависит конечный результат. Искусственный интеллект не умеет читать мысли или угадывать ваши предпочтения, а потому задачу ему надо ставить детально, конкретно и точно. Попробуем разобраться, как именно.

Предположим, мы хотим изобразить кота-самурая. Первым делом создаем черновой промпт — тот самый, с которого всё начнется. Не стоит думать, что достаточно будет сформулировать одно подробное техзадание для нейронки — их абсолютно точно будет несколько. И может быть, даже много.

В базовом промпте мы описываем идею в целом. Делаем это прямо, просто и с минимумом деталей. Наша цель — задать субъект и обстановку. Например, так: кот-самурай под цветущим деревом сакуры. Смотрим, что сгенерировала модель, и оцениваем, что нам нравится, а что нет. Изображение доработаем позже.

Советы по формированию базового промпта: 

  1. Пишите как для машины, а не как для человека. Лучше использовать английский язык, четко задавать субъект, избегать опечаток и ошибок, отделять части промпта друг от друга запятыми. Модели вроде Stable Diffusion 1.5 и 2.1 вообще лучше работают с тегоподобными описаниями. 

  2. Важно не сколько слов мы используем, а какие это слова. Вообще в разных моделях разные ограничения по количеству символов. У Midjourney это 60 слов, а у Stable Diffusion — примерно 75. Но базовый промтп не стоит превращать в книгу: лучше задать ему образ четко и по делу, а доработать позже. 

  3. Проверяйте ключевые слова. Если вы задаете стиль какого-то художника, но ИИ его игнорирует, вероятно, модель просто его не знает. Если сомневаетесь в промпте или каком-то его составном элементе, вбейте этот элемент отдельно и посмотрите, как модель с ним работает в целом. 

  4. Некоторые атрибуты тянут за собой другие. Нейронка понимает смыслы не так, как человек. У нее есть ассоциации, и она подтягивает одни атрибуты к другим. Например, голубые глаза могут подтянуть европейские черты лица. Если описывается атрибут, который может нести ассоциации (а они не нужны), лучше дописать, что именно вы хотите видеть. 

  5. ИИ хорошо понимает, как общаться с ИИ. Не знаете, как составить базовый промпт — просто попросите об этом ChatGPT. Он справится с этой задачей на отлично. Также есть специальные сайты: PromptHero, PromptBase и др.

Если хотите разобраться в нюансах генерации картинок в нейросетях, читайте подробную статью в нашем блоге

Теги:
Всего голосов 4: ↑3 и ↓1+2
Комментарии2

Появление контента, созданного искусственным интеллектом (ИИ), в интернете достигло паритета с материалами, написанными настоящими людьми.

В Axios выяснили, ссылаясь на аналитический отчёт фирмы Graphite, занимающейся поисковой оптимизацией, что доля ИИ-статей на короткое время превзошла человеческую генерацию, но сейчас объёмы выровнялись.

Согласно последним данным, представленным Graphite, в общем объеме новых публикаций в сети доля контента, созданного ИИ, составляет 52%, что незначительно превышает 48% материалов, написанных людьми.

Специалисты Graphite провели анализ 65 тысяч веб-страниц, индексированных с 2020 по 2025 годы. Отмечается, что резкий подъем доли материалов, сгенерированных ИИ, начался в 2023 году, что совпало с выходом на рынок чат-бота ChatGPT в конце 2022 года.

Несмотря на общее увеличение объёмов генерации, результаты поисковой системы Google показывают существенный перекос в пользу человеческого труда. Фирма установила, что 86% статей, которые отображаются в результатах поиска Google, созданы людьми. На долю ИИ приходится лишь 14% такого контента. Более того, когда материалы, созданные искусственным интеллектом, все же попадают в выдачу, они, как правило, располагаются на более низких позициях по сравнению с публикациями, написанными людьми.

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии0

В ChatGPT добавили возможность приглашать пользователей в «Проекты». Для совместной работы будут доступны общие чаты, инструкции и файлы. Опцией могут воспользоваться владельцы подписок Free, Plus и Pro.

Для приглашения пользователей надо указать их адреса электронной почты, на которые системы пришлёт вступительные ссылки. У владельца проекта есть возможность удалять участников и управлять правами доступа.

«Проекты» — режим в ChatGPT, который объединяет несколько чатов в единое пространство с единым контекстом.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

AI-агенты сокращают издержки и ускоряют работу, но как внедрить их безопасно и с понятным эффектом ROI?

На бесплатном вебинаре «Инструменты создания AI-агентов для бизнеса» разберём создание и интеграцию агентов под разные задачи, покажем выбор технологий, архитектуру «человек + ИИ» и оценку эффекта.

Вы научитесь:

➕ Разбираться в типах AI-агентов.

➕ Определять задачи для делегирования агентам.

➕ Проектировать архитектуру AI-системы под свои бизнес-цели.

➕ Выбирать платформу и инструменты без кода.

➕ Оценивать эффект внедрения.

➕ Строить план внедрения AI-агентов.

Программа:

✔️Виды AI‑агентов, чат‑боты и RPA.

✔️ Безкодовые инструменты и выбор стека.

✔️ Архитектура человек + ИИ.

✔️ Модели и фреймворки под задачу.

✔️ Когнитивные агенты и цифровые двойники.

✔️ Метрики, эксперименты и эффект.

🔥 Практикум: дорожная карта внедрения в вашей компании.

🕓 Когда: 31 октября, 12:00–13:00 (Мск)

👨‍🎓 Спикер: Вирта Виктория — специалист в сфере ИИ и автоматизации бизнес-процессов.

➡️ Записаться

Теги:
Всего голосов 4: ↑0 и ↓4-4
Комментарии0

RAG-Anything — универсальный фреймворк для глубокого анализа. Подробнее о нём рассказывают сотрудники лаборатории искусственного интеллекта ИТ-компании «Криптонит».

Метод RAG (Retrieval-Augmented Generation, или извлечение и расширенная генерация) позволяет большим языковым моделям обращаться к внешним базам данных. Однако у него есть фундаментальный недостаток: классический RAG работает исключительно с текстом.

При этом в научных статьях, отчётах и технической документации значительная часть данных представлена в виде изображений: графиков, формул, фотографий, карт. Поэтому традиционные системы ИИ либо игнорируют такую информацию, либо ограничиваются анализом подписей к изображениям.

Для решения этой проблемы команда исследователей из Гонконгского университета представила RAG-Anything — универсальный фреймворк, который позволяет обрабатывать разные типы данных как единую сеть взаимосвязанных объектов.

В основе этой мультимодальной системы лежит стратегия двойного графа (dual-graph construction), которая создаёт два типа связей:

  • Перекрёстно-модальные связи, соединяющие разные типы данных. Например, график связывается не только с текстовой подписью, но и с фрагментом текста, где он упоминается.

  • Текстовые семантические связи, фиксирующие смысловые отношения между фрагментами текста. Например, «… как вы можете видеть на графике 1… подробнее см. в таблице 2».

Объединяя эти представления, RAG-Anything создаёт единую «карту знаний» документа. Это позволяет системе проводить гибридный поиск: сочетающий в себе навигацию по структурным связям в графах и семантический поиск по смыслу.

В результате на сложный запрос ИИ может дать более полный и корректный ответ, собрав фактические данные не только из текста, но и из соответствующих иллюстраций.

Это расширяет возможности ИИ в медицине, финансовой аналитике, анализе технической документации и во многих других областях, где критически важна полнота информации.

Теги:
Рейтинг0
Комментарии0

В Perplexity обновили инструкцию, как выжать из нейросетей максимум: Perplexity at Work A Guide to Getting More Done. Внутри лучшие промпты, кейсы для работы, креативные идеи, оптимальный воркфлоу и рабочие сценарии тотальной автоматизации любых задач. Гайд работает на любых чат-ботах — хоть ChatGPT, хоть кастомная модель на вашем ПК.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Вклад авторов