Обновить
32K+

Семантические сети *

Веб 3.0

4,42
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Надо ли бороться с анизотропией эмбеддингов

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели13K

Анизотропия эмбеддингов не всегда зло, но «сырой» косинус часто даёт слишком размытый сигнал. Центрирование убирает общий фон и помогает увидеть различия, не разрушая локальные смысловые области. Показываю это на реальных расчётах из Obsidian‑базы.

Читать далее

Новости

Графы знаний в юридическом домене: эксперимент с LightRAG

Уровень сложностиСредний
Время на прочтение29 мин
Охват и читатели9.1K

Юридический домен требует понимания многочисленных связей между сущностями, рассеянными по множеству документов. Поэтому кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний: связи между нормами, прецедентами и понятиями, рассеянными по тысячам документов, наконец-то перестают теряться.

Современные фреймворки обещают построить такой граф автоматически, в пару команд. Но между "запуском из коробки" и рабочей аналитической системой на практике лежит немалая дистанция.

Это первая часть практического эксперимента с LightRAG, одним из самых известных графовых фреймворков. На небольшом корпусе из Гражданского кодекса РФ и судебной практики разбираем, как фреймворк устроен, как его быстро развернуть, и почему граф из "коробки", без оптимизации и тонкой настройки, при всей внешней убедительности, еще не готов к полноценной работе в юридическом домене.

Читать далее

Интеллектуальная кроссплатформенная система DocAI для медицинского образования

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели13K

В прошлой статье я рассказывал о своём пути из медицины в IT, о том, как интерес к искусственному интеллекту постепенно привёл меня к созданию собственного проекта и стартапа.

Тогда это была скорее личная история - про обучение, поиск профессиональной идентичности и первые шаги команды. В этой статье хочу подробнее рассказать уже о самом проекте: какую проблему мы решаем, как устроена система DocAI и почему мы считаем это направление перспективным для медицинского образования

DocAI - это deeptech-проект, основанный на передовых научных исследованиях и инновациях в области инженерии знаний и искусственного интеллекта для сфер EdTech и HealthTech создаётся как ответ на ключевые вызовы современного предвузовского, вузовского и послевузовского непрерывного медицинского образования: необходимость гибкого, адаптивного и персонализированного обучения.

Продукт проекта - это образовательная платформа, предоставляющая образовательным организациям и индивидуальным пользователям кроссплатформенный доступ к системе представления и моделирования знаний, включая инструменты отслеживания прогресса, цифровой двойник обучающегося и выстраивание персональной образовательной траектории. Система для дополнительного профессионального образования и раннего вовлечения студентов в научно-исследовательскую и практико-ориентированную деятельность - важного аспекта современной системы непрерывного медицинского образования. Ключевой задачей системы является обеспечение глубокого понимания учебного материала и адаптация содержания под уровень подготовки и цели каждого пользователя.

Читать далее

Экономика Бытия, Этика Демиургов или Почему нейросетям не позволено воспроизводить обнаженное человеческое тело

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели12K

Началось все с того, что однажды я задумался над последним вопросом заголовка: почему генеративным нейросетям не позволено воспроизводить обнаженное человеческое тело? Ну, понятно, что цензура, и понятно, что в открытом доступе лежит куча моделей, которые развращай обучай как хочешь.  Но откуда взялось само убеждение, что человеческое тело не может быть воспроизведено во всем своем великолепии? Почему его можно показывать в музее и спальне, например, а urbi et orbi друзьям и интернету – нельзя?

А вот ни за что не догадаетесь

Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели6.2K

Автор: ваш покорный слуга, Head of Digital Marketing (он же маркетолог, он же аналитик, он же копирайтер, он же всё остальное).

Надеюсь будет интересно! Приступим ⬇️

Как мы строим Memory OS: от flat RAG к управляемому когнитивному сжатию

Уровень сложностиСредний
Время на прочтение25 мин
Охват и читатели5.3K

Мы прогнали через o4-mini больше 300 вариантов промптов с разными режимами reasoning_effort и обнаружили, что чем «умнее» модель рассуждает, тем хуже она извлекает структуру: начинает «улучшать» схему по своему усмотрению, объединять то, что должно быть раздельным, и ломать детерминизм пайплайна.

Это технический отчёт о том, как мы строили Superagent Memory OS — систему агентной памяти, которая на сегодня удерживает граф из десятков тысяч концептов и почти 2.4 миллиона рёбер поверх ~106.7 миллиона токенов из четырёх разных корпусов. Внутри: переход от flat RAG к Memory OS, парадокс reasoning и слой Semantic Mapper (–48% токенов, качество с 5.2 до 7.11), staging database и сжатие 34 805 сырых mention'ов до 7 339 канонических концептов, иерархический retrieval через UMAP+HDBSCAN+Optuna и 7 220 weighted links, четыре фазы отладки агента на LongMemEval (22+ шагов → 4–6), эксперимент EXP-GARDENER-001 про то, почему Flash-модель плодит ложные связи, bi-temporal модель фактов, MCP как суверенный интерфейс памяти и психологический слой с контролируемым словарём эмоций.

Главный тезис: retrieval не равен памяти.

Читать далее

Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

Уровень сложностиСредний
Время на прочтение21 мин
Охват и читатели5.4K

Ни одна современная AI-система в юридическом домене не обходится без RAG: юридические данные слишком специфичны, слишком изменчивы и никогда слишком редко составляли значимую часть обучающей выборки LLM, чтобы доверять ей без внешней базы знаний. Обычно при построении RAG-системы используют модуль поиска, основанный на векторных БД. Однако в таких сложно организованных областях знаний, как юридическая, архитектура, основанная на поиске в хранилище "плоских" эмбеддингов, может не справиться. Векторный поиск позволяет находить семантически близкие (схожие) фрагменты текстов, тогда как юридический домен также требует понимания многочисленных связей между сущностями, рассеянными по множеству документов .

Кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний, особенно после появления современных инструментов, позволяющих автоматически строить такие графы на тысячах документов и использовать их в качестве хранилища знаний для RAG-систем. Однако все имеет свою цену: неполнота или неточность построенного графа может свести на нет все вложенные ресурсы и оставить вас с системой, которая хуже "наивного" векторного поиска.

Какие преимущества поиска по графу знаний по сравнению с классическим векторным поиском, а также каковы критерии, когда использование графового поиска действительно необходимо для построения RAG-системы в юридическом домене?

Читать далее

НеОсознанный вайб-кодинг (с примером RDF Grapher)

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели11K

Статья -  комментарий / возражение к статье Осознанный вайб-кодинг. Осознанный вайб-кодинг наверное лучше не Осознанного, но последний тоже работает.

Читать далее

SemantML. Семантическая нейродинамика

Уровень сложностиСредний
Время на прочтение22 мин
Охват и читатели5.2K

Введение: Кризис смысла в эпоху больших данных

Начну немножко издалека. Мы живем в парадоксальное время. Искусственный интеллект окружает нас повсюду: он пишет тексты, рисует картины, решает сложные задачи. Но за этим фасадом цифрового всемогущества скрывается фундаментальная, почти метафизическая проблема: наши самые продвинутые модели не понимают ровным счетом ничего. Те, кто сколько-либо погружен в сферу ML, это прекрасно знают. Представьте библиотеку, где каждый книга идеально описана, проиндексирована и взаимосвязана, но нет ни одного читателя, способного понять смысл написанного. Это - точная метафора современного ИИ. GPT-4, Gemini, Claude - это блестящие имитаторы, статистические попугаи, оперирующие символами без малейшего представления об их значении. Они могут рассуждать о физических явлениях, но не понимать их, анализировать метафоры, но не схватывают их суть, генерировать тексты о боли и радости, оставаясь абсолютно пустыми внутри.

Этот разрыв между формой и содержанием, между синтаксисом и семантикой, является последним крупным барьером на пути к настоящему искусственному интеллекту. Но, возможно, есть решение как это обойти. Что если вместо того, чтобы заставлять машины имитировать мышление, создать для них среду, где мышление возникает естественно - как возникают волны в океане или мысли в человеческом мозге?

SemantML: От статистики к семантической нейродинамике

Хочу вас познакомить с проектом под названием SemantML - радикально новый подход к созданию ИИ, который отказывается от парадигмы "обучения на текстах" в пользу "мышления в смыслах". Гипотеза проста и одновременно нова: сознание - это не алгоритм, а динамический процесс в семантическом пространстве, и чтобы создать искусственный разум, нужно сначала создать для него "дом" - среду, где могут рождаться и взаимодействовать смыслы.

Читать далее

Law & Practice Ensemble RAG. Как создать ассистента, помогающего решать многоаспектные юридические задачи

Время на прочтение28 мин
Охват и читатели10K

Большие языковые модели (LLM) в последние несколько лет являются ключевым направлением искусственного интеллекта. Дальнейшее развитие LLM, очевидно, меняет сам способ взаимодействия с технологиями, снижая порог входа для представителей всех профессий, в том числе исконно гуманитарных.

Читать далее

Онтология. Первые впечатления на примере Pizza Shop

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели8.5K

Сегодня я хотел бы поговорить об онтологии и сделать это так. Мы возьмём учебный пример - онтологию для пиццерии (Pizza Shop) - и на основе этого примера разберём основные термины, ключевые элементы онтологии и обсудим, чем этот подход отличается от привычных способов моделирования.

Это не руководство по онтологии и не инструкция к визуальному редактору Protege, в котором сделан пример - это набор первых впечатлений человека, который решил разобраться в этой теме.

Читать далее

The role of a user persona in UX and how to create it

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели4.8K

A lot of articles and guides on how to create an effective UX design for a software product mention “sticking to a user persona” in order not to waste efforts and resources on a non-target audience. What is a user persona, how to define it, and how can it help the UX team in finding the best design solutions for a product? 

Читать далее

Фрактальная логика и битва нейросетей за семантику

Уровень сложностиСредний
Время на прочтение17 мин
Охват и читатели5K

Это история о попытке создать новую логику.

О попытке, рожденной в эпоху, когда фракталы Мандельброта казались ключом ко всей природе. Я, логик по образованию, увидел аналогию: если математические "монстры" оказались фракталами, то, может быть, логические парадоксы — это тоже фракталы?

Я построил концепцию, где смысл — не точка, а процесс, бесконечный и самоподобный. Но концепция осталась без семантики.

И тогда я решил устроить суд Божий: я дал свою книгу двум арбитрам — искусственным интеллектам. Я ожидал диалога, но получил войну.

Qwen, стремясь к формализации, строил сложные системы. DeepSeek, как строгий судья, разрушал их одну за другой, обвиняя в "иллюзии формальности" и "магии".

В этой битве не было победы. Но из обломков моей идеи родилось нечто ценное: понимание того, что истина в сложности не в построении новой системы, а в способности видеть старые проблемы по-новому.

Это — отчет с поля боя за семантику.

Читать далее

Ближайшие события

AGI: от идеи к реализации, часть 2: от линейного преобразования к живому мышлению

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели3.4K

Предисловие: вот и прошел этап критики и самоопределения после публикации моей первой статьи. Теперь это уже вторая. Хотел бы сказать что первая статья не была научной публикацией и сведением графиков по GPT. Это было исследованием экспериментом таким: если человек не может изобрести AGI, то почему бы не попросить об этом LLM? Вот это как раз сейчас и делается в данной работе. Результат смотрите сами. И да это не очередной RAG как приводилось в комментариях, это становится новой парадигмой.

🧠 От Линейного Преобразования к Живому Мышлению: Критика LLM и Архитектура AGI как Субъекта

Автор: [Твоё имя или псевдоним]
Версия: 1.0 | Июль 2025

Читать далее

Собираем комплекс для качественного офлайн-перевода текстов, работающий на самом обычном игровом компьютере

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели22K

Всем привет. В последнее время перевод текстов с одного языка на другой уже не вызывает такой головной боли, как раньше: есть несколько качественных онлайн-переводчиков, есть большие нейросети, которые тоже можно попросить перевести текст, — в общем, варианты есть, их довольно много, и они выдают вполне приемлемый результат. Но у всех них есть одно ограничение: они работают онлайн (удалённо). Для кого-то это ограничение несущественно, а для кого-то может быть критично. Мне же просто захотелось иметь что-то, что сможет переводить тексты на хорошем (современном) уровне офлайн (сугубо на моём компьютере). Ну, люблю я, когда всё, что мне нужно, может работать и локально тоже. В общем, ниже я делюсь с вами тем, что мне удалось в итоге собрать, запустить и даже получить удовлетворяющий меня результат.

Читать далее

Почему GPT-чаты не крякают?

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели11K

Эхо от кряканья лучше всего слышно в ситуации, когда утка и человек находятся рядом со стеной, хорошо отражающей звуки.

[ Первомай ]

Классификация парадигм программирования

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели15K

Здравствуйте, меня зовут Дмитрий Карловский и я.. придерживаюсь следующей парадигмы мышления: всякое определение должно иметь чёткую границу между тем, что ему соответствует, и тем, что не соответствует.

К сожалению, часто можно встретить споры о пересекающихся определениях, словно они взаимоисключают друг друга. Не менее часто можно встретить ложную дилемму между двумя терминами не покрывающими всё множество сущностей.

Что ж, позвольте внести ясность и предложить вам непротиворечивую классификацию парадигм - подходов к написанию кода, во многом определяющих способ мышления человека по донесению задачи до кремниевого исполнителя.

Аспекты классификации

Как зарабатывать на статьях: деньги за текст

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели21K

Статья для тех, кто уже пишет (или хочет начать) и ищет понятную схему монетизации. Без «волшебных кнопок», только практические шаги и личный опыт.

Читать далее

Что такое SEO и из чего оно состоит

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели23K

Из поисковиков на Пикабу приходит более 50 миллионов человек в месяц. У онлайн-ритейлера «ВсеИнструменты» — свыше 15 миллионов, причём доля поискового трафика превышает 50%.

Если есть сайт, тогда наверняка слышали термин «SEO». Это поисковая оптимизация, которая помогает сайту быть видимым в Google, «Яндексе» и других поисковых системах. В этой статье разберёмся, зачем она нужна и что в неё входит.

Читать далее

Что такое перелинковка страниц сайта: зачем нужна для SEO, как сделать и примеры

Время на прочтение8 мин
Охват и читатели4.4K

Перелинковка есть на большинстве сайтов — в блогах, интернет-магазинах, на инфопорталах. Одни SEO-специалисты уделяют ей максимум внимания, другие — второстепенное. Спойлер: грамотная перелинковка может заметно улучшить позиции ресурса в поисковой выдаче. Если вы отвечаете за продвижение, сопровождаете клиентские сайты или просто изучаете SEO, обязательно разберитесь, как это работает.

Читать далее
1
23 ...