Обновить

Моя лента

Тип публикации
Порог рейтинга
Уровень сложности
Предупреждение
Войдите или зарегистрируйтесь, чтобы настроить фильтры
Статья

Графы знаний в юридическом домене: эксперимент с LightRAG (продолжение)

Уровень сложностиСредний
Время на прочтение45 мин
Охват и читатели1

Юридический домен требует понимания многочисленных связей между сущностями, рассеянными по множеству документов. Поэтому кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний: связи между нормами, прецедентами и понятиями, рассеянными по тысячам документов, наконец-то перестают теряться.

Современные фреймворки обещают построить такой граф автоматически, в пару команд. Но между "запуском из коробки" и рабочей аналитической системой на практике лежит немалая дистанция.

Это вторая часть практического эксперимента с LightRAG. Разбираем, как оптимизировать "сырой" граф "из коробки" (подробно рассмотрели сам фреймворк, а также провели топологический анализ в первой части) без переиндексации, что показал анализ топологии и центральностей итогового графа, и проверяем на реальных юридических запросах — дает ли RAG-система, построенная на графе знаний, преимущество перед векторным RAG, и где проходят границы этого преимущества.

Читать далее

Новости

Статья

Один суффикс, чтобы взломать их всех

Уровень сложностиСредний
Время на прочтение27 мин
Охват и читатели1.1K

Градиентные атаки на LLM разнообразны: GCG добавляет абракадабру, AutoDAN добавляет связный текст - но обе они бьют в одно и то же уязвимое место: обе уводят модель с единственного «направления отказа», и одна такая добавленная строка вскрывает любой запрос даже на моделях, которых не видела. Годами учим модели отказывать на вредные запросы, а вся их стойкость висит на одном векторе. Большой иллюстрированный разбор: как несхожие атаки сошлись к одной мысли - refusal direction - и куда уходит фронтир.

Читать далее
Статья

Table-test или как помочь агенту понять как тестироваться

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели718

Агенты сейчас пишут тесты уже за многими из нас, будем объективны, все больше людей кидаем таску ему - получают пачку аппрувов и погнали все это мержить

Но есть, скажем так, ненулевой шанс, что сгенерированные тесты окажутся произведением искусства мусором, который ничего не проверяет (и нет, не шутка, мне коллеги буквально показывали тесты где просто вызывается функция и проверяется что ошибка nil и на этом все, а результат просто всегда игнорировался)

И в таких кейсах очень классная картина: у вас зеленный CI, прод сломан, и вопрос:

Читать далее
Пост

Есть шанс получить доступ к Claude Max на полгода бесплатно. Anthropic представила программу для разработчиков открытых приложений. Можно подать заявку и сэкономить 1200 баксов:

  • вы подходите, если создаете приложение сами или в команде, и у вас публичный репозиторий. Также нужно, чтобы были коммиты, релизы или ревью за последние три месяца. Лучше, если там будет 5000+ звезд.

  • Даже если такого нет, можете подать заявку в компанию, описать, почему ваш проект полезный и нужный, и сможете получить Claude Max

  • подать заявку можно до 30 июня включительно. Дальше ждем результатов. Бесплатный доступ получают 10 000 разработчиков.

Теги:
0
Комментарии0
Статья

Заметки на полях: алгебра матриц Паули

Уровень сложностиСложный
Время на прочтение7 мин
Охват и читатели1.7K

Продолжаю изучать геометрическую алгебру в применении к физике. На очереди алгебра матриц Паули и её реализация в четырёхмерном евклидовом пространстве.

Читать далее
Новость

С конца августа 2026 года Microsoft Edge перейдёт на двухнедельный цикл выпуска обновлений браузера

Время на прочтение2 мин
Охват и читатели1.4K

С конца августа 2026 года Microsoft Edge перейдёт на двухнедельный цикл выпуска обновлений браузера вместо нынешнего четырёхнедельного.

Читать далее
Новость

Вышло обновление утилиты HWMonitor 1.64

Время на прочтение3 мин
Охват и читатели1.5K

В первой половине июня 2026 года состоялся выпуск обновления HWMonitor 1.64 — freeware утилиты для мониторинга компонентов ПК на ОС Windows. Разработка проекта ведётся более 16 лет. Стабильная версия HWMonitor 1.59 вышла в августе 2025 года. Обновление HWMonitor 1.60 опубликовали в октябре 2025 года. Версия HWMonitor 1.61 вышла в декабре 2025 года. Сборку HWMonitor 1.62 представили в феврале 2026 года. Версия HWMonitor 1.63 вышла в апреле 2026 года.

Читать далее
Новость

Срочная новость: правительство США потребовало экстренно отключить доступ к Fable 5 и Mythos 5

Время на прочтение1 мин
Охват и читатели4.5K

Правительство США, ссылаясь на полномочия в сфере национальной безопасности, выпустило директиву экспортного контроля, требующую приостановить любой доступ к Fable 5 и Mythos 5 для иностранных граждан — независимо от того, находятся они в США или за их пределами. Это касается в том числе иностранных сотрудников Anthropic.

Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.

Доступ ко всем остальным моделям Claude не затронут.

Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.

https://www.anthropic.com/news/fable-mythos-access

Читать далее
Статья

EVERTY DESK — EVRT ПРОТОКОЛ, или почему я написал лучший протокол низкой задержки в мире

Уровень сложностиСложный
Время на прочтение13 мин
Охват и читатели3.2K

Привет, Хабр.

Я писал это не месяц и не год.

EVRT (EVERTY real time protocol)— это результат примерно десяти лет экспериментов, ошибок, переписываний, злости, тестов, ночных сборок и попыток выжать из обычной сети поведение, похожее на игровой real-time transport.

Когда-то я уже писал на Хабре про игровой режим. Тогда это почти никто не оценил. Ну и ладно. Иногда идею начинают понимать только тогда, когда она уже успела стать архитектурой.

Теперь пора вскрывать подробности.

Но сразу обозначу границы: исходников в этот раз не будет. Не потому что нечего показать, а потому что слишком хорошо знаю, как быстро инженерные идеи превращаются в “мы сами так придумали”.

Сегодня будет не репозиторий.

Сегодня будет наука: транспорт, очереди, UDP, feedback, IDR recovery, adaptive relief, ROI и вся та скучная инженерия, из которой на самом деле и рождается низкая задержка.

Можно спорить про Sunshine, Parsec, Steam Link и другие решения. Я выслушаю. Но тут лучший я. Хотите спорить? Слушаю.
Поехали:

EVRT: почему мой real-time протокол сильнее, чем очередная обертка вокруг кодека

Я долго откладывал этот текст, потому что отлично понимаю, как это работает: ты показываешь идею, объясняешь архитектуру, раскладываешь решения по полкам — и через пару месяцев где-то появляется “случайно похожая” реализация, только уже без упоминания автора.

Что такое EVRT

EVRT — это отдельный real-time слой внутри EvertyDesk Lite (До этого 15 лет разработка игрового стриминга)

Не читать.
Статья

Язык, который придумали для ИИ в 1958-м

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели3.7K

Недавно попалось на глаза одно очень интересное видео с динамическими шкалами по популярности разных языков программирования по годам (вроде как, начиная с 1980х). Удивительно, сколько всего и как много придумало человечество. И как быстро меняются тренды, а еще - сколько всего уникального уходит в тень истории. Вот был такой Лисп. Принято считать, что Лисп - это что-то из учебников по истории программирования. Где-то между перфокартами и первыми компиляторами. Условный артефакт. Язык, которым пользовались бородатые профессора, пока не пришел Python и не навел порядок.

Только вот Python тоже унаследовал из Лиспа некоторую часть. Но не все. Самое радикальное так и не забрал.

Читать далее
Статья

Открытие компания в Болгарии

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели3.4K

Изначально я не планировал разбираться в болгарском корпоративном праве. Это произошло само собой, когда понадобилось юридическое лицо. Что делать - нанять юриста или разобраться самому?

Только хардкор
Статья

Как сделать портрет поколений с помощью Нейросетей — инструкция и готовые промпты в семейном тренде

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.7K

Самый не умирающий тренд в ИИ-м мире это - портрет поколения нейросетью, когда среднее время жизни подобных трендов пару недель - этот же тренд не уходит из запросов уже более полу-года. В теории нам обещают полное понимание контекста и фотореализм в один клик. На практике же, если вбить в условный генератор «типичный миллениал», мы с высокой долей вероятности получим пластикового персонажа из стоковой рекламы коворкинга: идеальная борода, стерильный макбук и чашка рафа, в которой ИИ по привычке сломал законы физики и перспективы.

Читать далее
Новость

В НАСА собрались починить роборуку на МКС

Время на прочтение2 мин
Охват и читатели4.3K

Один из манипуляторов космической станции, играющий ключевую роль в захвате грузовых кораблей и выполнении ряда задач по техническому обслуживанию, выведен из строя и его ремонт займёт как минимум несколько недель.

Как сообщило НАСА в своём блоге, для ремонта манипулятора Canadarm2, который в апреле отметил 25-летие службы на Международной космической станции (МКС), потребуется выход в открытый космос, чтобы устранить поломку детали, заклинившей во время плановых работ 27 мая.

Манипулятор находится в стабильном положении, но ожидает помощи от космонавтов, которые выйдут в открытый космос 30 июня — за день до Дня Канады, национального праздника этой страны. «Система показала повышенный ток двигателя в запястном суставе, и движение манипулятора шло не так, как ожидалось», — написали представители НАСА по поводу этой проблемы. Консультации с Канадским космическим агентством (CSA), которое финансирует манипулятор и поддерживает его работу совместно с MDA Space, показали, что для замены повреждённого сустава потребуется выход в открытый космос. К счастью, запасная деталь уже есть на станции.

Читать далее

Ближайшие события

Новость

Лучший ИИ-агент, который не слушается: Claude Fable 5 возглавил новый бенчмарк Agent Arena

Время на прочтение2 мин
Охват и читатели6.5K

Платформа Arena (бывшая LMArena) опубликовала обновленные результаты Agent Arena — нового лидерборда, который оценивает модели по тому, как они справляются с реальными рабочими задачами в агентском режиме. Первое место занял Claude Fable 5 от Anthropic с общим показателем +11,2% — это улучшение результата относительно средней модели (рейтинг постоянно обновляется, так что текущие цифры могут отличаться). Но есть и ложка дегтя: по управляемости новый флагман оказался лишь 17-м из 23 участников.

Читать далее
Пост

Как я ускорил бэкапы в 20 раз и обошёл ловушку Jsoup: развитие самописной Android-читалки MRead (v1.3.0)

Всем привет! Не так давно я рассказывал, как боль от перегруженных интерфейсов заставила меня открыть Android Studio и написать собственную читалку с кастомным движком рендеринга и точным выделением текста.

Статья получила теплый отклик и в комментариях набежало много отличных предложений. В этом посте я хочу поделиться техническими решениями, которые вошли в крупное обновление 1.3.0.

1. Бэкапы и боль от Storage Access Framework (SAF)
В приложении есть функция бэкапа: упаковка базы данных Room, настроек и распакованных HTML-глав с картинками в один ZIP-архив. Изначально я писал файлы напрямую в OutputStream, полученный через ContentResolver (SAF). Итог: библиотека на 500 МБ архивировалась около 5 минут. SAF проводит проверки безопасности для каждого записываемого чанка, что убивает I/O операции.
Решение: сборка архива переехала во внутренний кэш приложения. Туда пишем без ограничений SAF - буфером по 64 КБ и уровнем сжатия BEST_SPEED (картинки уже сжаты, гнать их через BEST_COMPRESSION бессмысленно). Когда ZIP готов целиком, он одним куском копируется в пользовательскую папку через SAF - вместо тысяч мелких защищённых записей получается одна

2. Material You: как получить правильные цвета обоев
При внедрении динамических тем (Android 12+) я столкнулся с тем, что стандартный вызов dynamicLightColorScheme().background на многих устройствах выдает просто унылый белый или бледно-серый цвет, игнорируя сочные оттенки обоев.
Решение: Самые насыщенные цвета из системной палитры Monet хранятся в secondaryContainer и surface. Решение нашлось в самой палитре Monet: наиболее насыщенные цвета живут в secondaryContainer и surface, а не в background. Переориентировал маппинг цветов приложения на эти слоты и интерфейс действительно ожил. Теперь интерфейс действительно реагирует на смену обоев. Плюс привязал OnSharedPreferenceChangeListener, чтобы тема менялась мгновенно на всех экранах без перезапуска.

3. Странности парсинга FB2 и баги Jsoup
Иногда вместо обложки FB2 парсер ставил черно-белую картинку из середины книги. FB2 хранит все изображения в тегах <binary> в конце файла в хаотичном порядке. Если тег <coverpage> отсутствует, старый алгоритм просто брал первую попавшуюся картинку из бинарной кучи.
Я переписал фоллбэк: теперь, если явной обложки нет, Jsoup ищет первый тег <image> прямо внутри <body> книги.
Попутно всплыло неочевидное поведение Jsoup: если атрибут отсутствует, attr() возвращает пустую строку, а не null - это задокументировано, но интуитивно ожидаешь null. Из-за этого Элвис-операторы (?:) молча проглатывали пустую строку вместо ухода в fallback. Написал строгую обертку takeIf { it.isNotEmpty() }, и теперь обложки извлекаются безошибочно.

4. Изолированный свайп яркости в Compose
Нужно было добавить регулировку яркости свайпом по левому краю экрана. Проблема: в режиме вертикального скролла (VerticalPager) свайпер страниц перехватывает вертикальные жесты на себя.
Решение: перехватывать жест на фазе Initial - до того, как пейджер успевает его обработать. Если касание началось в левых 15% ширины экрана, событие забирается себе и до пейджера не доходит.

Помимо этого в релизе 1.3.0:
• Добавлен полноэкранный просмотрщик иллюстраций с pinch-to-zoom (на основе detectTransformGestures).
• Написан собственный File Picker со сканированием вложенных папок и извлечением книг прямо из ZIP-архивов на лету.
• Добавлен поворот страниц для PDF с сохранением состояния в SharedPreferences.
• Разделен UI верхнего меню: закладки теперь можно переименовывать, а тап по номеру страницы открывает быстрый переход.
• Добавлен множественный выбор в библиотеке (массовое добавление на полки/удаление/скрытие).

Ссылки:
GitHub
RuStore

Теги:
0
Комментарии0
Статья

Почему тебе нужно стать нейро-панком прямо сейчас

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели4.7K

Небольшое эссе на тему того, почему сообществу разработчиков надо по максимуму вкладываться в LLM, которые будут свободны от корпорации и государств.

Свою лепту должны внести и ML-исследователи и схемотехники, притом вторые могут быть более важны, ибо от попрания монополий NVIDIA зависит, смогут ли юзеры запускать передовые LLM на персональном железе.

Запустить децентрализацию ИИ
Статья

ClustMetaLearn — автоматизация выбора кластеризации через мета-признаки и эволюционный поиск по табличным данным

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели5.8K

Перед исследователем данных, работающим без размеченных ответов, регулярно встаёт задача кластеризации: разбить множество объектов на группы так, чтобы схожие оказались вместе. На первый взгляд всё просто — запустил k‑means, подобрал число кластеров по силуэту, получил результат. Однако практика показывает, что разные алгоритмы (k‑means, GMM, агломеративная кластеризация) дают несхожие разбиения на одних и тех же данных, а внутренние метрики качества (Cluster Validity Indices, CVI) противоречат друг другу. Более того, как показано в масштабных бенчмарках, ни одна из нескольких десятков CVI не является универсально лучшей. Следовательно, для каждого нового датасета приходится вручную перебирать алгоритмы, метрики и гиперпараметры — процесс, который легко занимает часы и не гарантирует оптимального результата.

В данной работе представлена открытая система ClustMetaLearn, реализующая автоматический выбор алгоритма кластеризации, внутренней метрики качества и сужения пространства гиперпараметров на основе мета-обучения (meta-learning). Система вычисляет 20 мета-признаков датасета, включая статистические, информационно-теоретические, проекционные и топологические характеристики (числа Бетти, персистентная энтропия). Двухуровневая мета-модель (CVIsel + AlgRank) ранжирует четыре алгоритма (k‑means, GMM, агломеративная, MiniBatchKMeans) и предсказывает подходящую CVI. Экспериментальная валидация на коллекции из 96 табличных датасетов показала, что правильный алгоритм попадает в топ‑3 рекомендаций в 81% случаев, а сужение диапазонов гиперпараметров сокращает время настройки в среднем на 70% при потере качества менее 1.5%. Система доступна в виде CLI-утилиты и веб-приложения (Django, Celery, MLflow).

Читать далее
Статья

Особенности культурного кода во французской мультипликации

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели5.5K

Введение

Изучая французский язык, в том числе, на примерах мультипликационных роликов и мультфильмов, обратил внимание, что там нередко можно встретить высказывания, напоминающие программные поведенческие установки для детей. По крайней мере, они оказывают определенное влияние даже на взрослых, не говоря уже об их основной целевой аудитории.

Известно, что шаблоны поведения любимых героев, с которыми мы знакомимся в детстве, могут оказывать влияние во всей нашей дальнейшей жизни.

Поэтому, знакомство с подобными паттернами поведения в чужой культуре, позволяет лучше понять логику действий не только простых граждан, но и их элит.

Естественно, что главные знания о взаимоотношении с окружающим миром закладываются в более позднем возрасте, например, в студенческой среде.

Тем не менее, детские установки «правильного» или «хорошего» поведения имеют колоссальное значение в жизни каждого взрослого.

В этой статье, мы разберем несколько примеров и дадим им свою оценку. Развитие этой темы, со стороны читателей, будет только приветствоваться.

Ролик «Le petit frere» («Младший брат»)

Посмотреть видео (рис. 1) с двуязычными субтитрами можно в https://my.mail.ru/mail/emmerald/video/_myvideo/2.html :

Читать далее
Статья

Антивирус в «песочнице»

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6K

Антивирусы в Linux, хоть и обитают в основном на серверах, перестали быть диковинкой. И, в отличие от Windows, не сращиваются с операционной системой, а работают как отдельностоящие программы с невысокими привилегиями. Подход со сканированием в «песочнице» напрашивается сам собой. А Qubes OS, наряду с Docker-контейнерами и полновесными виртуальными машинами, подходит для этого очень хорошо.

Играть в кубики
Статья

У вайбкода два пути: Code-подписка и API

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели11K

Последнее время гоняю разные кодовые агенты во всех позах и форматах на моём домашнем *Claw-подобном харнес Coddy Agent, практикую как интеграции разных кодовых агентов и апишек в агента для вайбкода, так и разработку кода этого агента разными инструментами, то бишь вайбкожу его ими.

Между делом решил разобраться с экономикой и ценами, какие на рынке есть подписки, сколько они стоят и где есть специальные тарифы для кодовых агентов, которые можно было встроить в свой харнес, по ходу дела получился данный обзор.

Читать далее
1
23 ...