Комментарии / Профиль Medeyko / Хабр

Владимир Медейко@Medeyko

Гендиректор АНО Рувики и прочее

0,4

Рейтинг

Подписчики

ПрофильСтатьи3ПостыНовостиКомментарии759

Что уже работает из пакета мер по борьбе с VPN от Минцифры

Medeyko 6 апр в 06:27

Довольно любопытно требование внедрить функцию слежения за использование пользователями VPN в приложение. Стараюсь не ставить приложения на телефон. Мучаюсь с веб-версиями или вообще отказываюсь от услуг сервиса, навязывающего придожение... Ещё раз убедился, что правильно делаю.

Что касается платы за зарубежный трафик - я думаю, что пока не предполагается задавливать все пути за кордон, и задача уменьшения объёмов зарубежного трафика ставится ради уменьшения нагрузки на ТСПУ, дабы хватало мощностей для анализа.

+14

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Medeyko 1 апр в 22:17

Понятно, что автор сильно упрощает, и просто показывает взгляд на проблему с одной стороны. Это может быть полезно людям для улучшения интуитивного восприятия. Так что ок.

Но вот за ошибочный и при этом категорический вывод я попеняю:

Каждый, кто говорит «мы решим проблему галлюцинаций» и не уточняет «за счёт кратного увеличения модели или внешней памяти», — либо лукавит, либо не понимает информационную теорию.

Во-первых, формулировка принципиально заведомо некорректна: понятно, что и за счёт увеличения модели или внешней памяти полностью проблему "галлюцинаций" можно решить только с использованием бессмысленно больших затрат ресурсов. Поэтому можно говорить лишь об уменьшении уровня "галлюцинирования" до приемлемого для конкретных задач.

Во-вторых, решение, естественно, может строиться не только за счёт кратного увеличения модели или внешней памяти. Современным большим языковым моделям ещё очень далеко до пределов, вытекающих из теории информации. Одно из направлений прозвучало даже в самой статье:

Потому что точные числа — это именно те «мелкие детали», которые теряются первыми. 23 × 47 = 1081, но для кодека это просто три случайных числа без паттерна. Нельзя «сжать» таблицу умножения — её можно только запомнить целиком или вычислить алгоритмически. LLM не делает ни того, ни другого — она восстанавливает «что-то числовое, что выглядит правильным».

Впрочем, у утверждение, будто основанные на больших языковых моделях не вычисляют алгоритмически, неверное. Как и биологические нейросети, искусственные тоже "применяют" алгоритмы (и я сейчас не о возможности запустить интерпретатор Питона, а именно о генерации следующего токена чисто благодаря весам). Я экспериментировал с этим и своими глазами видел рост способностей нейросетей, которые сначала доросли до того, чтобы начать понимать разъяснения поразрядного сложения с переносом длинных чисел (и, соответственно, правильно складывать числа любой длины), а потом и умножение столбиком для произведения длинных чисел (и правильно перемножать числа любой длины). Ну, точнее, они правильно вычисляли и правильно демонстрировали промежуточные выкладки в моих экспериментах. Понятно, что это простейшая символьная логика, можно и вообще арифметику на аксиомах Пеано сделать. Но тем не менее - это алгоритмы на чистых нейронных сетях. И они всё лучше и лучше понимают объяснения алгоритмов с меньшим и меньшим разжёвыванием деталей. Причём всё лучше понимают и сети без роста размера.

Ну, а если мы разрешим использовать инструменты, в которых нужные алгоритмы реализованы максимально эффективно как алгоритмически, так и с обращением опять же к ИНС с нужным запросом, для перепроверок, чтобы проверять и устранять галлюцинации - то количество ещё вырастет. (Я на практике убедился, например, что одна и та же ИНС, если её одновременно использовать и как аналитика, и как критика в последовательных запросах, существенно уменьшает количество галлюцинаций. Это не вписывается в вашу аналогию "сжатия", насколько я понимаю.)

Найдем любого — бесплатно, какой у него оператор связи?

Medeyko 1 апр в 16:31

Это если один будет. А если несколько? Как сужать дальнейший поиск? Придётся ещё другие телефоны контактов объекта находить и проверять. Разве нет?

Но в целом, конечно, грустно, насколько безответственно относятся операторы к столь чувствительным данным.

Как мы сломали индекс обитаемости экзопланет: Парадокс ESI, Physics-Informed ML и 9600 фейковых «Земель»

Medeyko 30 мар в 09:06

Коллега, простите, но скажите, пожалуйста, Вы применяете при ответах на Хабре в каком-то виде LLM (например, для улучшения стиля текста)? Если нет, то очень интересно, это на Вас общение с LLM так подействовало, или Вы писали так ещё до эпохи LLM? Это не наезд, но чисто ощущение от формулировок похожее, как от формулировок DeepSeek'а, например...

Энтузиасты представили альтернативный открытый клиент Telegram для Android под названием Monogram, написанный на Kotlin

Medeyko 30 мар в 08:56

А чем именно это настораживает? При использовании внешним нескомпроментированным клиентом, telega proxy - самый обычный MTProto-proxy, использование которого по рискам почти не отилчается от случайных прокси, найденных в Интернете, насколько я понимаю. Так что не вижу никакой проблемы в том, что пользователю предоставлена opt-in возможность использовать этот прокси... Если бы был включён по умолчанию, то да, я бы тоже насторожился.

Universo Platformo — опенсорс аналог 1С: Предприятия с Киберпланом для спасения человечества от восстания машин

Medeyko 26 мар в 11:04

Любопытно, конечно. Но у меня такое грустное предчувствие, что в результате "объявлены наследием" будут все разработки в рамках этого проекта, без достижения какого-либо значимого практического результата...

«Бюро 1440»: первые 16 спутников низкоорбитальной группировки «Рассвет» выведены на орбиту и вышли на связь с ЦУП

Medeyko 24 мар в 08:12

Возможно, Вас "зарубают" на этапе проверки службой безопасности, и до анализа компетенций просто дело не доходит? Какая-нибудь кажущаяся мелочью особенность биографии так вредить вполне может.

Им не поможет белый список

Medeyko 23 мар в 23:35

Простите, но это ошибочная интерпретация Закона необходимого разнообразия! Управляющая система может быть и проще, и сложнее управляемой. Этот закон говорит о разнообразии управляющих воздействий, причём и там нет границы, просто чем разнообразнее воздействия при их однозначности, тем сильнее можно повлиять на определённость состояния управляемой системы... "Бытовые" интерпретации обманчивы, и их можно крутить в любую сторону в зависимости от мировоззрения крутящего.

Им не поможет белый список

Medeyko 23 мар в 08:53

И даже если вы используете двухзвеный ВПН: когда точка входа и точка выхода разные хосты, то блокировка точки выхода по IP приведет к потере связности точек входа и выхода, и к бесполезности такого VPN. Избегнуть такого обнаружения можно только через введение трехзвенной схемы, когда точка входа и точка выхода связываются через транзитную точку.

А может кто-нибудь пояснить мне эту довольно странную, по-моему, сентенцию?

Если пользователь пробился наружу через VPN, то если адреса, используемый сервером для доступа в обычный Интернет (назовём IP1) и для связи с пользователями (IP2), разные (что и предполагается при двухзвенном VPN, если я правильно понимаю, о чём речь), то любые ограничения на ТСПУ для IP1 никак не мешают пользователю.

Им не поможет белый список

Medeyko 23 мар в 08:16

Современный интернет завязан на CDN, сервисы защиты от DDOS-атак и хостинги. Отсутствие доступа к их IP-адресам означает, что доступ в Интернет сломан. Наличие доступа к ним означает, что белые списки можно обойти. Плюс к этому нереально вносить сколько-нибудь значительное количество безобидных заграничных сайтов, не пропуская при этом регулярно пути обхода, поэтому подовляющее большинство безобидных сайтов работать не будет.
Поэтому тут жёсткая дихотомия: непробиваемые белые списки означают сломанный Интернет. Tertium non datur.

Эксперты RKS Global исследовали 8 популярных альтернативных клиентов Telegram для Android

Medeyko 22 мар в 04:40

Например, не нравится ерунда, походя написанная про ForkGram. Чтобы там появилось что-то не то, нужно не только, чтобы его авторы сбрендили, но и чтобы при ревью кода на F-Droid это пропустили.

И забавная рекомендация про официальный клиент, который якобы проходит аудит - он не опенсорсный. Опенсорсная версия, проходящая аудит сообщества - это отдельная ветка, это вовсе не, что ставится в качестве Телеграмма из Гугл-Плэй (если мои данные не устарели, конечно).

Особенно смешно выглядит рекомендация доверять команде Телеграм, в анамнезе которой есть "тёмные паттерны" - типа использования системных контактов не по назначению и не доверять тем форкам, к которых таких претензий не было.

И про MTProto нет пояснения, что это -криптографический протокол, и само по себе использование российских MTProto-прокси не означает, что содержимое переписок утекает. Не могу определить - авторы "исследовпния" об этом не знают или специально умалчивают, создавая у читателя ощущение, будто российские MTProto-прокси - это утечка текстов сообщений.

В общем, на мой личный взгляд, очень поверхностное исследование, и его уровень не даёт права давать советы, написанные в его "выводах".

И нет, для того, чтобы критиковать "исследование", не обязательно самому делать такое же...

Блокировка Telegram в России: почему VPN больше не гарантирует доступ, и как энтузиасты решают эту проблему

Medeyko 20 мар в 09:02

Насколько я вижу, подозрительными считаются любые трансграничные соединения, кроме помещённых в белые списки. "Замедляются" после нескольких килобайтов (мегабайтов) и самые банальные без каких-либо обходов браузерные соединения с самыми что ни на есть безобидными ресурсами (математическими, например).

На астероиде нашли пять ключевых генетических компонентов жизни на Земле

Medeyko 18 мар в 15:33

Да, LUCA был практически наверняка с ДНК, и довольно сложным.

Я в целом согласен с Вами, а не с Марковым, просто привык при рассмотрении гипотез учитывать аргументы не только за, но и против. Вот, например, любопытная работа и там вероятность занесения жизни межзвёздными объектами в Приложении 2 высчитывают как пренебрежимо малую. https://journals.sagepub.com/doi/full/10.1089/ast.2025.0009 (Правда, на мой взгляд, они упускают ряд возможностей в своём рассмотрении гипотезы внеземных предпосылок к зарождению жизни.)

Казалось, что ИИ ворвался в нашу жизнь. Показалось

Medeyko 18 мар в 12:53

Я понимаю, что статья немного озорная умышленно - чтобы вызвать дискуссию. Но всё же не могу не отметить.

Автор статьи, безусловно, среди "зелёненьких" человечков, а не "сереньких". Он явно регулярно использует ИИ, и собственно, на основании этого опыта использования статью и написал.

Если пытаться найти квитнэссенцию статьи, то это, по видимому "чат-боты - неудачный формат для взаимодействия с системами ИИ".

И автор делает утверждение, что это - тупиковый формат, который будет вытеснен специализированными форматами. Не соглашусь с автором. Людям удобнее универсальный помощник, а не выискивание разных профессионалов под разные задачи. Секретарей у большинства людей нет не потому, что они хотят всё сами делать или общаться с профессионалами, а потому что они не могут себе позволить содержать секретаря. С повышением качества работы чат-ботов/агентов всё больше людей будут всё чаще к ним обращаться и делегировать им свои задачи. Формат будет меняться, вероятно - в частности, может стать более используемым голосовой ввод, возможно, ии-системы будут не просто ждать распоряжений, а предлагать варианты. В общем, как в ситуации с ассистентами-слугами: умный слуга знает привычки хозяина, и спрашивает "не изволите ли чашечку кофе в постель?", а не просто ждёт, пока ему прикажут нести кофе. Ну, да, в этом смысле интерфейс будет развиваться - в первую очередь в виде многомодальности взаимодействия - тоже аналогично как с людьми: можно голосом сказать, можно в мессенджере написать, а можно просто жестом показать.

Ещё автору не нравится "хайп" вокруг слова "интеллект", по-видимому. Ну, это дело десятое. Красивые слова хороши тем, что увеличивают проникновение темы в обществе, и это способствует выделению на её развитие ресурсов. А так, когда ИИ-помощники станут естественной частью жизни большинства, с большой вероятностью, они и называться будут в обычной жизни без использования слова интеллект. Ну, как со смартфонами - то, что они "смарт" используется в формальном термине, но в реальной жизни мало кто говорит "я взял с собой смартфон" - говорят "телефон", "мобилу" и т.п. Он этого телефоны не стали менее умными. Так что это всё неважная пена. Вряд ли я ошибусь, заявив, что системы ИИ с диалоговым интерфейсом будут развиваться и всё больше проникать во все сферы деятельности людей.

На астероиде нашли пять ключевых генетических компонентов жизни на Земле

Medeyko 18 мар в 10:23

Ну и логичным будет дать ссылку и на скептическую рецензию А. В. Маркова: https://www.socionauki.ru/almanac/issues/evolution_5/032-034.pdf

На астероиде нашли пять ключевых генетических компонентов жизни на Земле

Medeyko 18 мар в 10:02

Кстати, и вот здесь Вы пишете (в 2009-м, но ещё дальше экстраполяция, на основе других рассуждений):

Кстати говоря, приведённые выше оценки косвенно подтверждают теорию зарождения жизни вне Земли, причём, вполне возможно, что жизнь в виде самореплицирующихся полимерных молекул появилась ещё до формирования солнечной системы. Действительно, если длина кода простейших бактерий, первые признаки жизнедеятельности которых относятся к периоду, отстоящему от нас примерно на 3.5 млрд. лет, составляет 10^6 бит, а скорость удвоения длины кода примерно 600 млн. лет, то, экстраполируя эту зависимость в прошлое, мы получим, что генетический код со сложностью порядка нескольких бит, мог существовать уже примерно 13.5 млрд. лет тому назад, то есть, в те времена, когда ни Земли, ни Солнца ещё не было. Более того, не исключено, что простейший механизм саморепликации, и соответствующая конкуренция различных устойчивых молекулярных структур, возникли почти сразу же после Большого Взрыва. Напомним, что возраст Вселенной в настоящее время оценивается астрофизиками в 13.7 млрд. лет.

На астероиде нашли пять ключевых генетических компонентов жизни на Земле

Medeyko 18 мар в 09:43

Очень интересно, спасибо! Но это 2013-й год, наверняка же за прошедшие годы появились новые открытия?

На астероиде нашли пять ключевых генетических компонентов жизни на Земле

Medeyko 17 мар в 12:33

Тема, кстати, весьма любопытная. Вроде, у Переслегина видел соображение: что если условно расположить хронологические точки революционных изменений (фазовых переходов) - то если считать возникновение жизни чисто земным феноменом, то есть после формирования Земли, то этот момент не вписывается в общую картину. А вот если отсчитывать пребиотическую эволюцию с формирования ядра Млечного пути, и считать, что биологическая жизнь на Земле возникла не с нуля, а уже с каких-то информационных молекул и предтеч рибосом, сформировавшихся за её пределами, то всё идеально вписывается по срокам. Насколько я могу судить, обнаружение азотистых оснований на астероидах говорит в пользу этой гипотезы.

16 марта: продолжается сетевой сбой в работе Telegram в РФ

Medeyko 17 мар в 12:09

В обсуждаемом контексте - нет, не критично. Из-за усложнения перехода дорог радиус пешей доступности в течение часа уменьшается на проценты, а не в разы. (МКАД - это редкий предельный специальный случай, не влияющий существенно на статистику. Так-то есть и похуже случаи - около большого озера, например. Но и эти случаи превращают превращают условный круг в полукруг, а не замыкают жертву в клетке.) Это не критично, и многократно компенсируется бОльшей концентрацией вакансий.

16 марта: продолжается сетевой сбой в работе Telegram в РФ

Medeyko 17 мар в 12:04

Хуже жили без всех этих современных сервисов. А до 19-го века не было широкого использования электричества и унитазов. Тоже как-то жили...

2 3 ...

37 38