Обновить
6
Владимир Медейко@Medeyko

Гендиректор АНО Рувики и прочее

0,4
Рейтинг
27
Подписчики
Отправить сообщение

Довольно любопытно требование внедрить функцию слежения за использование пользователями VPN в приложение. Стараюсь не ставить приложения на телефон. Мучаюсь с веб-версиями или вообще отказываюсь от услуг сервиса, навязывающего придожение... Ещё раз убедился, что правильно делаю.

Что касается платы за зарубежный трафик - я думаю, что пока не предполагается задавливать все пути за кордон, и задача уменьшения объёмов зарубежного трафика ставится ради уменьшения нагрузки на ТСПУ, дабы хватало мощностей для анализа.

Понятно, что автор сильно упрощает, и просто показывает взгляд на проблему с одной стороны. Это может быть полезно людям для улучшения интуитивного восприятия. Так что ок.

Но вот за ошибочный и при этом категорический вывод я попеняю:

Каждый, кто говорит «мы решим проблему галлюцинаций» и не уточняет «за счёт кратного увеличения модели или внешней памяти», — либо лукавит, либо не понимает информационную теорию.

Во-первых, формулировка принципиально заведомо некорректна: понятно, что и за счёт увеличения модели или внешней памяти полностью проблему "галлюцинаций" можно решить только с использованием бессмысленно больших затрат ресурсов. Поэтому можно говорить лишь об уменьшении уровня "галлюцинирования" до приемлемого для конкретных задач.

Во-вторых, решение, естественно, может строиться не только за счёт кратного увеличения модели или внешней памяти. Современным большим языковым моделям ещё очень далеко до пределов, вытекающих из теории информации. Одно из направлений прозвучало даже в самой статье:

Потому что точные числа — это именно те «мелкие детали», которые теряются первыми. 23 × 47 = 1081, но для кодека это просто три случайных числа без паттерна. Нельзя «сжать» таблицу умножения — её можно только запомнить целиком или вычислить алгоритмически. LLM не делает ни того, ни другого — она восстанавливает «что-то числовое, что выглядит правильным».

Впрочем, у утверждение, будто основанные на больших языковых моделях не вычисляют алгоритмически, неверное. Как и биологические нейросети, искусственные тоже "применяют" алгоритмы (и я сейчас не о возможности запустить интерпретатор Питона, а именно о генерации следующего токена чисто благодаря весам). Я экспериментировал с этим и своими глазами видел рост способностей нейросетей, которые сначала доросли до того, чтобы начать понимать разъяснения поразрядного сложения с переносом длинных чисел (и, соответственно, правильно складывать числа любой длины), а потом и умножение столбиком для произведения длинных чисел (и правильно перемножать числа любой длины). Ну, точнее, они правильно вычисляли и правильно демонстрировали промежуточные выкладки в моих экспериментах. Понятно, что это простейшая символьная логика, можно и вообще арифметику на аксиомах Пеано сделать. Но тем не менее - это алгоритмы на чистых нейронных сетях. И они всё лучше и лучше понимают объяснения алгоритмов с меньшим и меньшим разжёвыванием деталей. Причём всё лучше понимают и сети без роста размера.

Ну, а если мы разрешим использовать инструменты, в которых нужные алгоритмы реализованы максимально эффективно как алгоритмически, так и с обращением опять же к ИНС с нужным запросом, для перепроверок, чтобы проверять и устранять галлюцинации - то количество ещё вырастет. (Я на практике убедился, например, что одна и та же ИНС, если её одновременно использовать и как аналитика, и как критика в последовательных запросах, существенно уменьшает количество галлюцинаций. Это не вписывается в вашу аналогию "сжатия", насколько я понимаю.)

Это если один будет. А если несколько? Как сужать дальнейший поиск? Придётся ещё другие телефоны контактов объекта находить и проверять. Разве нет?

Но в целом, конечно, грустно, насколько безответственно относятся операторы к столь чувствительным данным.

Коллега, простите, но скажите, пожалуйста, Вы применяете при ответах на Хабре в каком-то виде LLM (например, для улучшения стиля текста)? Если нет, то очень интересно, это на Вас общение с LLM так подействовало, или Вы писали так ещё до эпохи LLM? Это не наезд, но чисто ощущение от формулировок похожее, как от формулировок DeepSeek'а, например...

А чем именно это настораживает? При использовании внешним нескомпроментированным клиентом, telega proxy - самый обычный MTProto-proxy, использование которого по рискам почти не отилчается от случайных прокси, найденных в Интернете, насколько я понимаю. Так что не вижу никакой проблемы в том, что пользователю предоставлена opt-in возможность использовать этот прокси... Если бы был включён по умолчанию, то да, я бы тоже насторожился.

Любопытно, конечно. Но у меня такое грустное предчувствие, что в результате "объявлены наследием" будут все разработки в рамках этого проекта, без достижения какого-либо значимого практического результата...

Возможно, Вас "зарубают" на этапе проверки службой безопасности, и до анализа компетенций просто дело не доходит? Какая-нибудь кажущаяся мелочью особенность биографии так вредить вполне может.

Простите, но это ошибочная интерпретация Закона необходимого разнообразия! Управляющая система может быть и проще, и сложнее управляемой. Этот закон говорит о разнообразии управляющих воздействий, причём и там нет границы, просто чем разнообразнее воздействия при их однозначности, тем сильнее можно повлиять на определённость состояния управляемой системы... "Бытовые" интерпретации обманчивы, и их можно крутить в любую сторону в зависимости от мировоззрения крутящего.

И даже если вы используете двухзвеный ВПН: когда точка входа и точка выхода разные хосты, то блокировка точки выхода по IP приведет к потере связности точек входа и выхода, и к бесполезности такого VPN. Избегнуть такого обнаружения можно только через введение трехзвенной схемы, когда точка входа и точка выхода связываются через транзитную точку.

А может кто-нибудь пояснить мне эту довольно странную, по-моему, сентенцию?

Если пользователь пробился наружу через VPN, то если адреса, используемый сервером для доступа в обычный Интернет (назовём IP1) и для связи с пользователями (IP2), разные (что и предполагается при двухзвенном VPN, если я правильно понимаю, о чём речь), то любые ограничения на ТСПУ для IP1 никак не мешают пользователю.

Современный интернет завязан на CDN, сервисы защиты от DDOS-атак и хостинги. Отсутствие доступа к их IP-адресам означает, что доступ в Интернет сломан. Наличие доступа к ним означает, что белые списки можно обойти. Плюс к этому нереально вносить сколько-нибудь значительное количество безобидных заграничных сайтов, не пропуская при этом регулярно пути обхода, поэтому подовляющее большинство безобидных сайтов работать не будет.
Поэтому тут жёсткая дихотомия: непробиваемые белые списки означают сломанный Интернет. Tertium non datur.

Например, не нравится ерунда, походя написанная про ForkGram. Чтобы там появилось что-то не то, нужно не только, чтобы его авторы сбрендили, но и чтобы при ревью кода на F-Droid это пропустили.

И забавная рекомендация про официальный клиент, который якобы проходит аудит - он не опенсорсный. Опенсорсная версия, проходящая аудит сообщества - это отдельная ветка, это вовсе не, что ставится в качестве Телеграмма из Гугл-Плэй (если мои данные не устарели, конечно).

Особенно смешно выглядит рекомендация доверять команде Телеграм, в анамнезе которой есть "тёмные паттерны" - типа использования системных контактов не по назначению и не доверять тем форкам, к которых таких претензий не было.

И про MTProto нет пояснения, что это -криптографический протокол, и само по себе использование российских MTProto-прокси не означает, что содержимое переписок утекает. Не могу определить - авторы "исследовпния" об этом не знают или специально умалчивают, создавая у читателя ощущение, будто российские MTProto-прокси - это утечка текстов сообщений.

В общем, на мой личный взгляд, очень поверхностное исследование, и его уровень не даёт права давать советы, написанные в его "выводах".

И нет, для того, чтобы критиковать "исследование", не обязательно самому делать такое же...

Насколько я вижу, подозрительными считаются любые трансграничные соединения, кроме помещённых в белые списки. "Замедляются" после нескольких килобайтов (мегабайтов) и самые банальные без каких-либо обходов браузерные соединения с самыми что ни на есть безобидными ресурсами (математическими, например).

Да, LUCA был практически наверняка с ДНК, и довольно сложным.

Я в целом согласен с Вами, а не с Марковым, просто привык при рассмотрении гипотез учитывать аргументы не только за, но и против. Вот, например, любопытная работа и там вероятность занесения жизни межзвёздными объектами в Приложении 2 высчитывают как пренебрежимо малую. https://journals.sagepub.com/doi/full/10.1089/ast.2025.0009 (Правда, на мой взгляд, они упускают ряд возможностей в своём рассмотрении гипотезы внеземных предпосылок к зарождению жизни.)

Я понимаю, что статья немного озорная умышленно - чтобы вызвать дискуссию. Но всё же не могу не отметить.

Автор статьи, безусловно, среди "зелёненьких" человечков, а не "сереньких". Он явно регулярно использует ИИ, и собственно, на основании этого опыта использования статью и написал.

Если пытаться найти квитнэссенцию статьи, то это, по видимому "чат-боты - неудачный формат для взаимодействия с системами ИИ".

И автор делает утверждение, что это - тупиковый формат, который будет вытеснен специализированными форматами. Не соглашусь с автором. Людям удобнее универсальный помощник, а не выискивание разных профессионалов под разные задачи. Секретарей у большинства людей нет не потому, что они хотят всё сами делать или общаться с профессионалами, а потому что они не могут себе позволить содержать секретаря. С повышением качества работы чат-ботов/агентов всё больше людей будут всё чаще к ним обращаться и делегировать им свои задачи. Формат будет меняться, вероятно - в частности, может стать более используемым голосовой ввод, возможно, ии-системы будут не просто ждать распоряжений, а предлагать варианты. В общем, как в ситуации с ассистентами-слугами: умный слуга знает привычки хозяина, и спрашивает "не изволите ли чашечку кофе в постель?", а не просто ждёт, пока ему прикажут нести кофе. Ну, да, в этом смысле интерфейс будет развиваться - в первую очередь в виде многомодальности взаимодействия - тоже аналогично как с людьми: можно голосом сказать, можно в мессенджере написать, а можно просто жестом показать.

Ещё автору не нравится "хайп" вокруг слова "интеллект", по-видимому. Ну, это дело десятое. Красивые слова хороши тем, что увеличивают проникновение темы в обществе, и это способствует выделению на её развитие ресурсов. А так, когда ИИ-помощники станут естественной частью жизни большинства, с большой вероятностью, они и называться будут в обычной жизни без использования слова интеллект. Ну, как со смартфонами - то, что они "смарт" используется в формальном термине, но в реальной жизни мало кто говорит "я взял с собой смартфон" - говорят "телефон", "мобилу" и т.п. Он этого телефоны не стали менее умными. Так что это всё неважная пена. Вряд ли я ошибусь, заявив, что системы ИИ с диалоговым интерфейсом будут развиваться и всё больше проникать во все сферы деятельности людей.

Ну и логичным будет дать ссылку и на скептическую рецензию А. В. Маркова: https://www.socionauki.ru/almanac/issues/evolution_5/032-034.pdf

Кстати, и вот здесь Вы пишете (в 2009-м, но ещё дальше экстраполяция, на основе других рассуждений):

Кстати говоря, приведённые выше оценки косвенно подтверждают теорию зарождения жизни вне Земли, причём, вполне возможно, что жизнь в виде самореплицирующихся полимерных молекул появилась ещё до формирования солнечной системы. Действительно, если длина кода простейших бактерий, первые признаки жизнедеятельности которых относятся к периоду, отстоящему от нас примерно на 3.5 млрд. лет, составляет 10^6 бит, а скорость удвоения длины кода примерно 600 млн. лет, то, экстраполируя эту зависимость в прошлое, мы получим, что генетический код со сложностью порядка нескольких бит, мог существовать уже примерно 13.5 млрд. лет тому назад, то есть, в те времена, когда ни Земли, ни Солнца ещё не было. Более того, не исключено, что простейший механизм саморепликации, и соответствующая конкуренция различных устойчивых молекулярных структур, возникли  почти сразу же после Большого Взрыва. Напомним, что возраст Вселенной в настоящее время оценивается астрофизиками в 13.7 млрд. лет.

Очень интересно, спасибо! Но это 2013-й год, наверняка же за прошедшие годы появились новые открытия?

Тема, кстати, весьма любопытная. Вроде, у Переслегина видел соображение: что если условно расположить хронологические точки революционных изменений (фазовых переходов) - то если считать возникновение жизни чисто земным феноменом, то есть после формирования Земли, то этот момент не вписывается в общую картину. А вот если отсчитывать пребиотическую эволюцию с формирования ядра Млечного пути, и считать, что биологическая жизнь на Земле возникла не с нуля, а уже с каких-то информационных молекул и предтеч рибосом, сформировавшихся за её пределами, то всё идеально вписывается по срокам. Насколько я могу судить, обнаружение азотистых оснований на астероидах говорит в пользу этой гипотезы.

В обсуждаемом контексте - нет, не критично. Из-за усложнения перехода дорог радиус пешей доступности в течение часа уменьшается на проценты, а не в разы. (МКАД - это редкий предельный специальный случай, не влияющий существенно на статистику. Так-то есть и похуже случаи - около большого озера, например. Но и эти случаи превращают превращают условный круг в полукруг, а не замыкают жертву в клетке.) Это не критично, и многократно компенсируется бОльшей концентрацией вакансий.

Хуже жили без всех этих современных сервисов. А до 19-го века не было широкого использования электричества и унитазов. Тоже как-то жили...

1
23 ...

Информация

В рейтинге
2 772-й
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Зарегистрирован
Активность