Комментарии / Профиль difhel / Хабр

Mark Fomin@difhel

Пользователь

0,2

Рейтинг

Подписчики

ПрофильСтатьи2ПостыНовостиКомментарии39

Как я экономлю 80% контекста нейросетей при работе с логами

difhel 21 апр в 11:47

Я имею в виду бенчмаркинг эффективности анализа логов (насколько с вашим подходом модель чаще/реже корректно определяет проблему по логам, чем если бы ей просто скормить логи). Компрессия input токенов понятна, да.

Как я экономлю 80% контекста нейросетей при работе с логами

difhel 21 апр в 11:03

А у вас есть какие-то бенчмарки эффективности работы с логами, какая методика исследования? Например, можно 100 раз прогнать один и тот же лог в одном формате, посмотреть процент корректно распознанных проблем, и сравнить с таким же процентом, если просто давать сырые логи. Это было бы интересно глянуть, учитывая, что у современных LLM достаточно большой контекст (сотни тысяч-миллионы токенов), и они и так должны были бы неплохо справляться с такими задачами.

Как не передать на desktop свой IP в РКН

difhel 16 апр в 07:31

Спасибо за статью. Такой вопрос по site based tunneling: он же не заворачивает весь трафик с сайта, а просто роутит по IP/SNI/Host, верно? Что мешает условному max.ru проверить доступность зарубежных сервисов через fetch в no-cors режиме или ещё как-то? Например, вы добавили telegram.org в список сайтов, которые должны идти через прокси. Тогда любое приложение (и даже сайты?) могут увидеть, что telegram.org доступен, хотя он явно не должен быть доступен.

Плюс с таким подходом есть проблема: шпионскому приложению достаточно на любом из распространенных сайтов, которые обычно добавляют в список проксирования (Telegram, ChatGPT, Discord, ...) найти внутреннюю ручку или уязвимость, которая раскрывает IP.

Поэтому явно безопаснее/интереснее было бы посмотреть на обзор решений с per browser tab / per desktop app routing.

Разговоры ничего не стоят. Код тоже

difhel 16 апр в 07:15

Спасибо за статью. У меня возникло два вопроса:

Зачем использовать позднее связывание, если, как вы говорите, нейронки в это не умеют без дополнительных настроек? Понимаю, что хочется иметь свой личный стиль во всех проектах, но в эпоху ИИ как минимум имеет смысл ревьюить свой стиль кода на наличие паттернов, которые на ровном месте ухудшают эффективность ИИ (больший шанс, что нейронка налажает в этом коде, так как такого кода нет/мало в данных обучения модели; больше токенов на то, чтобы прочитать скилл и держать его в контексте, что тоже влияет на дороговизну разработки и на качество, если контекст у вас забит не реально нужными знаниями о проекте, а формальностями, которые можно опустить).
Вы пишите, что размер спецификаций у вас превышает размер кода в несколько раз, и это ожидаемое поведение. Почему вы так считаете? Как будто весь смысл в том, что снижается сложность реализации проектов с нуля, что достаточно написать относительно короткую спеку, а нейронка ее заимплементит, вместо того, чтобы самому писать десятки тысяч строк кода. Возможно, проблема в том, что спека у вас тоже сгенерирована ИИ и поэтому она размытая и такая большая.

Из-за критической уязвимости VLESS клиентов скоро все ваши VPN будут заблокированы

difhel 9 апр в 21:46

Это тоже не панацея. Во-первых факт обхода блокировки все равно будет виден (скам может сделать запрос к telegram.org и увидеть, что он доступен).

Во-вторых, цензору даже необязательно покупать свой сервер за рубежом для этого. Достаточно найти в любом сервисе из вашего белого списка (Telegram, Discord, ChatGPT, всякие зарубежные CDN и так далее) один скрытый пусть даже сервисный или не предназначенный для публичного использования endpoint, который отдает ваш IP — и все.

И не получится гарантировать, что сервисы в вашем белом списке никаким образом не могут спалить ваш IP самостоятельно.

Где же все эти приложения, создаваемые с помощью ИИ?

difhel 29 мар в 09:10

В целом не очень понятно, как оценить "продуктивность" или даже просто рост числа проектов, связанных с ИИ.

Упрощает ли ИИ разработку каких-то простых личных программ для не-разработчиков? Безусловно. Только эти люди скорее всего даже не будут пользоваться GitHub, поэтому непонятно, как включить их в статистику.

А метод анализа на основе числа пакетов PyPI вообще странный. Очевидно же, что большинство новых проектов, созданных ИИ — это какие-то личные или рабочие проекты, там сайты, телеграм-боты, но уж точно не пакеты.

Энтузиасты представили альтернативный открытый клиент Telegram для Android под названием Monogram, написанный на Kotlin

difhel 29 мар в 08:56

Есть как минимум 2 (https://github.com/loyldg/mytelegram, https://github.com/teamgram/teamgram-server), но они урезанные и их полные версии продаются за десятки тысяч долларов.

Вполне возможно, что с сегодняшними возможностями вайбкодинга и spec-driven development проще навайбкодить свой собственный бекенд, благо вся необходимая документация и референсные реализации клиентской части есть. Как интересный эксперимент.

Энтузиасты представили альтернативный открытый клиент Telegram для Android под названием Monogram, написанный на Kotlin

difhel 29 мар в 08:51

Это не nightly сборка, это альтернативный официальный Android клиент.

https://telegram.org/blog/telegram-x

Как попасть на дачу президента в пять часов утра

difhel 8 мар в 12:20

Пишу вам из 2026. Вероятно, пришельцы понаблюдали за тем, что у нас происходило в начале года, и решили обойти Солнечную систему стороной.

Мой ежедневный список дел в Obsidian

difhel 31 янв в 11:02

Obsidian не имеет открытого исходного кода.

От стартапа к протоколу: Почему мы решили написать свой «PostgreSQL для финансов»

difhel 27 янв в 19:29

А в чем принципиальные отличия с системами вроде https://github.com/tigerbeetle/tigerbeetle?

Синтаксический сахар или технический деготь: классы в JavaScript

difhel 21 янв в 08:07

Как обсуждали в предыдущей статье автора, приватные поля можно было получить и раньше через замыкания (хотя и не стоит использовать такой подход, потому что это ломает оптимизации движков).

Вообще глубоко убежден, что private поля были ошибкой. На практике нередко случается, например, что вам нужно какое-то поле в классе из библиотеки, а разработчик библиотеки ~~подумал, что он лучше всех знает ООП~~ не подумал о такой возможности и сделал его приватным. Это сильно ухудшает гибкость для сторонних разработчиков. В большинстве языков это нерешаемая проблема, приходится делать форк и поддерживать его в актуальном состоянии. В TS например действительно кейворд private ни на что не влияет в рантайме, что позволяет обойти его через приведение типов, если очень-очень нужно. Чего не скажешь про "#name" поля в JS.

-1

Вышел клиент мессенджера Max для Linux (RPM, DEB и AppImage)

difhel 30 авг 2025 в 11:44

Слушайте, действительно, вы правы. Я почему-то был убежден в том, что видел "forked from tdesktop" на гитхабе.

В мессенджере Max появились видеокружки

difhel 29 авг 2025 в 10:41

Зачем делать альтернативный клиент, если тврщ майор все равно будет иметь доступ к любым коммуникациям внутри Max? Если беспокоитесь за слив данных с устройства (фотографии, установленные приложения и другие подозрительные разрешения), проще купить отдельный телефон или, ещё проще, поставить Max в полностью изолированный Workspace. Это можно сделать на Android через приложение Island.

Вышел клиент мессенджера Max для Linux (RPM, DEB и AppImage)

difhel 28 авг 2025 в 16:27

Что любопытно, так это то, что десктопный клиент Аськи (ICQ New, пока ее не убили, от MailRu), был форком Telegram Desktop. И работало, и выглядело очень неплохо.

А это вообще смех какой-то, "нативное приложение" на Electron. Кстати, статьи за дискредитацию мессенджера Max ещё не завезли? 😁

VK: в мессенджере Max зарегистрирован первый миллион пользователей

difhel 3 июл 2025 в 01:30

получение списка установленных приложений

Помню, что ещё совсем недавно Google Play требовал очень строгого обоснования этого разрешения. Вряд ли его смогли добавить просто так, скорее всего какой-то функционал, хотя бы ради прохождения ревью они сделали. Или Google уже забил?

Telegram помог полиции, раскрыв данные 17-летнего хакера, укравшего базу 19,2 млн клиентов мобильного оператора Free

difhel 22 янв 2025 в 10:20

Если он уже скачал данные (то есть эксплуатировал найденную уязвимость), нет, в лучшем случае его бы просто поблагодарили и лишили bounty, в худшем - засудили.

Безопасный Docker в продакшене

difhel 18 окт 2024 в 12:30

Последнее, что мы исправим, — использовать COPY вместо ADD. Оба почти одинаковы, но COPY более точный.

Дело в не том, что он "более точный". ADD содержит магию - возможность добавлять в образ файлы по URL и разархивировать tar архивы, что может привести к неожиданному поведению. Поэтому рекомендуют, если возможно, использовать COPY.

https://stackoverflow.com/questions/24958140/what-is-the-difference-between-the-copy-and-add-commands-in-a-dockerfile

Obsidian: синхронизация без боли

difhel 25 сен 2024 в 12:43

https://docs.github.com/en/repositories/working-with-files/managing-large-files/about-large-files-on-github#repository-size-limits

Пишут, что 5 гигабайт спокойно выдадут, а дальше могут возникнуть вопросы. Но строгих лимитов нет.

Сколько, реально, lossless треков в Яндекс Музыке

difhel 22 авг 2024 в 09:16

У меня есть подозрение, что статистика может быть некорректной. Судя по названию таблицы, которое включает слово cache, вероятнее всего, это кеш всех проигранных треков за время, которое приложение Яндекс Музыки было установлено на вашем смартфоне. А значит, скорее всего, некоторая часть кеша образовалась ДО того, как Яндекс поддержал loseless формат, и данные о качестве там, соответственно, старые.

Для чистоты эксперимента было бы здорово удалить приложение и снести все его данные, а после установить заново и сравнить результаты, чтобы убедиться, что статистику не испортил старый кеш.