This library converts HTML DOM to a semantic Markdown format optimized for use with Large Language Models (LLMs). It preserves the semantic structure of web content, extracts essential metadata, and reduces token usage compared to raw HTML, making it easier for LLMs to understand and process information.
Не, конечно, если вдаваться в подробности, то и поисковый запрос тоже мусор. Но не верен вообще изначальный посыл, что можно найти нормальный ресурс/статью, где будет не поверхостное "покупайте в ближайшем магазине электроники новый телевизор vpn!", а более-менее толковый разбор. Уровня повыше "пообещали то, пообещали сё. берите" или пары прогнанных тестов скорости. И это вдобавок разбавляется как раз SEO-оптимизированным спамом, что даже если бы качественные статьи в блогах, посты на форумах и были, то их бы смыло волной шлака. А умение тестить + писать технические статьи - далеко не то же, что и оптимизировать как текст, так и дизайн сайта под SEO.
Собственно мне известен один случай, когда западная VPN компания сайт с "обзорами" и содержала. Рабсиле, который нанялся копирайтером, потом ушел и об этом рассказал как минимум заслали cease&desist с одновременной подчисткой хвостов публикации.
Что касается "ну не виноват поисковик" - отчасти действительно так. Если "прежний интернет" действительно наполнялся от форумов до любительских блогов, коих на заре было несчетное количество и любых направлений (это же World Wide Web, рассказать всему миру!), то сейчас всё это осело в лучшем случае в соцсетях, а в худшем вообще цельносвязные тексты перестали писать. А пересказы содранные со старого а ля копирайтинг в Рунете или Дзене, в 2010 гг. ЖЖ - это как раз тот мусор и есть.
мы сознательно взяли самые "популярные" элементы, чтобы в случае неудачи одним махом отсечь максимальное количество
Не наоборот ли, "непопулярные"?
Второе, так и не въехал в условия задачи. Судя по финальному шагу: разве на эти условия SAT solver натравить не получится? Была когда-то статья на Хабре про алгоритмически-логическое решение судоку.
PS: Картинки - это хорошо, многие пренебрегают их использованием, чтобы ясно донести суть мышления. Но чем их верстать в paint, лучше взять draw.io или вообще голый SVG. И отдельно подумать о незрячих пользователях.
Мало того, что много трафика и сразу денег стоит. Так эти пауки еще много чего клали на robots.txt, rate-limiting, и даже по вычислениям могут (и делают) ронять сервера.
Идея не оригинальная у Cloudflare, чел какой-то опубликовал этот концепт на news.ycombinator.com. По аналогии с SSH tarpit.
Забавно, что Valve в их Community Market так и делает. "Туда не ходи, ты сюда ходи" и где-то в ответах страницы с предметом (где график цен) добавлена ссылка на JSON API. Собственно... как я об этом и узнал.
Sha256 на Ryzen 7 5800H считается за 4-5 наносекунд на хэш.
AVX2, AVX512 быстрее sha инструкций процессора?
CPU не выдает свою максимальную скорость из-за AVX boost lag
AMD не вводила "тормоз" при исполнении AVX. Процессор ориентируется лишь на технические метрики: температура, ограничение по питанию и энергопотреблению. Ноутбучным (не знаю что за мини-ПК такой) процессорам явно не хватает ватт по "TDP". У меня такой же проц, при многопотоке не такой рьяной по частоте, как в простое и малопоточных нагрузках. А управление частотой пришлось настраивать из-за шума в стандартной конфигурации.
Стоит упомянуть: компании, у кого нет вознаграждения за уязвимости (условно-бесплатная случайная рабочая сила) будут потом отплачивать репутационно, операционно, финансово, а потом в случае факапа (Аэрофлот) еще и деньги по сусекам искать (из других бюджетов), чтобы оплатить авральный проект по обезопащиванию.
Статья, хоть и хорошо написана, но (честно) дочитывать не стал. Тем что сначала идут неправильные варианты, слишком много внимания они на себя берут... а лишь затем следуют правильные фразы. Так можно наоборот выучить. Лучше не буду рисковать.
Видимо, решили не наступать дважды на те же грабли однозначного значения символа в стандарте?
Торвальдс категоричен, не отнять. Подумалось, может это такой вариант rage-bait'а двадцатилетней давности? Понятно, что это мягко говоря... кхм, "особенности" характера, но может она его и возвела в культовый статус?
С наводкой именно на pthreads теперь и докопался окончательно:
In POSIX.1, errno is defined as an external global variable. But this definition is unacceptable in a multi-threaded environment, because its use can result in non-deterministic results. The problem is that two or more threads can encounter errors, all causing the same errno to be set. Under these circumstances, a thread might end up checking errno after it has already been updated by another thread.
.
To circumvent the resulting non-determinism, POSIX.1c redefines errno as a service that can access the per-thread error number as follows (ISO/IEC 9945-1: 1996 (POSIX-1), §2.4):
.
‘‘Some functions may provide the error number in a variable accessed through the symbol errno. The symbol errno is defined by including the header , as specified by the ISO C standard ... For each thread of a process, the value of errno shall not be affected by function calls or assignments to errno by other threads.’’
.
In addition, all POSIX.1c functions avoid using errno and, instead, return the error number directly as the function return value, with a return value of zero indicating that no error was detected. This strategy is, in fact, being followed on a POSIX-wide basis for all new functions.
Отдельно хочу обратить внимание на последний параграф. Я бы сказал, обычный просчет архитектуры API. Об ошибках этого рода как-то не принято вспоминать и говорить? Хотя очень помогло бы в виде пост-мортемов для разбора "полетов".
Secret Blizzard is facilitated by an AiTM position at the ISP/Telco level inside Russia, in which the actor redirects target devices by putting them behind a captive portal. Captive portals are legitimate web pages designed to manage network access, such as those encountered when connecting to the internet at a hotel or airport. Once behind a captive portal, the Windows Test Connectivity Status Indicator is initiated—a legitimate service that determines whether a device has internet access by sending an HTTP GET request to hxxp://www.msftconnecttest[.]com/redirect which should direct to msn[.]com.
Какие-нибудь пруфы будут, что именно со стороны ISP, а не вклинился кто-то на полпути? Нет.
То есть эту старую дырень с captive portals Microsoft никак прикрывать не собирается. Ибо это не менее, чем социнженерия. Искоренить не удастся, но поработать в этом направлении было бы можно. А всё что они предлагают, это посмотреть логи через свой IDS (а дальше сосать лапу):
Microsoft Defender XDR customers can run the following query to find related activity in their networks:
По поводу внедрения сертификата в Firefox (у него свое хранилище) у меня один вопрос: нынешние антивирусы (не в конкретном случае, а вообще) как-то вот такой доступ к браузерам активно предотвращают? Браузеры сколько угодно могут внутри себя защищаться, но внешние модификации явно за пределами их ответственности.
Microsoft считает эту атаку первой известной, когда шпионаж ведётся на уровне интернет-провайдеров.
Эх если бы. Если бы эти контроллеры LED могли бы у себя в NVRAM прописывать настройки, а не грузиться в дефолт. Короче говоря, у меня из-за софта асусовского, который не работал и не переустанавливался, произошла неприятная история.
И ААА бренды ... ставили ... стабильные чипы, которые заводились сразу из базового набора дров
Увидел недавно тему, в которой человек имел проблемы с чипом, управляющим сенсорами и т.п., что драйвера под Linux нормального нет, а тот что в ядре давно никем не обновлялся и не работает с его материнкой. И мать не такая уж старая. Я думал это в прошлом осталось, ан нет.
А можно наоборот?
Посмотрите на
Не, конечно, если вдаваться в подробности, то и поисковый запрос тоже мусор. Но не верен вообще изначальный посыл, что можно найти нормальный ресурс/статью, где будет не поверхостное "покупайте в ближайшем магазине электроники новый
телевизорvpn!", а более-менее толковый разбор. Уровня повыше "пообещали то, пообещали сё. берите" или пары прогнанных тестов скорости. И это вдобавок разбавляется как раз SEO-оптимизированным спамом, что даже если бы качественные статьи в блогах, посты на форумах и были, то их бы смыло волной шлака. А умение тестить + писать технические статьи - далеко не то же, что и оптимизировать как текст, так и дизайн сайта под SEO.Собственно мне известен один случай, когда западная VPN компания сайт с "обзорами" и содержала. Рабсиле, который нанялся копирайтером, потом ушел и об этом рассказал как минимум заслали cease&desist с одновременной подчисткой хвостов публикации.
Что касается "ну не виноват поисковик" - отчасти действительно так. Если "прежний интернет" действительно наполнялся от форумов до любительских блогов, коих на заре было несчетное количество и любых направлений (это же World Wide Web, рассказать всему миру!), то сейчас всё это осело в лучшем случае в соцсетях, а в худшем вообще цельносвязные тексты перестали писать. А пересказы содранные со старого а ля копирайтинг в Рунете или Дзене, в 2010 гг. ЖЖ - это как раз тот мусор и есть.
fixed.
Не наоборот ли, "непопулярные"?
Второе, так и не въехал в условия задачи. Судя по финальному шагу: разве на эти условия SAT solver натравить не получится? Была когда-то статья на Хабре про алгоритмически-логическое решение судоку.
PS: Картинки - это хорошо, многие пренебрегают их использованием, чтобы ясно донести суть мышления. Но чем их верстать в paint, лучше взять draw.io или вообще голый SVG. И отдельно подумать о незрячих пользователях.
Потому что https://drewdevault.com/2025/03/17/2025-03-17-Stop-externalizing-your-costs-on-me.html
Мало того, что много трафика и сразу денег стоит. Так эти пауки еще много чего клали на robots.txt, rate-limiting, и даже по вычислениям могут (и делают) ронять сервера.
Идея не оригинальная у Cloudflare, чел какой-то опубликовал этот концепт на news.ycombinator.com. По аналогии с SSH tarpit.
Забавно, что Valve в их Community Market так и делает. "Туда не ходи, ты сюда ходи" и где-то в ответах страницы с предметом (где график цен) добавлена ссылка на JSON API. Собственно... как я об этом и узнал.
Спасибо, интересно!
AVX2, AVX512 быстрее sha инструкций процессора?
AMD не вводила "тормоз" при исполнении AVX. Процессор ориентируется лишь на технические метрики: температура, ограничение по питанию и энергопотреблению. Ноутбучным (не знаю что за мини-ПК такой) процессорам явно не хватает ватт по "TDP". У меня такой же проц, при многопотоке не такой рьяной по частоте, как в простое и малопоточных нагрузках. А управление частотой пришлось настраивать из-за шума в стандартной конфигурации.
Стоит упомянуть: компании, у кого нет вознаграждения за уязвимости (условно-бесплатная случайная рабочая сила) будут потом отплачивать репутационно, операционно, финансово, а потом в случае факапа (Аэрофлот) еще и деньги по сусекам искать (из других бюджетов), чтобы оплатить авральный проект по обезопащиванию.
По-русски: явный бардак.
Признавайтесь, кто остался жевать кактус и как он на вкус?
Статья, хоть и хорошо написана, но (честно) дочитывать не стал. Тем что сначала идут неправильные варианты, слишком много внимания они на себя берут... а лишь затем следуют правильные фразы. Так можно наоборот выучить. Лучше не буду рисковать.
Согласен.
Видимо, решили не наступать дважды на те же грабли однозначного значения символа в стандарте?
Торвальдс категоричен, не отнять. Подумалось, может это такой вариант rage-bait'а двадцатилетней давности? Понятно, что это мягко говоря... кхм, "особенности" характера, но может она его и возвела в культовый статус?
С наводкой именно на pthreads теперь и докопался окончательно:
Отдельно хочу обратить внимание на последний параграф. Я бы сказал, обычный просчет архитектуры API. Об ошибках этого рода как-то не принято вспоминать и говорить? Хотя очень помогло бы в виде пост-мортемов для разбора "полетов".
Из того, что errno стало макросом, следует, что его можно переопределить и сделать thread-local. Как иначе?
Какие-нибудь пруфы будут, что именно со стороны ISP, а не вклинился кто-то на полпути? Нет.
То есть эту старую дырень с captive portals Microsoft никак прикрывать не собирается. Ибо это не менее, чем социнженерия. Искоренить не удастся, но поработать в этом направлении было бы можно. А всё что они предлагают, это посмотреть логи через свой IDS
(а дальше сосать лапу):По поводу внедрения сертификата в Firefox (у него свое хранилище) у меня один вопрос: нынешние антивирусы (не в конкретном случае, а вообще) как-то вот такой доступ к браузерам активно предотвращают? Браузеры сколько угодно могут внутри себя защищаться, но внешние модификации явно за пределами их ответственности.
Пусть (неправильно) считают. Для меня врезка lawful interception -- одного поля ягода. Зафиксирован перехват шифрованного трафика jabber.ru и xmpp.ru
В чем проблема завернуть на свой адрес?
+1, тем более на фоне моральной полиции в виде религии.
Эх если бы. Если бы эти контроллеры LED могли бы у себя в NVRAM прописывать настройки, а не грузиться в дефолт. Короче говоря, у меня из-за софта асусовского, который не работал и не переустанавливался, произошла неприятная история.
Увидел недавно тему, в которой человек имел проблемы с чипом, управляющим сенсорами и т.п., что драйвера под Linux нормального нет, а тот что в ядре давно никем не обновлялся и не работает с его материнкой. И мать не такая уж старая. Я думал это в прошлом осталось, ан нет.