Комментарии / Профиль qw1 / Хабр

Пользователь

ПрофильСтатьи3ПостыНовостиКомментарии19K

Как создатель ZIP, Фил Катц победил в войне форматов, но проиграл в собственной

HA - предок LLM-ок. Строил статистическую модель текста и на основе предыдущего фрагмента пробовал предсказать следующий символ. Разницу между прогнозом и фактом писал в output. Чем точнее прогноз, тем сильнее сжатие.

Новое письмо от руководства Google: ИИ должен быть в работе повсюду

qw1 24 авг в 06:51

Техническими мерами, без юридической поддержки, заблочить довольно трудно. Тот же Гугл может собирать всё одним ботом, и технически невозможно отличить индексацию от обучения. А то и вовсе, пользуясь своим браузером, собирать данные с IP-адресов пользователей, от их имени, передавая контент на сервера якобы для работы "персонального ИИ-помощника".

А юридические запреты обучения будут натыкаться на лобби "всё пропало, Китай нас обгоняет".

Новое письмо от руководства Google: ИИ должен быть в работе повсюду

qw1 23 авг в 19:37

Не зарегулируют, пока есть страшилка в виде Китая. "Вот вы у нас всё зарегулируете, и так вы сами отдадите первенство в ИИ тем, кто не зарегулировал".

Новое письмо от руководства Google: ИИ должен быть в работе повсюду

qw1 23 авг в 14:29

Любой нормальный сайт скоро им запретит себя парсить. Нафиг это ему надо?

Сборщики данных роют подкоп с другой стороны. Они предоставляют своим пользователям "ИИ-помощника", как то "бразуер с ИИ", или вообще кардинальный вариант "Windows Recall". Тут не бот целенаправленно "парсит сайт", а пользователь сам ходит по страницам, а "помощник" это всё себе записывает. Попробуйте запретить такой "парсинг".

Новое письмо от руководства Google: ИИ должен быть в работе повсюду

qw1 23 авг в 14:18

Большие ребята в таких публичных вопросах примерно никогда не врут

Зачем им врать, если они могут отмалчиваться, потому что не обязаны отвечать на вопросы.

Например, LLM-ки обучены на данных Reddit. И что дальше? Reddit не имеет права это запретить, потому что это UGC, а не его личный контент.

Reddit может в принципе заблочить ботов, но тогда потеряет поисковый трафик. В robots.txt нет такого правила, говорящего "индексировать можно, LLM обучать нельзя".

MZ-Executable | Исполняемые файлы и MS-DOS (переработка)

qw1 22 авг в 12:41

Неверно. В ДОСе EXEшки целиком загружались в память (точней, целиком загружались секции с кодом и данными; управляющая информация использовалась в процессе загрузки, но потом выкидывалась за ненадобностью для дальнейшей работы). Оверлеи же, если были, находились в другом файле

Размер файла определяется в MZ-заголовке 2-м и 3-м словом.
Всё, что за пределами этой черты, ОС не загружает в память, и этот остаток на жаргоне назывался "оверлеем" (там могли быть любые ресурсы, которые программа загружает по своему усмотрению).

У меня сейчас перед глазами файл TURBO.EXE (Turbo Pascal 7.0), его размер 0x628C7, размер в заголовке - 0x16060. На границе видно, что начинается "оверлей".

0000016050: 00 10 40 00 00 A0 00 B0 │ 00 B8 00 00 02 00 00 00   @    ° ё  
0000016060: 46 42 4F 56 7B ED 03 00 │ 55 89 E5 83 EC 02 80 3E  FBOV{н U‰еѓмЂ>
0000016070: C5 32 01 75 2F B8 6E 23 │ 50 31 C0 31 D2 52 50 C4  Е2u/ёn#P1А1ТRPД

Новые данные свидетельствуют о рекордном количестве досмотров устройств на границе США

qw1 22 авг в 12:11

У меня на старом телефоне разболтался USB-порт: зарядка идёт, а данные нет. Это тоже красная тряпка? Ведь "криминалистические тулзы" уже не подключишь, а глазами отсматривать эту помойку, копившуюся годы, нереально.

Demoded: разбор олдскульных демо-эффектов на примере

qw1 22 авг в 07:11

Таким образом поворот, проекция, границы закраски - вычисляются только для одного кубика, остальные рисуются уже на всём готовом, ну с поправкой на положение на экране. В процессе мы движемся по "логу" вперёд, поэтому все кубики вращаются, повторяя вращения "первого" с некоторым отставанием

Напомнило классический эффект
https://youtu.be/w0rFw88ex4c?t=2595
1000 спрайтов на экране, 50 fps - как это возможно на 3.5 MHz ZX-Spectrum?

Секрет в том, что есть 3 буфера, которые циклически переключаются. В каждый буфер подрисовываем очередной шарик на своей позиции, и всё, больше никакого рендеринга. А дальше - магия зацикленной анимации.

Microsoft напомнила о прекращении поддержки Windows 10 через два месяца

qw1 20 авг в 13:52

В Windows 11 много чего плохого.

Неотключаемые скругления на окнах, кнопках и т.п. Даже в XP можно было вернуть классические прямоугольники. Раздражает, что если делаешь скрин окна, автоматически захватывается грязь вокруг него в несколько пикселей.
Поломаная кастомизация панели задач. Невозможно создавать на таскбаре свои тулбары, а это было удобно, чтобы не лазить в Пуск.
Поломанные системые часы. Невозможно вывести день недели рядом с датой (ещё с 95-й винды форматную строку даты можно было сделать настройкой в реестре, в 11-й сломали). Поломанные интеграции со сторонними часами в трее, такими как T-Clock, которые могли бы теоретически закрыть эту потребность.

История RGG (Retro Game Gauntlet / Random Game Gauntlet)

qw1 20 авг в 11:20

Кажется невозможным.
На реальном железе я так и не прошёл много чего: Battletoads, R-Type.
Потом уже закрыл гештальты в эмуляторе через QuickSave.

По моим воспоминаниям, старые аркады настолько лютые, что приходилось запоминать откуда какая вражина вылезет и заранее к этому готовится. А если дошёл до места, где ещё не бывал - считай, 5 минут жить осталось, и потом всё с самого начала. Зато запомнишь, откуда выпрыгивает новый враг, который тебя грохнул.

Оператор «NOT IN» и коварный NULL

qw1 18 авг в 11:54

Как правило, у вас найдётся возможность скорректировать поведение СУБД в нужную вам сторону. ANSI NULLS в SQL Server

Это безумие, писать на каком-то своём диалекте, когда весь мир уже определился, что хочет ANSI SQL, пусть неудобный и кривой, зато везде одинаковый. Да и на проекте с историей сделать ALTER DATABASE слишком рискованно, вероятно что-то да сломается.

null-safe compare operator <=> в MySQL

Который не помогает например в ситуации из статьи - dept NOT IN (2,3) и не поддерживается ORM.

А вот скорректировать наоборот, чтобы все NULL различались, когда они равны - это сложнее.

Не надо такого. Не могу представить ситуацию, когда в

SELECT DISTINCT dept

или

SELECT ... GROUP BY dept

нужно будет получить столько разных групп c пустым dept, сколько вообще записей с dept=NULL.

Оператор «NOT IN» и коварный NULL

qw1 17 авг в 21:23

В данном случае не сильно помогает, потому что нельзя применить к задаче NOT IN (1,2)

Оператор «NOT IN» и коварный NULL

qw1 17 авг в 15:52

Можно нормализовать NULL например в (-1)

WHERE coalesce(dept,-1) NOT IN (1,2);

Не будет работать индекс на dept, если он есть, но в запросе NOT IN индекс и не должен использоваться.

Самая простая, но самая необходимая онлайн-платформа для России

qw1 17 авг в 05:29

после, когда её, вероятно, выкупит Яндекс или Mail (причём за хорошие деньги)

Скажите это "Леста Играм". Хорошо, если сами останетесь на свободе.

Лучшие аниме-игры, которые подойдут и бородатым айтишникам

qw1 14 авг в 15:47

Мне очень зашёл аниме-сериал по этой игре.

Операторы связи РФ начали тестировать доступ граждан к мобильному интернету в условиях ограничений через капчу

qw1 14 авг в 14:49

Вопрос: что это за "вовлечение владельцев сервисов"? Каких сервисов?

Всё логично. Если какой-нибудь Рамблер захочет подсосаться к белым спискам, то IP-диапазоны его серверов ведомство откуда возьмёт? Должен сам предоставлять, и согласовывать изменения не позднее чем за месяц до их вступления в силу.

qw1 14 авг в 14:39

Белые списки как раз понятно, капча то зачем?

Это подводочка под MITM и гос. сертификат.

Когда не было повального SSL, провайдеры баловались заглушками типа: заходишь на сайт 4pda.ru, а вместо этого "не забудьте оплатить интернет до 1-го числа, а ещё у нас есть новые тарифы и услуги".

Сейчас видимо захотят, чтобы при входе на любой сайт юзер сначала решил гос. капчу, а для этого на устройство надо поставить гос. сертификат. Ну а что, "нет ножек - нет конфетки" (нет серта - нет интернета).

-1

В Delphi появился тернарный оператор

qw1 14 авг в 14:19

Тут хотя бы чётко просматривается условие между if и then
А когда каша ключевых слов в арифметическим выражении, мне такое не нравится.

Гностический взгляд на трансгуманизм и квантовый исход

qw1 14 авг в 11:08

Мне тоже второе мнение ближе. Но в эволюционной борьбе мы обречены вымереть, как динозавры. Потому что сторонники подхода ~~~"крякает как утка - значит, утка"~~~ "разговаривает как Джек - значит, Джек" не будут стесняться пользоваться телепортами, которые уничтожают источник, синтезируя копию на другой стороне, не будут стесняться делать свои бекапы и копироваться на другие тела, как-нибудь договорятся между своими копиями о владении собственностью. Когда как сторонники первого будут бояться "ну это же уже не я" и так и помрут от естественных причин (технология, скорее всего, быстрее созреет для первого подхода, чем для второго)

А дальше, за несколько поколений вторых, всё станет настолько привычно, что никто и не будет задаваться вопросами "а что если это не я".

В Delphi появился тернарный оператор

qw1 14 авг в 10:44

По вашей логике, надо запретить функции выбора, такие как min(x,y), max(x,y), sign(a), abs(a).
А то вдруг надо будет не просто выбрать одно из двух, а ещё что-то сделать, например, залогировать выбор. Тогда придётся этот кусок переписывать. Тернарный оператор уместно использовать, если ветвление затрагивает только 1 значение, и нет подходящей встроенной функции. Например, проверка флага и конвертация в bool или string:
print( (x & 4) != 0 ? "флаг включен" : "флаг выключен" );

1 2 ...

6 7

9 10 ...

932 933