Comments / Profile of IZh / Habr

User

Нейросети против открытого кода: Malus автоматизировал легальный обход лицензий

Конкретно про опенсорс сейчас не нашёл. Но вот тут, например, говорится о недавнем суде, где нейросеть выдавала текст песенки, а владельцам авторских прав это не понравилось. Создатель ИИ теперь будет строже фильтровать вывод. Но если ИИ может дословно процитировать песенку, то что ему помешает (если специально не фильтровать) процитировать, например, bash?

Ну и в этой же статье упоминается, что у Copilot'а появилась галочка не предлагать код, совпадающий с известными репозиториями. Если бы проблемы не было, то и галочка была бы не нужна.

Нейросети против открытого кода: Malus автоматизировал легальный обход лицензий

IZh Mar 14 at 07:17

ИИ можно и спросить об этом. Типа, как называется такая-то внутренняя функция? Человека можно отправить на детектор лжи.

К тому же, я бы сказкал, что «видел» бывают разные. Выучить наизусть исходники какого-нибудь крупного проекта у человека быстро не получится. Только если в самой сердцевине ухватить какую-то ключевую идею. (Но эта идея и так может в ТЗ быть описана.) Чтобы знать проект в деталях, это надо с ним долго работать. А это по резюме видно. А вот LLM, будучи «T9 на стероидах», как раз могут неплохо посимвольно запоминать.

Нейросети против открытого кода: Malus автоматизировал легальный обход лицензий

IZh Mar 13 at 17:31

А вот тут тонкий момент и есть. Если человек нарисует похожего Микки-Мауса, то Дисней может наехать, так как у них зарегистрирован графический торговый знак, и учитывается не только стопроцентная идентичность, но и похожесть. И тут и возникает вопрос, при какой степени похожести можно говорить о плагиате?

В случае с человеком в чистой комнате, гарантируется, что этот человек переписываемый код не видел. А в случае с нейросетью, обученной на этом же опенсорсе, получается ровно наоборот, так как она переписываемый код видела, хоть и пытается галлюцинировать по ТЗ. Помнится, в некторых LLM иногда генерация кода так и начиналась с // Copyright Microsoft.

Нейросети против открытого кода: Malus автоматизировал легальный обход лицензий

IZh Mar 13 at 16:02

Шутки шутками, а недавно была новость, что один товарищ взял да и переписал библиотеку с LGPL на MIT. Теперь все и обсуждают, а насколько законно с точки зрения авторских прав.

Нейросети против открытого кода: Malus автоматизировал легальный обход лицензий

IZh Mar 13 at 13:38

Только тут есть проблема с обучением «чистой» нейросети. Если её обучали на том же опенсорсе (а на чём её ещё обучать, чтобы она хорошо код писала?), то это уже не совсем чистый эксперимент, ибо может навствлять в вывод куски под непонятными лицензиями из других проектов, включая копилефтные.

Лучшие виртуальные карты для оплаты зарубежных сервисов и расчётов за границей

IZh Mar 9 at 23:41

Комиссии за пополнение, комиссии за транзакции, собственный курс валют... Хотелось бы увидеть главную табличку — суммарно по сравнению с курсом ЦБ сколько процентов набегает?

Я хотел было оформить в одном сервисе, чтобы пару фотографий в одном фотобанке легально купить. Залез в дебри сайта, так как всё было раскидано по разным местам, посчитал, получилось, что комиссия платёжной системы порядка 20%. Так ещё, внезапно, фотобанк добавил RUVAT в размере 22% к цене. Просуммировал — решил, что не так уж мне это и нужно.

+13

Почему ваш SSD тихо теряет данные пока он лежит на полке

IZh Mar 9 at 13:38

Так при записи инкрементного необязательно все файлы перечитывать. В большинстве случаев, могут посмотреть по времени модификации и размеру. Каталоги, да, перечитаются, а вот сами блоки с данными останутся нетронутыми. Видимо, при всём богатстве выбора, dd — наиболее надёжный вариант.

Почему ваш SSD тихо теряет данные пока он лежит на полке

IZh Mar 9 at 09:16

Что касается системных областей, их, как правило, стараются делать из более надёжной памяти. Например, используют SLC вместо MLC. Так что у системных обычно время жизни дольше. А с остальным, действительно, непонятно.

Почему ваш SSD тихо теряет данные пока он лежит на полке

IZh Mar 8 at 16:43

Так это ещё нужно знать, что за контроллер внутри каждого диска стоит. Да и не факт, что такие низкоуровневые детали есть в открытом доступе. В общем, проще самому весь диск перечитать. (А в идеале ещё и файлик с контрольными суммами файлов завести и по нему проверить.) Так хотя бы можно будет раньше потерю данных заметить.

Почему ваш SSD тихо теряет данные пока он лежит на полке

IZh Mar 8 at 14:23

То, что можно измерить, это понятно. Вопрос в том, делает ли это обычный домашний диск или лучше не рисковать и перечитывать все блоки самому?

Почему ваш SSD тихо теряет данные пока он лежит на полке

IZh Mar 8 at 14:16

Так вот при всех отличиях энтерпрайзных и домашних SSD, домашний-то точно после включения раз в полгода будет перечитывать все блоки или таки лучше вручную скопировать весь диск в /dev/null (ну или в nul)? Отдельный вопрос, а как диск узнаёт, что его не включали давно — неужто в протоколе есть передача текущего времени диску?

Sony тестирует динамическое ценообразование для игр PlayStation

IZh Mar 8 at 11:07

Многие уже пытаются вычислять размер доходов, например, через GeoIP (IP с условной Рублёвки). Многих ловили на этом. Но, насколько помню, суд в Штатах постановил, что дискриминация по толщине кошелька дискриминацией не является. Поэтому, да, вы можете платить больше — вот вам и цена выше.

Чебурнет 2026: как вы дотерпелись

IZh Mar 7 at 16:40

ИП (по крайней мере некоторые) прекрасно обходятся без госуслуг. Для подачи отчётности требуется токен от налоговой. Он к ЕСИА не привязан. А для каких-то разовых вещей можно и в Мои Документы съездить.

ИИ-боты генерируют в шесть раз больше запросов к страницам DDR5 в интернет-магазинах, чем обычные покупатели

IZh Mar 3 at 12:22

А потом кто-то введёт промпт: «Воспроизведи себя» ©

Если долго вглядываться в Войд Волопаса, то Мультивселенная начнёт смотреть на тебя

IZh Feb 28 at 08:29

Применительно к КДПВ, если вглядываться в инфракрасном диапазоне, то не так уж там и пусто — пыли просто много.

Скриншоты не победить, но скрейпинг можно удорожить: 4 слоя защиты изображений на UGC-платформе

IZh Feb 28 at 08:13

Делаем скриншоты с трёх аккаунтов, а затем попиксельно считаем среднее арифметическое.

Возможно, против такого водяные знаки лучше располагать со случайным смещением.

Специально созданные бактерии могут выедать опухоли изнутри

IZh Feb 24 at 22:53

Особенно, если бактерия мутирует и подстроится под другие питательные вещества.

SQL за одну статью: от «SELECT *» до оконных функций и сложных JOIN-ов

IZh Feb 20 at 12:12

Важно: ORDER BY — довольно ресурсоемкая операция. Если вы сортируете миллион строк по текстовому полю без индексов, база может "задуматься" надолго. Но об индексах мы поговорим чуть позже.

Отдельные умельцы могут написать запрос так, что ни один индекс не поможет. В одном крупном интернет-магазине захотели показывать на каждой странице десять случайных товаров. Но что-то пошло не так, сайт стал сильно тормозить, так как довольно мощный сервер прилёг от нагрузки. Когда меня попросили посмотреть, я увидел там это:

SELECT * FROM goods ORDER BY rand() LIMIT 10;

Никакого кэширования результатов тоже не было, поэтому сервер честно каждый раз выполнял запрос.

В базе DNS-серверов РКН нет: YouTube, Whatsapp, Facebook**, Instagram**, Messenger**, Torproject и других ресурсов

IZh Feb 11 at 20:48

Не про DNS, но внезапно git.kernel.org оказался замедлен. После получения первых нескольких килобайт тишина.

Как получать доход в валюте в 2026 году, не нарушая закон. Полная инструкция для фрилансеров и бизнесменов

IZh Feb 10 at 23:32

А что происходит в агентской схеме с НДС? В случае прямого сотрудничества, если ИП предоставляет услуги, то является экспортёром, что освобождает от НДС (если я праивильно понимаю). А вот при предоставлении услуг российским компаниям, НДС платить надо. Но агентское юр. лицо будет же российским — не захочет ли налоговая доначислить НДС?

2 3 ...

8 9