denis-1913 янв 2025 в 13:07

Загрузка одного и того же файла 102+ раз в браузерах Edge/Chrome и Firefox приводит к разным результатам

2 мин

53K

БраузерыСофтFirefoxGoogle ChromeMicrosoft Edge

+30

140

Комментарии 140

ajijiadduh 13 янв 2025 в 13:13

и что?

exTvr 13 янв 2025 в 14:38

И всё.

boorrdenis 13 янв 2025 в 14:38

Ну да!

Vest 13 янв 2025 в 18:46

И статья готова!

YaMishar 14 янв 2025 в 20:18

Ой всё

Margutoop 13 янв 2025 в 13:14

Кому вообще может понадобиться скачивать один и тот же файл 100+ раз

tester12 13 янв 2025 в 13:18

Ну а вдруг js-код на сайте зациклится и начнёт качать один и тот же файл...

CherryPah 13 янв 2025 в 13:20

Алло, это Балабановская спичечная фабрика? (с)

overslepter 15 янв 2025 в 05:24

Кстати да, раньше переполнение было на 100 загрузках.

d-stream 13 янв 2025 в 13:20

Например манагер скачивает отчёт по остаткам на складе раза 3-4 в день... И он чудесно называется report.zip)

AVikont 13 янв 2025 в 20:16

Это будут разные файлы с одинаковым названием.

GiveMeFreeNickName 14 янв 2025 в 01:54

Нет, не может быть два файла с одинаковым расширением и названием в одном месте

mayorovp 14 янв 2025 в 03:58

Так пост как раз про файлы с одинаковым названием.

SadOcean 14 янв 2025 в 19:42

Именно так, и этот файл попытается сохраниться в папку сохранения под одним именем и вызовет ровно описанное в статье поведение.

Armitage1986 13 янв 2025 в 13:20

Один и тот же может и мало кому, а вот скачивание каждый день файла с одним и тем же именем - довольно частый кейс.

Регулярно встречал у бухгалтеров в папке "Загрузки" длинный список банковских выгрузок kl_to_1c(XX).txt.

inkelyad 13 янв 2025 в 13:27

Один и тот же может и мало кому, а вот скачивание каждый день файла с одним и тем же именем - довольно частый кейс.

Или не каждый день, но из одного места. Это настолько частый случай, что непонятно, почему браузеры не стали раскладывать скачанное по папкам-датам, как многий софт для сканирования документов делает. (Или я отстал от жизни и где-то галочка есть?)

Armitage1986 13 янв 2025 в 13:35

Мне кажется, такое поведение сильно не всегда будет удобно.

Например, открыв папку загрузок в проводнике практичнее видеть сразу имена/тип/превью/иконки файлов, нежели ничего не говорящие папки с датами. Даже если в имени папки помимо даты будет адрес сайта-источника, все равно попробуй еще вспомнить через месяц, откуда и когда именно ты качал понадобившийся тебе файл.

Astroscope 13 янв 2025 в 14:40

Мне кажется, такое поведение сильно не всегда будет удобно.

Тот случай, когда хорошо бы, чтобы возможность была предусмотрена в принципе, но была настраиваемой. Например, я бы, наверное, предпочел чтобы у меня каждый раз спрашивали - перезаписать, переименовать и оставить здесь же, или рассортировать по подпапкам по дате загрузки. Разумеется с возможностью выбрать любое из действий по умолчанию.

папки с датами

Можно предположить, что кто-то из разработчиков браузера догадается именовать папки по названию файла плюс дата, а не только дата. Тут, правда, очередная засада, потому что если папки сортируются по алфавиту, то только YYYY-MM-DD даст адекватную сортировку вместо довольно распространенного DD-MM-YYYY, а некоторые страны любят MM-DD-YYYY, и в этом есть своя логика, которая тоже не поддается обычной алфавитной сортировке, ведь имя папки это только текст.

vis_inet 13 янв 2025 в 19:22

а некоторые страны любят MM-DD-YYYY,

А почему, кстати, у них так?

aborouhin 13 янв 2025 в 20:13

Ну когда дата произносится как January 13th, 2025, - то записывать её тоже интуитивно понятно как 01-13-2025.

Player17 14 янв 2025 в 22:54

О! Спасибо. Стало понятно. Теперь так и буду такие даты читать.

nidalee 13 янв 2025 в 22:27

Сортировка файлов по имени становится осмысленной, например. Если сначала идет месяц, а не день.

aborouhin 13 янв 2025 в 22:51

Это осмыслено, когда год впереди месяца, а если год по-прежнему в конце, то сортировке это не особо помогает. У меня стандарт наименования документов в личном архиве - "YYYY MM DD Name", вот тут сортировка действительно удобна - можно смотреть хронологию именно по датам документов, а не датам файлов, которые иногда совершенно случайны.

nidalee 14 янв 2025 в 10:07

У меня в личном архиве в целом нет нужды сортировать по годам, потому что это такой объемный временной промежуток, что проще использовать подпапки. А вот месяц\день - актуально.

freeExec 14 янв 2025 в 05:07

Тогда год надо ставить в начало

Astroscope 13 янв 2025 в 23:59

А почему, кстати, у них так?

Насколько я знаю, это из глубоко доэлектронной эпохи, когда записи о чем угодно, да хоть бухгалтерские, велись в бумажных таблицах. На новый год часто начинался новый журнал - текущие записи велись в текущем году, а архивные искались в журналах за известный год, поэтому обозначение года было маловажным и попадало в самый дальний элемент даты, а то и вовсе пропускалось. Год же делился на месяцы, а месяцы на дни - типичный многоуровневый список, причем поскольку месяц был и остается отчетным периодом сам по себе или вложенным в год, то месяц, как более важная характеристика даты, оказывается в начале, а день, как подхарактеристика месяца, идет после месяца. Год, как мы выяснили, маловажен и, если вообще указывается, то указывается лишь в самом конце. За точность объяснения не поручусь, но логика совершенно очевидно просматривается.

Quarc 14 янв 2025 в 02:25

Можно проще, в английском дата так и произносится "месяц день год", также как и в русском "день месяц год" (что, кстати, в детстве выносило мне мозг, почему русские произносят дату наоборот 😅).

AVikont 15 янв 2025 в 16:50

Очень похоже на формат времени: час, минута, период. От важного к уточняющему.
Пример: 12:15 P.M.

Wesha 15 янв 2025 в 18:42

От важного к уточняющему.

И тут же нарушили:

Пример: 12:15 P.M.

PM — это [которая] половина суток. Получается "час минута полсуток", тогда как "от важного к уточняющему" было бы "полсуток час минута"

А какая отсюда мораль? Используйте 24-часовое время, и будет вам ЩАСТЬЕ!

AVikont 15 янв 2025 в 20:04

Полусутки (как и год в дате) чаще всего понятны из контекста. Если требуется уточнить, то добавляют.

Используйте 24-часовое время , и будет вам ЩАСТЬЕ!

В IT чаще всего используют 64 или 128 битный формат представления времени, там ЩАСТЬЕ.
А у людей в бытовой речи привычнее слышать "встретимся за ужином в 8" (или уточнят "в 8 вечера") даже на русском. В англоязычной среде 8 P.M. От важного к уточняющему.

Astroscope 16 янв 2025 в 11:09

PM — это [которая] половина суток.

Ну так это лишь уточнение того, что зачастую и так очевидно из контекста.

Wesha 16 янв 2025 в 15:55

Контекст Вы тоже в базу данных записывать планируете?

Или вот Вы никогда не просыпались ~~после вчерашнего~~ в 6-7-8-9-10 часов (по часам) и в пасмурную погоду, и долго тупили, не понимая, утро сейчас или вечер?

Astroscope 16 янв 2025 в 17:55

Вы пропустили слово "зачастую" в моем комментарии.

Wesha 17 янв 2025 в 09:33

Я так понимаю, парашют, который зачастую раскрывается, Вас тоже удовлетворит?

Astroscope 17 янв 2025 в 11:41

Статистически да. Лично для себя - не знаю, не пробовал, не имею мнения.

Wesha 17 янв 2025 в 17:36

Статистически да.

Раз уж Вы начали упоминать всуе серъёзных ~~дядей~~ терминов, Вам придётся идти до конца и уточнить, что, в Вашем понимании, означает слово «зачастую». В числах.

Astroscope 17 янв 2025 в 21:09

В числах.

Более пятидесяти процентов, но менее ста процентов.

Wesha 17 янв 2025 в 21:39

Более пятидесяти процентов, но менее ста процентов.

Ну то есть парашют, который раскрывается зачастую (в Ваших же терминах, я Вас за язык не тянул), Вас удовлетворит.

Astroscope 17 янв 2025 в 23:25

Если пользователь парашюта - вы, то безусловно да, удовлетворит. Я же не желаю вам несчастного случая или каких-то неприятностей, а если с вашим парашютом - который вы зачем-то привнесли в эту ветку комментариев, что-то пойдет не совсем так, как обычно предполагается при прыжках с парашютом, то вы вполне можете его сбросить и использовать запасной. Обычно так и делают - используют запасной парашют при невозможности использовать основной.

Wesha 17 янв 2025 в 23:30

Если пользователь парашюта - вы, то безусловно да, удовлетворит.

Dogfooding? Не слышали!

использовать запасной.

А у него шансы такие же!

(Конечно, 75% немножко лучше, чем 50%...)

Astroscope 17 янв 2025 в 23:42

Разные источники дают разные цифры вероятности нераскрытия парашюта, но даже наиболее пессиместичные говорят о цифрах порядка 0.1% отказов или 99.9% успеха работы основного парашюта. Но, поскольку я не желаю вам несчастного случая, то меня вполне удовлетворяет даже такой пессиместичный сценарий, в котором с вероятностью один к тысяче вам понадобится запасной парашют. А заодно и в предложенные мною в ответ на ваш запрос границы надежно помещаемся - больше 50% и меньше 100%.

Wesha 18 янв 2025 в 23:32

Но ведь в те же границы поместится и парашют с вероятностью 50,00000001%!

Astroscope 19 янв 2025 в 13:56

Но ведь в те же границы поместится и парашют с вероятностью 50,00000001%!

Товарищ ИИ, у вас проблемы с удержанием контекста. Напомню, что ваш (субъективно абсурдный, но все же формально приемлемый) тезис был таким:

Или вот Вы никогда не просыпались ~~после вчерашнего~~ в 6-7-8-9-10 часов (по часам) и в пасмурную погоду, и долго тупили, не понимая, утро сейчас или вечер?

Личный ли это ваш опыт, фантазии ли о бесцельно потраченном времени в молодости, которое уже не вернуть - неважно. Важно, что вы приводите пример редкого случая, когда одновременно и независимо кто-то не может понять, сейчас столько-то часов до полудня или столько же в цифрах часов после полудня, причем внешних, дополнительных критериев для уточнения не существует в том смысле, что они категорически недоступны. Поскольку тезис, как принято сейчас говорить в этих ваших интернетах, "не зашел", вы не нашли ничего более тонкого, как попробовать формализовать качественный, описательный термин, который не имеет поддающихся точной формализации границ, но имеет границы лишь приемлемые.

Раз уж Вы начали упоминать всуе серъёзных ~~дядей~~ терминов, Вам придётся идти до конца и уточнить, что, в Вашем понимании, означает слово «зачастую». В числах.

Вот, вот оно. Ваше требование формализовать в абсолютных числах качественный, а не количественный термин, абсурдно. Но, поскольку я исхожу из добросовестных предположений, что вы недостаточно свободно владеете языком, на котором ведется диалог, а также не в состоянии отыскать, включая доступные без регистрации и SMS толковые словари, я привожу вам примерное значение термина "зачастую", выраженное как вы просите - в цифрах. Дальше у вас случается когнитивное несварение и рождается известный...

... очень глупый и совершенно детский анекдот

Вагон общественного транспорта. Нетрезвый мужчина шатается по вагону, подходит к пассажирам не сказать, что по очереди, но как-то пытается охватить всех и каждого, громко выкрикивая в лицо один и тот же простой матюк. В основном все морщатся и с омерзением отворачиваются, а наш герой продолжает оглашать вагон все тем же одним повторяющимся матюком. Внезапно, одна из пассажирок, впрочем тоже не скрывая омерзения, спрашивает нашего глашатая: "Мужчина, вы кроме [этого матюка] еще какие-то слова знаете?". Тот зависает на время и, внезапно просияв от осознания мощи собственных ментальних сил, кричит: "Парашют!!!". - Мужчина, что парашют, - спрашивает пассажирка. [Матюк!] - гордо отвечает ей герой.

Итак, вы зачем-то приплели парашют, пытаясь доказать что? Вернемся, однако, к ~~крайнему~~ последнему вашему тезису.

Но ведь в те же границы поместится и парашют с вероятностью 50,00000001%!

Невероятным, поражающим воображением фактом является то, что чисто формально, в обусловленных вами самим рамках, вы совершенно правы! Аплодирую стоя. Нет, ну надо же - при помощи парашюта вывести доказательство того, что 50.00000001%<50.00000000%. Нобелевка по математике, уверен, ваша. Не про троллингу, нет - тут вы зачет по предмету "Троллинг первого уровня в этих ваших интернетах" провалили. Готовьтесь и приходите на пересдачу.

ImagineTables 13 янв 2025 в 15:26

Или я отстал от жизни и где-то галочка есть?

Да.

inkelyad 13 янв 2025 в 15:28

Да.

Не та галочка. Имелась в виду - 'Сохранять в каталог в соответствии с датой'

ImagineTables 13 янв 2025 в 17:00

Я вас понимаю. Поймите и вы меня: если хотите, чтобы всё было разложено по уму, надо отщёлкнуть ЭТУ галочку, и создать структуру папок, которая устроит именно вас.

Okeu 14 янв 2025 в 16:15

придется вручную выбирать, а в примере комментатор привел сканилки, которые сами создают директорию с датой, а внутрь уже кладут файлы)
Справедливости ради, я все, что качаю, лью в загрузки, а там уже сортировкой и группировкой в проводнике разруливаю)

cb_ein 13 янв 2025 в 14:58

У меня 2.5 года каждый рабочий день начинался со скачивания свежего .rdp файла для подключения к удаленке. До сих пор все до одного лежат там родненькие, глянул и правда после 100 таймстемпы пошли.

Noah1 13 янв 2025 в 16:02

Звучит утомительно, разве нельзя было хоть как-то автоматизировать/поменять процесс?

cb_ein 13 янв 2025 в 16:25

Это была удаленка клиента, который, впрочем, в какой-то момент перешел на Citrix. Файлики больше скачивать не нужно, но я все равно храню их, как память.

eximus 14 янв 2025 в 08:34

нельзя было хоть как-то автоматизировать/поменять процесс

Так когда автоматизируешь web-тестирование или тестирование api сервака, как раз и могут накапливать сотни файлов, при пробеге тестов, включая скачивание сгенерированных файлов pdf и прочих xml и xls(x).

Я, правда, подобное не встречал, у нас файлы все изначально были с названием по выборке + таймстамп с точностью до миллисекунды.

SuAlUr 13 янв 2025 в 16:09

Организация по безопасности организаций информационной безопасности?

nochkin 13 янв 2025 в 16:25

В .rdp файле нет возможности удалять его сразу после подключения как в том же Citrix, например? Всё равно ведь файл обычно одноразовый.

mayorovp 14 янв 2025 в 04:02

А с чего он одноразовый-то?

nochkin 14 янв 2025 в 04:04

Если надо каждый день новый файл тащить, то обычно это означает, что старый протух. Обычное дело. Потому и уточнил.

mayorovp 14 янв 2025 в 04:15

Но это локальная особенность, связанная, к примеру, с динамическим открытием порта. Или там вообще новая виртуалка создаётся. Или всё проще и новый файл скачивается не потому что он обновился, а потому что он мог обновиться.

Эти пляски не имеют отношения непосредственно к протоколу RDP.

nochkin 14 янв 2025 в 04:26

Так я и не говорю, что имеет отношение. Просто стало интересно зачем копить эти протухшие файлы. Вопрос был про это.

mayorovp 14 янв 2025 в 04:54

Файлы копятся не "зачем", а "почему". Потому что их никто не удаляет.

nochkin 15 янв 2025 в 04:23

Изначально я именно вопрос "почему" задавал. Именно о том, есть ли возможность удалять файл автоматически средствами rdp клиента.

Я только один вижу свой комментарий на эту тему или это просто спор ради спора?

singerfox 14 янв 2025 в 08:11

Видимо потому что доступ идёт через PAM систему, а там каждый раз генерируется временный пароль и зашивается в rdp файл.

eximus 14 янв 2025 в 08:26

У меня 2.5 года каждый рабочий день начинался со скачивания свежего .rdp файла для подключения к удаленке

Подозрительно похоже на работу в "Люксофте" в "Сити-аккаунте". Там тоже вся работа шла через подключение к удалённой машине.

usrsse2 13 янв 2025 в 13:20

Не один и тот же, а файлы с одинаковыми именами. Каждый день текущий ежедневный отчёт называется Report.zip и скачивается как Report.zip, Report (1).zip, ..., Report (100).zip, но на 102-й день формат имени неожиданно изменяется.

Germanjon 14 янв 2025 в 05:33

Одна замечательная платформа электронных торгов переименовывает все скачиваемые файлы в имя "Файл", расширение остаётся.
В рамках одного лота может быть загружен десяток различных файлов (имя одинаковое). 10 лотов и уже соточка файлов на компьютере.

usrsse2 13 янв 2025 в 13:19

Safari не сохраняет файл ещё раз, если он получился таким же, как уже имеющийся. Т. е. если скачивать один и тот же файл, то будет только один. Более того, это работает и с не самым последним файлом. Например, если есть файлы svres.xml, svres-1.xml, ..., svres-11.xml, потом скачать новый файл svres.xml, отличающийся от них, то он получит имя svres-12.xml, но если потом скачать снова тот, который был сохранён под именем svres-11.xml, то новый файл сохранён не будет, а в список загрузок добавится svres-11.xml.

Armitage1986 13 янв 2025 в 13:26

А дата у файла при этом тоже обновиться, или останется той, что была при первом скачивании?

usrsse2 13 янв 2025 в 13:56

Проверил, даты все поменялись (и создания, и изменения, и добавления).

YegorP 13 янв 2025 в 17:47

А если этот файл несколько гигов весит?

Metotron0 14 янв 2025 в 08:10

Видимо, будет хешировать несколько гигов. Возможно, он делает это ещё в процессе скачивания. Но ему нужно ещё и где-то хранить хеши уже скачанного.

YouROK 15 янв 2025 в 12:38

Мало того, во время скачивания, он не создает временный файл, а создает временную папку и там файлы. Это можно увидеть если остановить закачку и зайти в закачиваемый "файл" или в консоли посмотреть

Borelli 14 янв 2025 в 00:01

А если с разных сайтов, но с одним именем? Перезапись в данном случае может быть злом, если файлик типа Readme.txt...

pes_loxmaty 14 янв 2025 в 07:07

имхуется, что там одинаковость файла по хэшу сверяется помимо имени.

ZhetoN 13 янв 2025 в 14:32

ну, на самом деле не то чтобы бесполезная информация - недавно писал генератор пдф, там имя файла тоже присылается с бэкенда (номер заказа _ параметры _ итп.pdf), в процессе несколько дней скачивал один и тот же заказ, и в один момент открыл downloads а там не (100).pdf а фигня какая-то, в первый момент подумал что что-то сломал в генерации имени файла

P.S. но вот что из этого можно статью запилить не додумался :)

S-trace 13 янв 2025 в 14:50

Обратите внимание на то, что Firefox сохраняет дружелюбность к скриптам и классические традиции именования файлов для консольщиков (тем, что не добавляет лишних пробелов в имена файлов))

janatem 13 янв 2025 в 17:36

Но скобки всё равно всё портят.

VADemon 13 янв 2025 в 19:33

Я до сих пор уверен, что Windows намеренно использовала "Program Files" и "My Documents"/"Documents and Settings" как кнут, заставить всех сделать по уму.

Да, это правило лучше соблюдать как пользователю, чтобы не ловить багов на Юникоде или пробелах в пути. Но этим же продолжается проблема с кодовыми базами, игнорирующими эту проблему.

DrMefistO 13 янв 2025 в 20:55

Это вы ещё забыли про "длинное тире Copy" , если делать копию файла по Ctrl+C, Ctrl+V. Потом правда изменили на простой дефис.

VADemon 14 янв 2025 в 01:34

Ого, оно точно так в эксплорере? Или было? Я в интернете ничего не нашел, кроме проблем с консолью и dir /b, который их якобы автоматом конвертирует в выдаче:

Рад, что в Линуксе победил здравый смысл: UTF-8 везде.

AVX 14 янв 2025 в 13:38

utf8 в линуксе везде - так было не всегда. Сам столкнулся с моментом перехода, когда в одной версии дистрибутива была кодировка имён файлов на диске в koi8, и сколько-то лет так нормально всё было. А потом поставил новый дистрибутив - и словил кракозябры везде в именах файлов, которые были на русском. Хорошо что есть convmv. Год был где-то 2008-2009.

VADemon 14 янв 2025 в 14:47

Да, и народ теперь со старыми кодировками "обратные" баги ловит. https://github.com/yt-dlp/yt-dlp/issues/5341

markedo 14 янв 2025 в 09:22

> чтобы не ловить багов на Юникоде

Хорошая теория. Жаль только, что Windows даже в самом последнем обновлении не использует Unicode как на уровне системы, так и на уровне всех пяти вариаций терминала. Для включения юникода нужно либо тыкать команды в терминал, либо ставить глубоко спрятанную галочку в недрах "старых" настроек и молиться, что это действие не прикончит систему.

Для Microsoft в 2025 году Unicode всё ещё эксперементальная технология из будущего.

DMGarikk 14 янв 2025 в 10:12

Для Microsoft в 2025 году Unicode всё ещё эксперементальная технология из будущего.

1) Это наследие легаси и поддержка древних и не совсем древних энтепрайзных софтин, например довольно известный банковский софт работает ТОЛЬКО при английской локали в системе и только когда везде где только можно стоит английский язык, хотя сама система на чем это написано вполне себе юникод поддерживает (оракл)

2) в юниксах тоже не всё гладко с юникодом

3) юникод вызывает крайне трудноуловимые баги связанные с тем что часто в пользовательских данных встречаются "неправильно" написанные строки, например...буква Ё может быть написана десятком разных способов... начиная со стандартного 2хбайтного написания, и заканчивая самыми замысловатыми комбинациями из перестановки диакритических точек и сдвигов символов...растягивающих букву до 6-8-10-12 байт на 1 символ

я в свое время всю голову сломал в п.3 когда казалось бы 5 совершенно одинаковых по названию файла совершенно спокойно сосуществовали в файловой системе и БД совершенно чудестным образом игнорируя ограничения уникальности БД и ограничения ФС.. и это было на православном линуксе и постгри

markedo 14 янв 2025 в 10:21

1) Это наследие легаси и поддержка древних и не совсем древних энтепрайзных софтин

Отличный аргумент. А главное - применим к абсолютно любому единожды написанному ПО. Давайте тогда вообще ничего не менять -- легаси ведь!

Например довольно известный банковский софт работает ТОЛЬКО при английской локали в системе и только когда везде где только можно стоит английский язык, хотя сама система на чем это написано вполне себе юникод поддерживает (оракл)

Круто. Только в официальной версии винды для РФ по-умолчанию стоит cp1251, то есть НЕ использование юникода не только не решает названную проблему, но усугубляет её. И опять-таки, это проблема конкретной программы, а не Юникода или ОС.

2) в юниксах тоже не всё гладко с юникодом

А можно конкретнее? Не помню чтобы сталкивался с проблемами Юникода в Линуксе. Бывают проблемы отдельного софта, особенно того что с виндой взаимодействует. В самом же Линуксе (дистрибутивах) такого не встречал.

3) юникод вызывает крайне трудноуловимые баги

Хорошо, что использование прибитой гвоздями на уровне ВСЕЙ системы устаревшей на 50 лет кодировки, которая ещё и отличается в зависимости от инсталляции, не вызывает трудноуловимых багов. Не вызывает же?

я в свое время всю голову сломал в п.3 когда казалось бы 5 совершенно одинаковых по названию файла совершенно спокойно сосуществовали в файловой системе и БД совершенно чудестным образом игнорируя ограничения уникальности БД и ограничения ФС.. и это было на православном линуксе и постгри

Так, а причем тут юникод и линукс? Микроскопом можно забивать гвозди, но если он при этом сломается - это не проблема микроскопа. Если кто-то "неправильно" использует юникод и криво называет файлы - это не проблема Юникода, а проблема создателя файла.

DMGarikk 14 янв 2025 в 14:10

Отличный аргумент. А главное - применим к абсолютно любому единожды написанному ПО. Давайте тогда вообще ничего не менять -- легаси ведь!

Это очень важный аргумент, это один из очень важных факторов почему винда так популярна, у неё просто чумовая обратная совместимость софта, тут в комментах со мной спорили что это не так, но например условная 1С7 написанная под 95 винду работает в 11 версии...это как пример энтерпрайзного софта, вы много софта под линукс знаете который был написан в 99 году, скомпилен (да даже и если не скомпилен, чтобы его можно было собрать в 25 году) тогдаже и без существенных проблем запустится в 25 году?

в винде очень много таких костылей для поддержки древнего софта и энтерпрайз этим пользуется, если вы не заметили то винда всегда в первую очередь ориентирована на корпоративных юзеров, а уже потом на домашних...это прослеживается во всей её структуре

и как вы представляете себе - предложение поменять турбину на новую, софт управления который написан в 99 году потому что "в вашем *никсе ядро устарело"... а микрософт, если вы прям мажор богатый а-ля сименс и прочий оракл, в 11 версию вам личный костыль впилит (что они активно и делают, что видно по утекшим исходникам XP ) чтобы софтина из древних времен безшовно подняласб

Круто. Только в официальной версии винды для РФ по-умолчанию стоит cp1251, то есть НЕ использование юникода не только не решает названную проблему, но усугубляет её.

она решает кучу других проблем, если cp1251 поменять на utf-8 отвалится куда больше софта, чем если этого не делать

В самом же Линуксе (дистрибутивах) такого не встречал.

Это вы может не встречали в DE и обкатанных утилитках, а копнуть чуть в сторону, так сразу всплывают "файл конфига должен лежать в папке где путь из ascii символов", "сделал логин на русском языке, а его как параметр часть утилит не понимает"

Это редкие кейсы для админов локалхостов, а когда у вас парк машин десятками тысяч измеряются, начинают выползать всякие глюки опенсорсного софта..дада именно глюки опенсорсного софта...когда "мы посчитали что этим функционалом полторы калеки пользуются, по этому мы решили его не фиксить, сами пишите MR мы его через 10 лет рассмотрим"...удобно! (я реально в 2009 году писал issue в какуюто утилитку что там режимы шифрования гвоздями прибиты...меня послали со словами "ты лох, используй что дают или пиши с нуля"...дада, мы сервисная компания будем форк ОС делать потому что у нас аудит безопасности не проходит

и юникод сюдаже, до сих пор можно найти утиль который на нем споткнётся...самое явное пробелы и не-ascii символы в uri, это пофикшено только в самых ходовых утилях бизибокса, а чуть в сторону, то там рандомные грабли

Если кто-то "неправильно" использует юникод и криво называет файлы - это не проблема Юникода, а проблема создателя файла.

гениально, предлагате мне уволится когда мне каждый день условная Sony и universal присылает по паре сотен тысяч файлов с кривыми названиями, я прям к своему гендиру приду и скажу, моя система за которую я ответственнен плохо работает потому что наши партнёры кривые файлы шлют... далее что, письмо турецкому султану "мы с гендиром компании на 50 человек пишем в сони что они плохо нам генерят файлы, которые нам каждый день надо в прод выливать"...всё потому что стандарт юникода в каждой системе через свою новою попу написан

Wesha 13 янв 2025 в 15:19

Открытия, которые мы заслужили.

XIX век: если двигать магнит в катушке из провода, получится электричество
XX век: если лететь [почти] со скоростью света, время идёт иначе
XXI век: если сохранить файл 102 раза...

DrMefistO 13 янв 2025 в 20:56

Какие технологии, такие и открытия же.

Metotron0 14 янв 2025 в 08:13

В 21-м веке столько всяких открытий в генетике, астрономии, астрофизике, а вы почему-то для сравнения выбрали проходную новость с хабра.

Jijiki 13 янв 2025 в 15:44

ну там таймстамп стоит или что? они так просто никальное имя делают, наверно

я себе написал скриншотер у меня тоже при каждом новом скриншоте уникальный скриншот с уникальным именем. просто 1-2-3... нагрузно проще сразу числами более менее уникальными

если там данные одинаковые поидее не проблема. вот еще интересный вопрос, что лучше сбрасывать таймер или вести его до бесконечности?

VADemon 13 янв 2025 в 19:34

Да, похоже на YYYY-MM-DDTHHMMSS.ms

gremlin244 14 янв 2025 в 06:11

Если таймер сбрасывать то проще его вообще не вводить, сразу перезаписывать. Такое поведение по крайней мере интуитивно понятно будет, всяко лучше чем гадать на какой итерации он сбрасывается.

useribs 13 янв 2025 в 17:20

А что гадать, нужно код смотреть. Невероятно, разные программисты погромировали

Wesha 13 янв 2025 в 18:25

Я даже их имена знаю, насяльника!

unreal_undead2 14 янв 2025 в 10:43

Вот кстати не нахожу сходу эту логику. Тут есть обработка дупликатов, но про таймстампы не там ни рядом ничего нет.

gonzazoid 14 янв 2025 в 20:40

Мда, рекурсия в js конечно не самая хорошая идея. Но вообще этот код для chrome os, там в readme есть. Я думаю для десктопа код будет где то в районе chrome/browser/download лежать.

unreal_undead2 15 янв 2025 в 06:58

В комментах к оригинальной статье нашли релевантный коммит.

leremin 13 янв 2025 в 17:38

Вам смешно, а у меня реальные подобные кейсы были. Навскидку, в Strava больше 100 тренировок в день нельзя импортировать.

Wesha 13 янв 2025 в 18:26

в Strava больше 100 тренировок в день нельзя импортировать.

~~640~~ 100 тренировок в день должно хватить каждому!

Hint 13 янв 2025 в 18:37

А можно было бы провести перед написанием статьи небольшое исследование.

Во-первых, кодовая база у Chrome и Edge общая, поэтому и поведение одинаковое. А у Firefox всё свое.

Во-вторых, можно было бы откопать предысторию: https://issues.chromium.org/issues/40235521

В Chrome изначально сделали перебор только 100 файлов при сохранении. Если все 100 существуют, то появляется диалог выбора имени. Сделано для того, чтобы избежать ситуации, когда в папке очень много файлов, и сохранение очередного занимает много времени. Представьте, что в каталоге миллион файлов с такими шаблонными именами. При сохранении очередного браузеру нужно проверить в цикле существование каждого файла из этого миллиона, и только потом сохранить новый.

Потом же появились жалобы, что 101 файл не сохраняется. И программисты дописали код, чтобы после 100 проверок просто генерировалось новое уникальное имя без индекса на основе времени. В итоге, браузерный код выполняется более менее за константное время даже в худшем случае.

В Firefox же базовый цикл на 10 тысяч повторений (после чего начинается магия). Автору, к сожалению, терпения не хватило.
https://searchfox.org/mozilla-central/source/toolkit/components/downloads/DownloadPaths.sys.mjs

createNiceUniqueFile(templateFile) {
  // Work on a clone of the provided template file object.
  let curFile = templateFile.clone().QueryInterface(Ci.nsIFile);
  let [base, ext] = DownloadPaths.splitBaseNameAndExtension(curFile.leafName);
  // Try other file names, for example "base(1).txt" or "base(1).tar.gz",
  // only if the file name initially set already exists.
  for (let i = 1; i < 10000 && curFile.exists(); i++) {
    curFile.leafName = base + "(" + i + ")" + ext;
  }
  // At this point we hand off control to createUnique, which will create the
  // file with the name we chose, if it is valid. If not, createUnique will
  // attempt to modify it again, for example it will shorten very long names
  // that can't be created on some platforms, and for which a normal call to
  // nsIFile.create would result in NS_ERROR_FILE_NOT_FOUND. This can result
  // very rarely in strange names like "base(9999).tar-1.gz" or "ba-1.gz".
  curFile.createUnique(Ci.nsIFile.NORMAL_FILE_TYPE, 0o644);
  return curFile;
},

Wesha 13 янв 2025 в 19:06

Сделано для того, чтобы избежать ситуации, когда в папке очень много файлов, и сохранение очередного занимает много времени. Представьте, что в каталоге миллион файлов с такими шаблонными именами. При сохранении очередного браузеру нужно проверить в цикле существование каждого файла из этого миллиона, и только потом сохранить новый.

Прикиньте, если в каталоге миллион файлов, то в каждый файл из этого миллиона всё равно будет обходить,

только не браузер, а операционная система:

Браузер хочет записать в каталог файл test12345678 . Давайте посмотрим, что в этом каталоге сейчас есть
файл test00000000 , не проблема
файл test00000001 , не проблема
файл test00000002 , не проблема
...
файл test12345678 , не проблема
файл test12345679 , СТОПЭ, мы не можем иметь два файла с одинаковым именем в каталоге. Отвечаю браузеру: EEXIST

(Конечно, некоторые ОС хранят каталоги в виде двоичного дерева, но это как повезёт. А я ещё про фрагментацию каталога не начинал...

mayorovp 14 янв 2025 в 04:08

Давайте всё-таки исходить из того, что на системном диске используется современная файловая система, а не FAT32?

Wesha 14 янв 2025 в 04:36

современная файловая система, а не FAT32?

Вы давно флеш-карту в телефон (или фотоаппарат) вставляли?

mayorovp 14 янв 2025 в 04:51

Да, давно. На старом смартфоне она не помогала, а на новом не нужна.

Мне даже что-то интересно стало - а браузер точно начнет сохранять файлы на карту если её вставить?

Wesha 14 янв 2025 в 05:00

Ему можно указать, куда сохранять.

Chupaka 14 янв 2025 в 06:42

И если проверять каждый файл по порядку — то файловая система имя первого файла проверит как минимум миллион раз, второго — 999,999 третьего — 999,998 и т.д. Сумму посчитаете? Так что всё же лучше всего на тысячах проверок остановиться (в случае ста файлов) :)

Frankenstine 14 янв 2025 в 09:53

Прикиньте, если в каталоге миллион файлов, то в каждый файл из этого миллиона всё равно будет обходить

Нет. Для того чтобы проверить есть ли такой файл в директории, ОС должна лишь считать само оглавление директории, которое является отдельным системным файлом, но самое главное, что поиск в оглавлении делается один раз, если вы просто хотите сохранить файл под конкретно заданным именем, и 100500 раз, если вы хотите найти не занятое имя из шаблона имени. Соответственно, если вопрос стоит в том что вы задали имя и

Браузер хочет записать в каталог файл test12345678

то ОС произведёт один раз поиск test12345678 по файлу оглавления, а если браузер хочет найти незанятое имя начинающееся на test(:digit:)+, то будут перебираться все совпадения с шаблоном до тех пор пока не будет НЕ найдено совпадение.

И разумеется поиск одного имени среди миллионов гораздо быстрее, чем поиск 100500 имён, когда 100499 из них уже существуют.

Поэтому разработчики браузера и ограничили поиск сотней имён (для ФФ - 10000).

Wesha 14 янв 2025 в 20:39

ОС произведёт один раз поиск test12 345 678 по файлу оглавления

Вот только «поиск test12 345 678 по файлу оглавления» — это записанное кратенько «посмотри первое имя в файле оглавлении, если оно равно test12345678, то верни true, иначе возьми второе...» — то есть операция не атомарная.

Frankenstine 14 янв 2025 в 21:03

Даже большинство операций процессора не атомарны, ибо выполняются по несколько тактов, но какое это отношение имеет к алгоритму поиска совпадения заданного текста в файле? И ежу понятно, что чем больше файлов в директории тем дольше поиск файла в ней, и если браузеру нужно выбирать имя файла для сохранения самостоятельно, то логично что нужно ограничить перебор не сильно большим количеством вариантов, исчерпав которые нужно изменить алгоритм генерации имени на более уникальное.

useribs 13 янв 2025 в 20:29

Как картинка про стандарты. 10000 файлов должно хватить каждому )

НЛО прилетело и опубликовало эту надпись здесь

CrazyElf 14 янв 2025 в 07:12

Миллион, говорите... У меня была одна задача, по которой в каталоге могло быть порядка 10 или 20 тысяч файлов, уже точно не помню. Так вот винде очень плохело уже после этого количества файлов в одном каталоге. Чтение списка файлов из каталога начинало дико тормозить на любом уровне - из моего кода, из самой винды если окошко открыть, везде.

rabitagorgor 14 янв 2025 в 08:19

AFAIK, по умолчанию винда на NTFS при простом чтении папки у всех файлов в ней меняет Last Access Time. Поэтому на большом количество файлов может поплохеть, да.

CrazyElf 14 янв 2025 в 09:42

Не уверен, что там была NTFS, но всё может быть.

mayorovp 14 янв 2025 в 09:15

Ну, Проводник-то понятно почему тормозил - ему ж миниатюры надо для всех файлов получить. Вот почему тормозил доступ из кода - вопрос более интересный...

CrazyElf 14 янв 2025 в 09:43

Не, даже если без миниатюр, просто таблицей. Вернее, я даже просто через Far вроде каталог открывал, никаких миниатюр. )

nidalee 14 янв 2025 в 10:50

Он вроде все равно метаданные читает, чтобы понять, в каком представлении вам файлы отображать. Там же есть пресеты под видео, изображения и прочее.

mayorovp 14 янв 2025 в 20:12

Far всегда сортирует список файлов, а потому вынужден читать каталоги полностью.

Wesha 14 янв 2025 в 20:43

Скорее всего, у Вас «файл» каталога фрагментирован.

Caterpillar-KZ 14 янв 2025 в 09:16

У меня сейчас в нескольких архивных папках более чем по 50 тысяч файлов в каждой, поплохения не замечаю.

CrazyElf 14 янв 2025 в 09:44

Круто. Ну может что-то оптимизировали с тех пор. Файловая система какая на этом диске, чтобы знать, что выбирать? )

Rohan66 14 янв 2025 в 07:45

Интересно, а Винда с "Новая папка (N)" сколько может их создать?

Metotron0 14 янв 2025 в 08:19

Я смог проверить в Thunar

Скрытый текст

Rohan66 14 янв 2025 в 08:42

На 105 закончились? И ничего не предложила больше?

Metotron0 14 янв 2025 в 08:54

Я решил, что «ошибка 102» не выявлена, и прекратил эксперимент.

Rohan66 14 янв 2025 в 08:59

Это для Хрома 102.

В Firefox же базовый цикл на 10 тысяч повторений (после чего начинается магия). Автору, к сожалению, терпения не хватило.

Это из комментариев. Вот меня и заинтересовало - а у Винды есть такое ограничение?

Sau 14 янв 2025 в 09:00

А вдруг там как в Firefox, начиная с десятитысячного элемента необычное поведение?

Metotron0 14 янв 2025 в 14:35

Вообще, скриптом создаётся 9999, а дальше скачивается один файл и смотрится. Я примерно так делал.

rabitagorgor 14 янв 2025 в 08:16

Уф, ну и заголовок статьи. Я уж было подумал, что само содержимое загружаемого файла другое получается. А тут просто уникальность имени немного иначе обеспечивается.

ntu12170 14 янв 2025 в 09:25

Почему было не написать "более 102 раз", или "102 и более раз"? "102+" может означать и 102,57, например.

Metotron0 14 янв 2025 в 14:35

А ещё к 102 можно прибавить отрицательное число или даже комплексное.

Astroscope 15 янв 2025 в 12:28

Я за комплексное. Профдеформация, простите. Чтобы сразу видеть реактивность и знак. :)

Wesha 15 янв 2025 в 18:46

Я за комплексное. Профдеформация, простите.

Не «комплексное», а «сложное» (или «составное»). Профдеформация, простите. /s

Astroscope 16 янв 2025 в 11:22

Комплексные числа - обыденность любого инженера-электрика или электронщика, потому что они предоставляют удобную форму отображения процессов, происходящих в цепях переменного тока. Как вы возможно знаете, электрические цепи подчиняются т.н. закону Ома: "сопротивление не бесполезно; сопротивление это напряжение, деленное на ток". Так вот, в цепях переменного тока в это довольно нехитрое правило привносится увлекательное разнообразие способом расщепления фаз тока и напряжения, занимательный результат чего и описывается комплексными числами, как удобным в контексте математическим аппаратом, а не чем-то самоценным самим по себе.

Wesha 16 янв 2025 в 15:57

Я в курсе этого всего. Я про то, что давным‑давно, пару веков назад переводчик был покусан тогда ещё диким надмозгом и перевёл «compex number» как «комплексное число», хотя в английском оно дословно «составное число». А дальше всё заверте...

Swill 14 янв 2025 в 12:44

Эта ерунда происходит не только с одним и тем же файлом. Сейчас не вспомню кейс, но у меня сохранялись разные png в одну папку с каким-то дефолтным именем. Естественно, имя совпадало, значит шла нумерация. После какого-то шага вместо нумерации начинался таймстамп.
Мне на тот момент не мешало, а может даже и удобно было, поэтому внимания не обратил. Эффект был стойким, случалось несколько раз.

Stanislav_Z 14 янв 2025 в 22:12

У автора слишком много свободного времени. И ещё поражает, какая мелочная деталь так сильно его увлекла

DMGarikk 15 янв 2025 в 11:04

вообще зря вы думаете, мне видится что автор искал потенциальную ошибку выхода за пределы буфера из-за переполнения счетчика, и чсх нашел может и не такую ошибку но довольно странный баг

unreal_undead2 15 янв 2025 в 11:19

Всё таки не баг, а специально сделанная фича.

DMGarikk 15 янв 2025 в 12:28

ну в данном случае это уже частность, сам факт что человек там ковырялся - искал чтото другое, нашел это

Caxapok2639 15 янв 2025 в 01:58

Я проверил, если что, на мобильном хроме, на мобильном эдже, и на мобильной опере все тоже самое, на опере происходит при 142 файле, а на эдже и хроме 101 файл, если сможете найти контакт чтоб это отправить - передайте, я просто не заметил контакта чтоб это написать, а файрфокс и найтли никак не реагируют на это, даже после 300 файла

dmitric 4 фев 2025 в 12:23

Заголовок статьи воодит в заблуждение. Я подумал, что меняется содержимое файла, стало интересно, а тут всего-лишь имена.

Child-Lover 15 мар 2025 в 11:34

Same

Зарегистрируйтесь на Хабре, чтобы оставить комментарий