Comments 279
Почему «мёби-»? Откуда вы там букву Ё взяли?
Мёгабайт Мёбиуса.
Я, на всякий, решил погуглить, а почему "Мёбиус" через ё. И, всё верно, это немецкая фамилия, и такое написание созраняет оригинальное звучание. Несмотрч на то, что в ангийском это читается как "Мобиус", он был "Мёбиусом". А вот с мёбибайтом...
Ну для порядка надо отметить, что среднерусское "ё" и немецкое "ö" – всё же разные звуки. Так что тут в конечном итоге дело вкуса, какой буквой передавать. Хотя в поморском диалекте "ё" скорее означает "ö".
"ё" это два звука ([jo]), а "ö" один. Или, как в данном случае, "ё" означает смягчение предыдущей согласной и потом [о].
Всё верно (для нормативного русского). Поэтому вопрос о передаче "Mö" с помощью "Мё" – дело вкуса.
Никакого дела вкуса тут нет, правильно передавать через "ё". А "е" закрепилось, потому что "ё" часто пишут без точек и в итоге люди, незнакомые с настоящим звучанием фамилии читают "Мебиус", "Рентген", "Геринг" и такой вариант закрепляется. С распространенными именами такого не происходит, Кельну и Гете повезло.
Прочтя через русское ё, вы не приближаетесь к настоящему звучанию.
Не приближаюсь с какой точки? Мёбиус однозначно более похоже на Möbius, чем Мебиус.
А так, разговор о "настоящем звучании" слов в одного языка в другом языке вообще не имеет смысла.
Ну, например, е и ö – гласные переднего ряда, а (й)о – заднего. Все разговоры о похожести звуков очень субъективны. Китайцы вот считают русские "р" и "л" неразличимыми до степени смешения.
Не знаю, что говорят немцы о похожести ö на е или ё, но подозреваю, что это зависит в числе прочего от региональных особенностей.
Не совсем понятно - "Мё" никогда в русском не читается как "Мйо", если я хочу написать такое звучание, то это будет в зависимости от требуемой мягкости или "Мьё" (аналогично "Мьянма"), или "Мъё" (как в "Мъёльнир").
В чем проблема-то?
Проблемы нет, но просто Мё и Mö – фонетически разные слоги, также как Ме и Mö.
В каких-нибудь языках, несомненно, гласные ё и ö должны присутствовать одновременно. Как в китайском iu и ü.
Вы можете наглядно описать разницу между [мё] и [mö]?
гласные ё
"ё" это буква. Такой гласной нет.
Вы можете наглядно описать разницу между [мё] и [mö]?
Зайдите на translate.google.com, введите "мё" в режиме русского языка и нажмите кнопку прослушки, потом то же самое с "mö" в режиме немецкого языка. На мой слух, они даже рядом не валялись.
"ё" это буква. Такой гласной нет.
Это вопрос терминологии. Русскую фонетику принято деконструировать до одиночных гласных, вот так и считается. Но в английском или китайском полно дифтонгов. И, чтобы уж далеко не ходить, МФА – не истина в последней инстанции в качестве системы записи звуков.
Если я назову "ё" финалью, вам будет проще?
Как можно в качестве аргумента в фонетике приводит робота? Там произносят что-то похоже на "мьо". Разве "мё" так произносится?
На мой слух, они даже рядом не валялись.
А на мой слух "мё" и "mö" практически идентичны. Так же как "кё" и "kö" в словах Кёльн и Köln.
Русскую фонетику принято деконструировать до одиночных гласных, вот так и считается.
Это понятно. Но непонятно, какой звук вы имеете в виду, говоря "гласная ё".
Но непонятно, какой звук вы имеете в виду, говоря "гласная ё"
Тот, который звучит в слове ""Мёбиус", очевидно же.
Как можно в качестве аргумента в фонетике приводит робота?
А кого надо приводить? Если б был человек, вы бы, наверное сказали, что это конкретные люди криво произносят?
Там произносят что-то похоже на "мьо". Разве "мё" так произносится?
Вообще по определению именно так и произносится. М, смягчение и о. Если только вы не живёте в Вологде или севернее и не используете поморскую фонетику, где действительно ё читается близко к ö.
Это понятно. Но непонятно, какой звук вы имеете в виду, говоря "гласная ё".
С фонетической точки зрения, слоги "Мё" и "Mö" имеют совершенно одинаковую структуру, состоящую из инициали и финали (хотя в европейских языках по ряду причин терминологически не принято их так называть). Инициаль у них, если верить МФА, совершенно одинаковая – [m]. А финалью в немецком языке является [øː] в нотации МФА, а в русском – [ʲо]. Вот я финаль [ʲо], обозначаемую на письме гласной буквой ё, и имею в виду под "гласной ё".
В немецком [m] переходит в звук переднего ряда [øː], а русском сначала смягчается, а затем переходит в звук заднего ряда [о].
Кёльн и Köln
[kʲо] и [køː]
Если вы будете произносить "ё" вместо "ö", то немцы вас, конечно, поймут, но это то, что называется жирным русским акцентом. Если же вы в Китае в аналогичном случае станете произносить iu вместо ü, то вас и не поймут.
А кого надо приводить? Если б был человек, вы бы, наверное сказали, что это конкретные люди криво произносят?
Если эти люди произносят "мёбиус" как "мьобиус", то, конечно, криво.
В немецком [m] переходит в звук переднего ряда [øː], а русском сначала смягчается, а затем переходит в звук заднего ряда [о].
И (возвращаясь к тому, с чего всё началось) это [mʲо] во-вашему как минимум так же далеко от [møː], как [mʲe]?
Я уже писал об этом выше. Чтобы рассуждать о том, что далеко, а что близко, надо задаться каким-то критерием. Субъективно близость звуков полностью обусловлена культурным и лингвистическим личным опытом. Объективно можно взять спектрометр, но я такого опыта не делал. С точки зрения механизма звукоизвлечения, [ø] и [e] обе являются гласными переднего ряда, в отличие от [o], и этим близки друг другу.
Чтобы рассуждать о том, что далеко, а что близко, надо задаться каким-то критерием.
Но ведь именно вы там выше написали, что
Прочтя через русское ё, вы не приближаетесь к настоящему звучанию.
То есть, какой-то критерий вы уже использовали.
С точки зрения механизма звукоизвлечения, [ø] и [e] обе являются гласными переднего ряда, в отличие от [o], и этим близки друг другу.
С точки зрения звукоизвлечения, звуки [ø] и [о] округленные, в отличие от [e]. И этим близки друг другу.
Если эти люди произносят "мёбиус" как "мьобиус", то, конечно, криво.
"мёбиус" буквально является в нормативном русском языке сокращённой формой записи "мьобиус".
Вроде об этом в моё время даже в школе рассказывали.
https://ya.ru/video/preview/14236779324086904109 (можно сразу на 08:10). У тётеньки стандартная московская речь, прямо вот она жирно там произносит это "пьос".
Вы не путайте, "тётенька" произносит не пьос
, а п'ос
(звук п мягкий, но паузы между п'
и о
нет). А робот от гугла произносит именно мьо
, с паузой между м'
и о
.
Это во-первых. А во-вторых, хотя в школе действительно учат что гласная "ё" произносится как 'о
, реально её произносят чуть-чуть по-другому. Ссылаться на фонетику уровня начальной школы в споре - так себе аргументация, она там намеренно упрощена по нескольким причинам:
нефиг перегружать первоклашек информацией;
носители языка и без того умеют говорить, задача школьной фонетики - не научить правильному звучанию, а разложить по полочкам уже известное.
"мёбиус" буквально является в нормативном русском языке сокращённой формой записи "мьобиус".
Неужели вы не замечаете разницу в произношении "пьо" (пьёт) и "пё" (пёс)?
Замечаю, первое произносится более раздельно, а второе более слитно. В данном случае это связано с редуцированной гласной "и" в корне слова "пьёт" (в старославянском – "пиет"). Может даже в полном МФА там и пишется какое-нибудь короткое i. Какое это отношение имеет к обсуждаемой теме?
Такое, что вы утверждаете, что "мьобиус" и "мёбиус" произностся одинаково. Хотя любой человек произнесет эти два слова по-разному (кроме некоторых иностранцев, которые "пёс" действительно произносят как "пьос").
Когда любая буква в словарном слове зачем-то заменена составляющими её звуками, то носитель языка думает, что это, наверное, сделано не просто так, и артикулирует эти звуки подчёркнуто. Поэтому, конечно, так написанные слова русский человек прочитает по-разному. Что не отменяет того факта, что они нормативно состоят из одинаковых фонем.
Но при этом чтение слов "мёбиус" и "мьобиус" одинаково в части гласного звука [o].
Когда любая буква в словарном слове зачем-то заменена составляющими её звуками, то носитель языка думает, что это, наверное, сделано не просто так, и артикулирует эти звуки подчёркнуто
Все наоборот. Написание следует за произношением, а не произношение за написанием. Мы говорим "пьёт" не потому что пишем "пьёт", а мы пишем "пьёт", потому что говорим "пьёт", а не "пёт".
Вы, мне кажется, запутались в своей аргументации. Я не спорю с тем, что "ьё" пишется и произносится не так, как "ё". Поэтому я и говорил о произношении конкретной финали в конкретных слогах.
Но ведь если
"мёбиус" буквально является в нормативном русском языке сокращённой формой записи "мьобиус".
значит они и произносятся одинаково. А вы тут же говорите, что это не так.
Произношение зависит не только от записи, но и от контекста.
И вы путаете "ьо" и "ьё".
И вы путаете "ьо" и "ьё".
Это одно и то же.
О как даже.
Не вы ли два сообщения назад написали, что "написание следует за произношением"?
Я написал, и что из этого следует? Приведите минимальную пару, где было бы различие в произношении между словами, написанными через "ьо" и через "ьё".
Странный вопрос. Ну, например, "ссаньё" и "Кутуньо". "Ьо" может быть в нормативном русском безударным, в отличие от "ьё".
Я просил минимальную пару, а не просто два любых слова. Т.е. два слова, которые отличаются только ьо/ьё и при этом произносятся по-разному.
Кутуньо, к тому же, вообще не русское слово.
Не надо пытаться делать хорошую мину при плохой игре. Ваши хотелки ничем не обоснованы.
А "ьо" вообще не может появиться в исконно русских словах, именно потому, что это "ё".
Какие мои хотелки? Минимальная пара как раз и показывает, что два конкретных звука являются разными смыслоразличительными фонемами в языке. А поскольку такой пары нет, то и "ьо"/"ьё" в русском языке абсолютно одинаковые вещи. "о" и "е" разные. "е" и "ё" разные. Даже "о" и "ё" разные (вол/вёл). А "ьо" и "ьё" – одно и то же.
А "ьо" вообще не может появиться в исконно русских словах, именно потому, что это "ё".
Только не "ё", а "ьё".
Какие, нафиг, смыслоразличительные фонемы?! Вы с китайским не перепутали? У нас алфавитно-фонетическая письменность так-то, половина слов – звукоподражание (в первую очередь иностранным словам). Какие смыслоразличительные фонемы в слове "Мёбиус"???
А "ьо" вообще не может появиться в исконно русских словах, именно потому, что это "ё".
Только не "ё", а "ьё".
Ну все учебники неправы, только вы один знаете истину.
Не знаю, что говорят немцы о похожести ö на е или ё, но подозреваю, что это зависит в числе прочего от региональных особенностей.
А я знаю. Я опросил ближайших немцев и результат однозначен: мёбиус похоже на möbius, а между мебиус и мобиус они даже затруднились выбрать, что более непохоже.
Учитывая, что, по вашим же словам, лично вы произносите русское "ё" как немецкое "ö", результат предсказуем, но не показателен.
Вы их спросите, используя произношение гугловского робота, для чистоты эксперимента.
Учитывая, что, по вашим же словам, лично вы произносите русское "ё" как немецкое "ö"
Не помню, чтобы я такое говорил.
Вы их спросите, используя произношение гугловского робота, для чистоты эксперимента.
Гугловский робот это не эксперимент, а клоунада. Потому что даже такое просто слово как "лён" он произносит примерно как "леонэ".
Я понял, что верховный авторитет в вопросах фонетики русского языка – это Вы, а мы с гугловским роботом и заслуженной учительницей русского из Москвы – клоуны и не умеем правильно произносить слог "мё". Согласиться не могу, но точка зрения понятна.
В вопросах произношения лучше не на гуглоробота, а на носителей языка ориентироваться - тот же forvo.com можно посетить ;)
Тут такое дело – в разных регионах России говорят по-разному. Так что forvo не показатель нормативности речи, а всего лишь свидельство того, что кто-то так говорит. Даже если там напротив диктора написано "Москва", то неизвестно, откуда он туда приехал и у кого учился. А даже в Москве и Санкт-Петербурге говорят по-разному, в том числе и фонетически.
На Русском Севере, например, "ё" действительно похоже на "ö".
Я сам, бывало, что-то надиктовывал на forvo, но к его использованию предложенным вами способом отношусь скептически.
На Русском Севере, например, "ё" действительно похоже на "ö".
Ч.т.д.
Я понял, что верховный авторитет в вопросах фонетики русского языка – это Вы,
Нет, конечно. Верховный авторитет — это Вы с гуглороботом.

Так вот, отсюда
Никётас
Гляди-ка, действительно работает!
Злосчастная буква. В 2008 моему сыну в российском загсе выдали свидетельство о рождении с буквой "Е" в фамилии вместо "Ё", потому что у них видите ли, "на клавиатуре нет буквы Ё". Пздц слов нет. В тот день у меня виза заканчивалась, пришлось бросить и так уехать.
У моего мужа наоборот написали Ё вместо Е в фамилии, потом он во взрослом возрасте ходил переделывал, из-за того что с родителями фамилии в доках разные и это повлияет на оформление наследства
Для было открытием, что "Наталья" и "Наталия" - разные имена. У знакомой в разных документах было записано по-разному - заставили переделывать и приводить к единому образцу.
С точки зрения документов да, как, например Софья и София. Но эта всё веселье началось с неграмотности советских паспортисток/работниц ВЛКСМ подаривших нам фамилии типа Питров, Пиваваров итд. Вот случай из жизни. Моя бабушка родилась в 1928-м году. Но когда она получила комсомольский билет, ей по ошибке написали 1927. Не переделывать же комсомольский билет ради такой мелочи? Переделали паспорт на 1927.
Обожаю комментарии на Хабре
Это часто встречается с отчествами, типа Геннадьевич/Геннадиевич. С другими отчествами тоже бывает, нужно следить.
Сына то зачем бросил?
Мог бы и не бросать сына. Тоже мне причина, в документе у него Ё не поставили.
"на клавиатуре нет буквы Ё"
Как это возможно?
Злосчастная буква
Это виноваты Микромягкие, т.к. в РФ был свой стандарт, где Ё располагалась справа от Ю. В итоге стандартном стала их нестандартная раскладка, и поэтому некоторые ленятся тянуться к ней.
как же блин такое бесит, особенно если в разном софте считают "занимаемое место" по своему.
пишут что надо 10Гб свободного места, проверяешь что есть как раз свободное в притык, а ему собака надо 10+ причем практически 11ГБ
следуший уровень это говнопровайдеры которые считают скорость и потраченые гигабайты так как им удобно
До этих всех мибибайтов было общепринято что мегабайт 2^20 байт. При этом мегабит в секунду всегда было 10^6 бит в секунду (во всех спеках на сетевое оборудование). Почему так - хз, провайдеры не при чем. Но мы обычно накидывали к тарифу процентов 10-15 чтобы поддержке не объяснять клиенту эти нюансы и что такое заголовок пакета. Но разницу между битами и байтами приходилось объяснять.
При этом мегабит в секунду всегда было 10^6 бит в секунду (во всех спеках на сетевое оборудование).
Почему так - хз, провайдеры не при чем.
Рассмотрим старый добрый Fast Ethernet (который 100 Mbps). PHY подключается к MAC c использованием MII-интерфейса.
Для скорости 100 Mbps данные толкаются нибблами (по 4 бита) с частотой 25 МГц. Вот и получается что максимум что вы можете протолкать в секунду - 4*25e6 == 100e6 бит в секунду.
То что там Fast Ethernet PHY использует кодирование 8b/10b, модуляцию MLT-3 и фактически внутри "качегарит" 125 МГц - это уже другая история.
Надо просто все в байтах мерить, они пока равны 8 битам. Но это пока.
тогда уж в октетах...
Не равны. У меня на столе вот прямо сейчас лежит проц, где байт — 32-битный (сигнальник от TMS). А то, что всегда должно быть равно 8 битам, обычно называют "октет". Собственно, поэтому во всех описаниях классических сетевых протоколов (RFC) — везде упоминаются именно октеты, а не байты. Для однозначности.
*Полушутя*
С таким байтом и в бите нельзя быть уверенным, ведь там, где байт определяют как наименьшую (?*) адресуемую единицу хранения данных, там бит определяют как
bit. unit of data storage in the execution environment large enough to hold an object that can have one of two values. It may not be possible to express the address of each individual bit of an object.
byte. addressable unit of data storage large enough to hold any member of the basic character set of the execution environment
* но там даже не сказано "наименьшую"?.. В обоих определениях размер ограничен снизу.
https://www.open-std.org/jtc1/sc22/wg14/www/docs/n3220.pdf#page=17
Бит зависит от применяемой логики. Может быть троичным например.
А вы байт и слово не путаете?
Нет, не путаю. Байт и слово по факту одинакового размера, 32 бита, и это минимально возможная адресуемая ячейка памяти. Из-за этого много неудобств, в частности, при работе со строками. Начиная с того, что они в памяти в четыре раза больше места занимают, чем могли бы, и заканчивая проблемами с написанием/использованием кросплатформенного кода. В огромном количестве написанного (и, в остальном, вполне себе кроссплатформенного) кода неявно предполагается, что CHAR_BIT всегда 8, а это не так.
А уж если на винте будет другой размер кластера... )))
Но нет. Это эффект Манделы.
Эффект Манделы, это когда многие имеют одинаковое ложное воспоминание . "Ровные" мегабайты были-существовали и те кто помнит о них имеет вполне реальные воспоминания, а не ложные. И таки по большей части во всём виноваты именно маркетологи и конформные преподаватели всяких ТСИ, изучавшие железки по памфлетам из магазинов электроники, в которых как раз использовали мега-гига в контексте винды.
Всё верно. Я например начинал учиться по профильной специальности в 1995, когда ещё спорного решения о создании новых единиц КиБ, МиБ, ГиБ ещё не было. И в КБ было ровно 1024 Б, в МБ было ровно 1024 КБ и т.д. Т.е. это не ложные воспоминания а истинные.
Вы правы в том, что 1 Кбайт это 1024 байта. Вот только называть их килобайтами это просторечие и та самая ошибка. По этой же причине в профессиональной литературе никогда не писали «килобайт», только Кбайт, К-байт, Kb и им подобные.
Вы своё имя тоже инициалами произносите?
Единственная причина такого сокращения — скорость печати и удобство чтения, тем более, в хорошей литературе обязательно обозначают расшифровку этого сокращения.
Да, с КБ так и правда можно поступить, объявив их никому не известными Ка-байтами, потому что СИшные килобайты пишутся как кБ.
Но с МБ и ГБ вы как выкручиваться будете?
Обычно килобайты (те, которые 1024 байта) записывают как KB: https://en.wikipedia.org/wiki/JEDEC_memory_standards#Unit_prefixes_for_semiconductor_storage_capacity
именно для того, чтобы отличать от тех, которые 1000 байт
Повторюсь, с МБ и ГБ как выкручиваться?
ну это на глаз...
❯ gls -l 8*.file
-rw-r--r-- 1 omaxx staff 8192 Sep 17 21:40 8K.file
-rw-r--r-- 1 omaxx staff 8388608 Sep 17 21:38 8M.file
❯ gls -lh 8*.file
-rw-r--r-- 1 omaxx staff 8.0K Sep 17 21:40 8K.file
-rw-r--r-- 1 omaxx staff 8.0M Sep 17 21:38 8M.file
❯ gls -lh --si 8*.file
-rw-r--r-- 1 omaxx staff 8.2k Sep 17 21:40 8K.file
-rw-r--r-- 1 omaxx staff 8.4M Sep 17 21:38 8M.file
МгБ, ГгБ
Скрытый текст
Мегаграммбайты, да..., а КБ это кельвин•байты
именно для того, чтобы отличать от тех, которые 1000 байт
Или из вежливости. Если читатель на самом деле не догадывается о точном значении приставки, его ждут ошибки в таких случаях:
"10.4 KB per track" - даташит на диск от пре-WD (Tandon)
"Head setting time: 15 Msec" - на диск из того диска
"768.0 Kbit/s" - пишет организация со 100-летней историей, National Association of Broadcasters.
"128 Kbps" - говорит американская ГКРЧ (FCC)
"9.6 Kbaud"
Про какую именно профессиональную литературу вы говорите? Если про изданную до 1998 года - там писали именно "килобайт", "мегабайт" именно в значении 1024 байта, 1024 килобайта. Я просто ради примера взял с полки первую попавшуюся книжку, изданную в начале 90-ых (Роберт Журден / Справочник программиста на персональном компьютере фирмы IBM) и там везде "килобайты" и "мегабайты" в описанном выше значении. Так что апеллировать к профессиональной литературе не очень уместно. В конце концов кроме стандарта IEC есть ещё и стандарт JEDEC, который начал действовать раньше, и где используются приставки "кило-", "мега-" и "гига-" и кратность 1024.
Прямо вот никогда-никогда? Мне обязательно искать для вас профессиональную литературу 80х годов, в которой вовсю употребляли килобайты, а про кибибайты никто и не слышал?
del.
Истинный, Виндоус так считал, оттуда и воспоминания
Этот "Эффект манделы" разве что в головах зумеров.
Я только в kubernates встретил обозначение MiB, Gi и не мог понять чем она отличается от MB, GB. Погугли и удивился что mb, gb это 10 числа, а MiB и Gi двоичные, потом открыл свойства папки в windows и увидел привычное обозначение mb. И понял что их MiB это теже самые мегабайты, что я знаю, и не нужно их переводить в другую систему счисления.
Скорее это.их MB это те же самые мебибайты. Т.е. это Microsoft использует неправильную терминологию, считая в мебибайтах, но называя их мегабайтами. Именно из-за этого и возникла проблема, что 1TB это далеко не 1TiB, и если бы Microsoft писала TiB, а не TB, было бы легче во всём этом разобраться
Да, это именно Microsoft всех запутала. В macOS мегабайты, но там это именно 10^6 байт. В линуксах мебибайты и означают они 2^10 байт. А вот в Windows единица везде указана мегабайт, но подразумевает именно 2^10 байт.
Как раз наоборот. Это запутанность именно при проектировании запоминающих устройств. С самого начала Microsoft имели под сокращением GB в виду основание 2 (двоичная система счисления). И надеюсь, что так останется всегда. Жаль, правда, что Мелкомягкие прогнулись под обозначением скорости памяти, когда всегда писали её частоту в мегагерцах, а теперь стали в MT/s, аргументируя это тем, что так лучше будет для конечного пользователя, а то ему непонятно, почему его память работает в двое меньшей частоте от заявленной на упаковке. Как по мне, то это изначально просто ввод в заблуждение потребителя, но теперь, с вводом приставок МЭК, это стало законным.

Отделять мух от котлет и запутывать всех и вся идея небольшой кучки людей, которые видят, что производители запоминающих устройств сами пишут, что в одном ГБ 10^9 байт в десятичной, а OC считает в двоичной.
Я когда учился, до ввода всяких приставок МЭК, при разговоре о взаимодействии с информацией в ПК всегда использовали двоичную систему счисления, а при её передачи — десятичную (шутка про то, что разговорные языки не учат, а запоминают, так и здесь, это нужно было просто запомнить). И только производители запоминающих устройств были на своей волне.
Во всех линуксах, которые я видел. КиБ, МиБ, ГиБ
Во Фре вывод всех тулов и мануалы перевели на байты Мёбиуса (KiB, MiB, GiB). Как человека увидевшего первую ЭВМ еще в 80-х это сгелка подбешивает.
Лет 20 назад не было никаких би. По моему представлению они начали выползать примерно когда размеры накопителей стали превышать гигабайт и разница между объявленным размером и фактическим стала слишком заметной.
А теперь вона оно как.
Стоит заметить что объем модулей с оперативкой в гибибайтах не считают. И система товарища Си не возражает.
Как раз таки модули с оперативкой считают, а вот ПЗУ нет.
Я не знаю, кто там что считает, но у меня в ноуте прямо сейчас при двух плашках с заявленным размером в 16GB, в сумме доступно 31487MiB, что... несколько больше, чем 2*16GB
Самая большая проблема в том, что так учат ещё в школах
Компьютер не подчиняется законам физики: глюки появляются из ниоткуда, файлы исчезают в никуда, и объем называется весом и измеряется в метрах.
Сначала какие-то биты, про бейсбол что-то, потом килограммы, потом метры, потом гектары. Странная система мер у этих айтишников.
какие-то биты, про бейсбол
Биты это сменные насадки-отвертки к шуруповерту. Килобит, то есть кило(грамм) бит, это кто в промышленных масштабах, например, гипсокартон крутит, те сразу килограммами скупают, потому что биты, в нашем примере это PH2, постепенно изнашиваются о твердые шурупы и начиная с какого-то износа перестают надежно держаться в шлице.
Не про бейсбол, а про кусь!
Никакой это не эффект Манделы. Если вы внимательно посмотрите, в CS и сегодня широко используются МБ, КБ и так далее в своем оригинальном значении. Никаких ложных воспоминаний тут нет. Тождество 1 КБ = 1024 Б сильно старше самих единиц КиБ
Писать можно как угодно. Но при этом давать расшифровку в байтах. На упаковках SSD пишут как пересчитать в байтах.
В документации на микросхемы памяти пишут кто как захочет. Там понятно как пересчитывать.
Исторически "кило-" применялось для массы и расстояния. Но в компьютерной отрасли "кило-" это контекстозависимая приставка. Поэтому всегда смотрите примечание мелким шрифтом.
сетевыми инженерами, которые считают 1 Гбит/с = 1 048 576 бит/с, в то время как у телекомщиков принято 1 000 000 бит/с
В кабеле нет смысла считать скорость в степени двойки. Там привязка к тактовой частоте, а не к шине адреса.
Дело в том что приставки кило-, мега-, и в том числе мили-, нано- это приставки из системы СИ, там все приставки десятичные. А система СИ появилась до широкого распространения компьютеров. И неправильно использовать приставки из системы СИ и придавать им другое значение. Поэтому правильнее называть кибибайт KiB, мебибайт MiB.
Поэтому правильнее называть кибибайт KiB, мебибайт MiB.
У меня киби-фобия, и меби-фобия. Поэтому буду называть килобайты и мегабайты.

Тут, кстати, неправильно. Приставка "кило" должна писаться маленькой. Kilobytes должно быть kbytes, а не Kbytes.
должно быть kbytes, а не Kbytes
В документации пишут "K", "KB", "K bytes". Все это допустимо. Все равно основная информация в memory map, с указанием адресов.
Понятно, что пишут как кому взбредет. Но приставка в СИ - к/k. А не К/K. То есть, строго говоря, K в "Kb" -- приставка не из СИ.
А при чем здесь СИ? Это отраслевая терминология и система обозначений. Она определяется другими документами, включая собственные стандарты разработчика.
Потому что там выше вы отвечаете на комментарии про СИ. Потому что "кило" это стандартизированная приставка из СИ. И потому что весь сыр-бор из-за того, что ваша "отраслевая терминология и система обозначений" не совпадает с СИ, хотя и делает вид.
И потому что весь сыр-бор из-за того, что ваша "отраслевая терминология и система обозначений" не совпадает с СИ
Почему она должна совпадать? В палате мер и весов хранится эталон байта?
хотя и делает вид.
Ничего она не делает. Терминология формировалась на основе привычных слов, а не в угоду каким-то стандартам.
Почему она должна совпадать?
Да потому что эти приставки взяты из СИ. Неужели нужно объяснять такие базовые вещи? Или по-вашему то, что для обозначения примерно тысячи байт взяли приставку "кило", в для обозначения примерно миллиона байт взяли приставку "мега" случайно так получилось?
Ничего она не делает. Терминология формировалась на основе привычных слов, а не в угоду каким-то стандартам.
У вас тут второе предложение прямо опровергает первое.
Да потому что эти приставки взяты из СИ.
Они защищены авторским правом? Или к размеру байта применяются требования метрологии?
Или по-вашему то, что для обозначения примерно тысячи байт взяли приставку "кило", в для обозначения примерно миллиона байт взяли приставку "мега" случайно так получилось?
Да, случайно. Потому что это привычный способ масштабировать. А "2 в десятой степени" оказалось близко к 1000. Поэтому "кило" подошло. Могли взять не 1024, а 256 (2 в восьмой степени), и придумать особое название для такой единицы измерения. И считать не в килобайтах, а в каких-нибудь "диабайтах".
Они защищены авторским правом?
Это, извините, такой бредячий аргумент, что даже непонятно с какой стороны подходить. Слова не защищают авторским правом. Но вы же побежите жаловаться, если на пакете молока будет написано "1литр", а внутри окажется 734мл. А слово "литр" ведь авторским правом не защищено, каждый может определять как хочет.
Да, случайно. Потому что это привычный способ масштабировать.
И опять у вас одно предложение прямо тут же опровергается следующим. Если привычный -- то как раз неслучайно. А именно потому что привычный.
Слова не защищают авторским правом.
Вот именно. Кило- взято из словаря, а не из СИ. "Килобайт" - новое слово, придуманное инженерами. Они сами определяют его значение.
Но вы же побежите жаловаться, если на пакете молока будет написано "1литр", а внутри окажется 734мл.
Для товарных групп есть параметр в байтах, который снимает все вопросы о потребительских свойствах. Емкость накопителей может быть любой, не кратной 1000 байт.
И опять у вас одно предложение прямо тут же опровергается следующим. Если привычный -- то как раз неслучайно.
Новый термин мог быть любым. Новая отрасль - новая терминология. 32 бит называется "word" тоже случайно. Могло быть так, что 16 бит назывался бы "word". А байт назывался бы "half word". Или 8 бит называли бы "word", что было бы логично.
Могло быть наоборот - 16 бит назывался бы "doublebyte", а 32 бита "quadbyte". Это вопрос случая.
"Килобайт" - новое слово, придуманное инженерами. Они сами определяют его значение.
Вот они и определеили в ISO/IEC 80000-13, что 1024 байта это кибибайт. И в разных других стандартах, что килобайт это 1000 байт.
Могло быть так, что 16 бит назывался бы "word".
не только могло, но и было. Единица "word" бывала и 16-битной, и 18-битной, и 24-битной, и 36-битной.
Вот они и определеили в ISO/IEC 80000-13, что 1024 байта это кибибайт.
Значит это действует внутри этих конкретных стандартов. Есть и другие стандарты. Еще есть собственные стандарты разработчика.
не только могло, но и было. Единица "word" бывала и 16-битной, и 18-битной, и 24-битной, и 36-битной.
Это дополнительный пример контексто-зависимой терминологии.
Они взяты из СИ, но сейчас они часть другого стандарта:
И этот стандарт предписывает сокращать kilo заглавной буквой K, если речь идет о 1024
О, ну как я там выше и написал, не зная о таком стандарте:
K в "Kb" -- приставка не из СИ.
Стандарт JEDEС относится только к оперативной памяти. К накопителям он не имеет отношения..
Стандарт JEDEС относится только к оперативной памяти. К накопителям он не имеет отношения..
Скриншот приведенный выше, из документации к микроконтроллеру. Вы заявили - Тут, кстати, неправильно. Приставка "кило" должна писаться маленькой. Kilobytes должно быть kbytes, а не Kbytes. Определитесь уже - написано неправильно, или стандарты разные.
Определитесь уже - написано неправильно, или стандарты разные.
...написал человек, который в двух соседних предложениях любит писать прямо противоположные вещи.
Перечитайте мои следующие комментарии еще раз, там все написано.
По поводу того, как инженеры определили значние "кило" возражений больше нет, я так понимаю. Ну и ладушки.
По поводу того, как инженеры определили значние "кило"
Килограмм, это 1000 грамм. "Килобайт", это 8000 бит.
Грамм это 1000 миллиграмм. Байт это 1000 миллибайт.
Думаю это достаточно наглядно, чтобы понять тупость прямой интерпретации приставки "кило-" в цифровой технике.
Пусть чиновники, далекие от практики, говорят на птичьем языке. У нас килобайт это 1024 байта. А 1000 байт это "тысяча байт". Никаких "кибибайтов" никто не употребляет.
Перечитайте мои следующие комментарии еще раз, там все написано.
Просто не пишите "это не правильно", а пишите "это не соответствует таким-то стандартам."
Пусть чиновники, далекие от практики, говорят на птичьем языке.
Дада, когда оказалось, что в стандарте написано совсем не то, что хотелось, будем говорить, что стандарт писали чиновники, а не инженеры.
У нас килобайт это 1024 байта.
Для "вас" даже название имеется.
Никаких "кибибайтов" никто не употребляет.
Хахаха. Как называется психическое расстройство, когда человек на черное говорит белое? Я вам даже привел стандарт, в котором инженеры утвердили термины кибибайт, мебибайт и тд. Еще стандарт, где прямо запрещено называть 1024 байта килобайтом.
То есть вы после десятка комментариев, когда оказалось, что инженеры, вопреки вашим знаниям, утвердили, что в одном килобайте 1000 байт, в 1024 байт это кибибайт, и никаких аргументов у вас больше нет, вернулись к самому первому моему комментарию и решили придраться к одному слову?
будем говорить, что стандарт писали чиновники, а не инженеры.
Не просто чиновники, а тупые чиновники-теоретики, далекие от практики. На практике нет никакого смысла делать единицу равной 1000 байт. 1024 и кратно ей используется постоянно. 1000 по частоте использования не отличается от 960 или 1200.
Адресное пространство кратно 1024. Зачем здесь нужна единица в 1000 ? Это даже на дисках не нужно. Пересчитайте чему кратна общая емкость.

Еще стандарт, где прямо запрещено называть 1024 байта килобайтом.
Правило действует только в рамках этого стандарта.
вернулись к самому первому моему комментарию и решили придраться к одному слову?
Не к одному слову, а к общей концепции. Вы не понимаете что стандартов много. Каждый стандарт утверждает свои правила. Если вы упоминаете какое-то правило, то указываете в рамках какого стандарта оно работает. За пределами этого конкретного стандарта, правила могут быть другими.
Правило действует только в рамках этого стандарта.
Правило действует в той сфере, где применяется стандарт.
Каждый стандарт утверждает свои правила.
Ну вот IEEE 1541 и ISO/IEC 80000 и утвердили правила, что килобайт это 1000, а 1024 это кибибайт. Вы, конечно, можете утвердить свой собственный российский ГОСТ и определить там любые приставки для внутреннего использования. Хотя постойте, ведь уже есть ГОСТ 8.417-2024, где русским по белому написано: 2^10 это киби, а 10^3 это кило.
Правило действует в той сфере, где применяется стандарт.
Стандарт применяется в некоторой сфере, а правило действует только в рамках стандарта. Если указываете на правило, то указываете строго на стандарт, а не на сферу где он применяется. И пишите не "правильно/не правильно", а "соответствует/не соответствует стандарту".
Стандарты бывают разные. Смотрите пример с JEDEC.
есть ГОСТ 8.417-2024, где русским по белому написано: 2^10 это киби, а 10^3 это кило.
Простое копирование чужого стандарта. Стандартный чиновничий подход к вопросу.
Стандарты бывают разные. Смотрите пример с JEDEC.
Судя по вашим комментарями, вы еще пару дней назад про этот стандарт и где он применяется не знали. И узнали как раз от меня.
Простое копирование чужого стандарта. Стандартный чиновничий подход к вопросу.
Даже если это так, то это не имеет значения. То вы киваете на стандарт, а потом, когда выясняется, что в стандарте написано совсем не то, что вам хочется, начинаете юлить, что этот стандарт неправильный. Типа JEDEC хороший стандарт, мне нравится, а ГОСТ плохой, потому что мне не нравится.
То вы киваете на стандарт, а потом, когда выясняется, что в стандарте написано совсем не то, что вам хочется
Вот мои тезисы, изложенные в самом начале:
"Писать можно как угодно. Но при этом давать расшифровку в байтах."
"в компьютерной отрасли "кило-" это контекстозависимая приставка. Поэтому всегда смотрите примечание мелким шрифтом."
Если мне нужно оформить документацию в соответствии со стандартом, то я указываю используемый стандарт. Если мне удобнее своя терминология, то я в документ добавляю глоссарий, с расшифровкой используемых терминов. Это нормальная практика.
Это не только к байтам относится. Если значение какого-то электрического параметра измерено не в соответствии с методикой описанной в стандарте, то добавляется комментарий, уточняющий методику измерения. Это нормальная практика.
доброго всем. а мне сразу вспомнилась история с wd, когда они на hdd стали шлёпать ёмкость в десятичной системе. вроде бы они тогда неплохо налипли на $$ по искам пользователей :)
Если ещё кто-нибудь вспомнит, то мы-таки получим настоящий эффект Манделы.
Но ведь это на самом деле было и без проблем гуглятся новости. 2006 год.
Суд был, а этого не было:
когда они на hdd стали шлёпать ёмкость в десятичной системе
Они использовали десятичные гигабайты до и продолжили использовать после (и правы с точки зрения СИ, IEC или госта), но по мировому соглашению они дальше обязались добавлять приписки типа "*1TB = 1 trillion bytes" из-за винды.
сетевыми инженерами, которые считают 1 Гбит/с = 1 048 576 бит/с, в то время как у телекомщиков принято 1 000 000 бит/с
Как раз у тех, кто работает с сетями, нет никаких заблуждений, т.к. там скорости кратны десяти: 10Mbps, 100Mbps, 1Gbps, 10Gbps
А вот в телекоме все не так просто.
Т.к. ширина полосы, необходимой для передачи телефонного разговора, 4кГц, то оцифровывать голос нужно с частотой 8кГц. При 8 битах получается полоса для первичного канала DS0 64кбит/с. Дальше каналы упаковываются в E1: 30 голосовых и 2 сигнальных. Итого 32 канала по 64 дают 2048кбит/с. И вот этот канал часто называют 2Мбит/с. Но в этом случае мегабит получается не 10^6 и не 2^20, а 2^10 * 10^3 :) Ну а проще сказать, что просто округление.
Всегда считал, что MiB это "Men in Black".
Но нет. Это эффект Манделы. На самом деле в мегабайте миллион байт. А вот 1048576 байт — это мебибайт, или 2^10 байт, обозначается МиБ или MiB.
Не, это не эффект Манделы, все эти *иби префиксы появились в нулевых. Это всё равно, что заявлять, что Ленинград, это тоже эффект Манделы. Тут многие в индустрии дольше чем существуют эти префиксы, которые, как по мне, только всё запутали. Размер микросхем памяти вон вообще часто маркируют в "словах", и длина слова в них легко может быть даже не кратной 8 битам. И никто не парится по этому поводу.
Вы распространяете заблуждения и написали статью в стиле "двухминутки ненависти" ради привлечения внимания.
Можно, конечно, поискать конспирологию в том, что это производители накопителей пролоббировали IEC
В гигабайтах тут считать выгоднее, вот маркетологи и насаждают это потребителям.
Жёсткие диски всегда использовали десятичные приставки, это прослеживается до их появления в 50-х годах.
Покупаешь жёсткий диск — на коробке написано 500 ГБ, а на самом деле там 465 ГиБ
Но на плашках RAM — «честные» гибибайты:
сколько указано, столько и получаешь, только пишут всё равно 16 GB, а не 16 GiB
То есть правила СИ&IEC соблюдаются в HDD и нарушаются в RAM, но вы пытаетесь это вывернуть так, чтобы получить больше заявленного.
Ранние ОС действительно использовали систему подсчёта данных, основанную на степенях двойки
Ранняя macOS. Windows и дальше продолжает использовать двоичные килобайты, в Linux перешли на кибибайты. Если же смотреть из современной macOS, то вы увидите жёсткий диск на 500 ГБ как жёсткий диск на 500 ГБ и всё равно недовольны.
Или всё-таки на заре компьютеров бумеры-основатели зря решили пойти против существующих стандартов
Вы не предлагаете решения для тех времён и почему-то считаете систему СИ нерушимым абсолютом, хотя у Международного бюро мер и весов нет своей армии. Правила СИ&IEC до сих пор нарушаются и у Apple (в оперативной памяти), и у производителей различных микросхем. В Android с измерением свободного места было что-то ещё более странное. Они обычно смотрят на вопрос с рекламной стороны (как "1.44 МБ" раньше), а вы не замечаете.
так скорость выглядит в 8 раз больше
А размеры аудио-/видеофайлов в 8 раз больше? Битрейт (не байтрейт) - обычная практика.
ввела терминологию — киби-, меби-, гиби-, теби- и так далее — для того, чтобы отличать одно от другого и устранить растущую путаницу среди пользователей.
Но не дала механизма, который бы позволил отличить старые контекстно-зависимые килобайты от новых точно-десятичных килобайтов. Даже если все бы одновременно перешли на новые правила, старые тексты бы не исчезли. По ссылке выше такую ошибку допустили.
И вообще вроде бы есть специальные названия для ... «ровных»
сетевыми инженерами, которые считают 1 Гбит/с = 1 048 576 бит/с
В существование этих точек зрения после перечисленного не верится.
Жёсткие диски всегда использовали десятичные приставки, это прослеживается до их появления в 50-х годах.
Все же, видимо, не все/всегда. У меня где-то на рубеже нулевых была пара дисков, емнип, на 40 и 80 гигов, которые в винде отображались честными 40 и 80 гигами, соответственно. Производителя точно уже не вспомню, но кажется, что как минимум один из них был Maxtor. Второй либо тоже той же фирмы, либо Hitachi.
Оно вполне могло быть эпизодическим маркетинговым ходом, нежели правилом, но тем не менее.
Постарайтесь вспомнить. На этикетках 40-гиговых Maxtor'ов в гугле везде есть либо количество LBA, указывающее на десятичные гигабайты*, либо сразу приписка "1 GB=1,000,000,000 Bytes".
* например, продаётся как 40 ГБ и 80 293 248 LBA * 512 bytes = 41.1 GB = 38.3 GiB.
На самсунге 2004 года написано 80.0GB и 156 368 016 LBA. По 512 байт получается 80 060 424 192.
То есть 80.06 GB = 74.56 GiB. Это норма. А надо найти найти хоть один обратный случай (и с учётом вероятного округления заявленной ёмкости вниз, а не до ближайшего).
Надо просто древнее смотреть.
https://ardent-tool.com/IBM_HD/WDA-L4x.pdf вот например 40метровый диск
39х1067х2х512=42611712 - сорок нормальных мегабайт
Переход на маркетинговые начался, если память не изменяет, где-то в районе 10гиговых дисков. И в то время я точно не помню чтобы кто-то аппелировал к принятому стандарту разделяющему десятичные и двоичные ЕИ. Везде это воспринималось ровно как обыкновенное маркетинговое надувательство.
И еще сильно-сильно позже попалась впервые информация про мифические бибайты, остающиеся мифическими примерно всюду до сих пор
Если сильно-сильно хочется, то на сайте много доков, можно попытаться проследить когда переход случился у конкретной фирмы.
Так вы смотрите, на что ссылаетесь.
На диске ёмкость нигде не указана, в названии число "42" и в магазинах его продавали как 42-меговый.
"For use also with" относится только к джамперам, у L40 другое число цилиндров. В рекламных каталогах его не найти, а в справочных каталогах он 41-меговый.
И в то время я точно не помню чтобы кто-то аппелировал к принятому стандарту разделяющему десятичные и двоичные ЕИ
...и на что отвечаете - тоже, уж извините. Я написал "это прослеживается до их появления в 50-х годах", то есть лет за 40 до стандарта IEC.
Переход на маркетинговые начался, если память не изменяет, где-то в районе 10гиговых дисков.
Изменяет. 1980-й год, ST-506, ёмкость 5.0 мегабайтов по мануалу и это десятичные мегабайты: 612 * 32 * 256 bytes = 5.01 MB = 4.78 MiB.
32 * 256 bytes
Это оказалось разгадкой для ещё пары случаев.
> Hard drives used to be sold by the powers of 2 bytes.
Indeed, the original PC/XT 306-4-17 drive contains 10,653,696 bytes, or slightly more than the 10MB [MiB] (10,485,760) it was advertised as. - HN
The ST505[*] had 512 bytes per sector, 17 sectors per track, 306 tracks, and 4 heads, or 10,653,696 bytes of usable storage, which is almost exactly the 10 real megabytes of storage it was advertised as having. - slashdot
* похоже, ошиблись в названии 5-мегового ST506, который перепутали с 10-меговым ST412.
ST-412 powered many of the first hard disk-equipped micro computers, notably the original IBM PC-XT - https://www.redhill.net.au/d/1.php
Seagate заявлял ёмкость в десятичных МБ для форматирования 32*256 (см. тот же мануал).
при форматировании диска в 17*512 его объём увеличивается на 17*512/(32*256) = 6.25%
в двоичных МБ объём выглядит на ~5% меньше
эти два фактора компенсируют друг друга и создают впечатление, что Seagate заявлял ёмкость в двоичных МБ для форматирования 17*512
256Б-сектора уходят в прошлое вместе с 8-битной эпохой, это рождает впечатление начавшегося обмана
___
Насчёт существования "чисто двоичных" дискет на slashdot правы. На HN ещё говорят про флешку на 16 двоичных МБ.
Везде это воспринималось ровно как обыкновенное маркетинговое надувательство.
То есть при советах ёмкость дисков должна была быть "честной" - в двоичных мегабайтах? Переход на "более честные" приставки в документации не может сломать совместимость, то есть в копировании этого аспекта смысла мало.

На серверных обычно писали нормальный объем 74,3GB
Вы что-то недопоняли и продолжаете DDOS-атаку на меня.
Там вверху написано "LBA 145226112".
https://www.google.com/search?q=145226112+*+512+bytes+to+GB ~74 ГБ
оно же с двоичной приставкой будет
https://www.google.com/search?q=145226112+*+512+bytes+to+GiB ~69 ГиБ
То есть гигабайты на вашем диске десятичные, а я изначально заявил, что они на всех жёстких дисках десятичные.
Вспомнить такие незначительные детали 25-летней давности будет проблематично.
Из найденного на полках антиквариата (40GB Maxtor, Samsung, 4,3GB Seagate и даже 1440MB Hitachi) - все используют гига/мега байты, поэтому, за отсутствием аргументов, не буду настаивать на своей правоте.
Но что-то же нас все же заставляло хвастаться тогда перед друзьями своими "дисками с честным объемом".
У меня тоже был 40-гиговый Maxtor с честной емкостью в 2001 году, что сильно удивило тогда, так как насчет емкости врали все. Диск не сохранился. Все "80-ки", которые нашел в закромах - обычного размера 75Г.
А я тоже верил в Ельцина-мухожука (ну, в вариант фразы, который на самом деле прозвучал в КВН или другом шоу). Как вариант: диск был с заявленной ёмкостью в 4.3 [десятичных] ГБ* как у ST34311A, но это забылось, а запомнилось только то, что он в системе отображался как 4 [двоичных] ГБ.
* или общий случай: (круглое_число x 1.07) ГБ
Note: Maxtor defines one megabyte as 10^6 or one million bytes and one gigabyte as 10^9 or one billion bytes. © 1998 Maxtor Corporation. https://www.seagate.com/staticfiles/maxtor/en_us/documentation/manuals/diamondmax_3400_manual.pdf#page=6
Maxtor defines 1 megabyte as 10^6 or 1 million bytes and 1 gigabyte as 10^9 or 1 billion bytes. Copyright © 1999 Maxtor Corporation https://www.seagate.com/staticfiles/maxtor/en_us/documentation/data_sheets/diamondmax_40_ata66_datasheet.pdf
Maxtor defines 1 megabyte as 10^6 or 1 million bytes and 1 gigabyte as 10^9 or 1 billion bytes. Copyright © 2000 Maxtor https://www.seagate.com/staticfiles/maxtor/en_us/documentation/data_sheets/dm_40vl_ultra_ata_100_datasheet.pdf
GIGABYTE (GB) – One billion bytes (one thousand megabytes). © September 19, 2001 https://www.seagate.com/staticfiles/maxtor/en_us/documentation/manuals/diamondmax_D740X_manual.pdf#page=92
Для дальнейших поисков: https://www.google.com/search?q=maxtor+site%3Aseagate.com
Вижу, Вы очень боитесь того, что Ваша стройная теория может разрушиться. Считать гигабайты люди умели и в те древние времена. Если при форматировании ОС неожиданно показывает полный, а не уменьшенный объем, это трудно не запомнить.
Вижу, Вы очень боитесь того
Эмм, мне буквально ни одного контрпримера не смогли найти, только начинают обижаться на замечания о том, что человеческая память за 25+ лет может и подвести.
И почему вы захотели поговорить об эмоциях, а не найти объяснение, как Maxtor мог иметь двоичные гигабайты, когда он делал предупреждения о десятичных гигабайтах минимум с 1997? Он поглотил Quantum'а, который такие предупреждения тоже делал.
Вопрос: кому нужно это объяснение?
Открыл переписку Тертуллиана с этим... как его... с Маркионом.
и умер Сын Божий - это совершенно достоверно, ибо нелепо; и, погребенный, воскрес - это несомненно, ибо невозможно.
Он называл противоречие уместным в контексте веры и божественного, а у нас тут факты и приземлённое. Если не пытаться разрешить противоречие, то зачем продолжать разговор?
Какое же это разрешение противоречия, если Вы начали общение с хамства и попросту обвиняете собеседников в плохой памяти, то есть переходите на личности? Если на это не указывают немедленно, значит не заметили или проглотили? Есть два свидетеля аномалии, исключения из общей практики, но диски Вам никто уже не предоставит, так что можете считать свою теорию верной.
А как вы видите более вежливый ответ о том, что я не смог найти других объяснений, покопавшись за вас в архивах и не могу остановить разговор на "верую, ибо абсурдно"?
Кажется, вы бравируете тем, что нельзя доказать отсутствие чайника на орбите (да) и тем, что оскорблённость придаёт вес вашей позиции (нет). Если вы и правда бравируете насчёт первого, то выходит, что вы против поиска правды, а это должно говорить за вас.
С точностью до Maxtor уверены только вы.
Если вы хотите отвлечься от поисков конкретного диска, давайте поговорим про ситуацию с приставками в целом. "Десятичные гигабайты HDD = враньё маркетологов" - это ошибка, потому что эта практика была и в СССР, а корнями уходит в "Думаю, что на мировом рынке мы найдем спрос для пяти компьютеров" (а на килобайтах внимание к разнице между приставками породит шутки про письмо на спичечную фабрику).
Для ясности было бы неплохо утвердить, что с байтами приставки должны быть всегда двоичные, а с битами всегда десятичные, но человечество не организовано до такой степени, чтобы это было возможно. Даже международные органы по стандартизации на это не способны, как видно по СИ и IEC - они пришли к решению "если вы не можете понять, legacy-приставка перед вами или new-strictly-decimal, то, слава богу, наша задница здесь надёжно прикрыта и это не наша проблема".
____
Если вы оскорбились шуткой про мои заблуждения и Ельцина (без возражений при этом к сниженной лексике статьи: "шизу", "бумеры-основатели") в контексте статьи, у которой искажения памяти в самом названии (эффект Манделы), то я ничего с этим поделать не могу.
не могу найти других объяснений
А, могу. Ёмкость покажется "честной", если на неё смотреть с малыми двоичными приставками (КиБ вместо ГиБ), где разница с десятичными меньше.
Допустим, на этикетке заявлено 40 каких-то ГБ, а реальная ёмкость:
40.96 ГБ
= 38.1 ГиБ [караул]
= 39 063 МиБ [уже лучше]
= 40 000 000 КиБ. [совсем хорошо].
Заявленные гигабайты десятичные, но не вызовут претензий, если на них смотреть через кибибайты (вместо гибибайтов).
____
Maxtor DiamondMax Plus 8.
На этикетке заявлено 40 [каких-то] ГБ и 80 293 248 секторов.
80 293 248 * 512 байт
~= 40+1.1 ГБ
~= 40-1.7 ГиБ.
Зявленные гигабайты десятичные.
А теперь:
80 293 248 * 512 байт
= 38.3 ГиБ
= 39 206 МиБ
= 40 146 624 КиБ.
____
Впрочем, какой софт станет так показывать? Windows и в те времена в основном показывала гигабайты (двоичные) и глубже - байты без приставок. Двоичные килобайты (делённые пополам) будут только на этикетке диска в виде числа секторов.
Вижу, Вы очень боитесь того, что Ваша стройная теория может разрушиться.
Разрушить любую теорию очень просто - нужно всего ли привести хотя бы один факт, который этой теории не соответствует. Вы же можете привести такой факт?
Кстати на эту тему есть аналог в физике. Все мы знаем что электроны в электрической цепи движутся на встречу электрическому току, но при это именно они этот ток и переносят. Поэтому было много предложений переименовать плюс в минус а минус в плюс, чтобы электроны и электрический ток стали течь в одном направлении, но физики отказались, а представьте если-бы они это сделали, вот это была-бы путаница.
Насколько я понимаю первопричину путаницы, направление электрического тока было принято условно до того, как физическая природа этого самого электрического тока и его истинное направление было установлено окончательно. В тот раз не угадали. Но решили ничего не менять, наверное чтобы не создавать путаницу, а в результате путаницу зафиксировали.
Корни "путаницы" ещё древнее, потому что, противоположность направлений тока и движения электронов прямо следует из отрицательного заряда электрона. И "виноват" во всём этот самый отрицательный заряд электрона, который был неявно зафиксирован ещё в то время, когда не только про электроны ничего не знали, но и про электрический ток.
Тогда было бы ещё больше путаницы между электрическим током и движением электронов, а это разные вещи.
Никогда не задумывался...
А если взять достаточно длинный проводник в виде разомкнутого кольца (допустим, вокруг Земли уложить) поставить по его длине датчики магнитного поля, и подключить его концы к источнику напряжения - где возникнет, и как будет распространяться магнитное поле вдоль проводника?
от минуса к плюсу
от плюса к минусу
от концов к середине
по всей длине проводника одновременно? :)
Электромагнитное поле будет распространяться от источника ЭДС вдоль поверхности провода с субсветовой скоростью, то есть, например, 0.3c в медном проводнике. А уж на плюсе, минусе или на обоих концах у вас находится источник ЭДС – вы не написали. Надо смотреть конструкцию и подключение источника напряжения. Также поле будет распространяться в виде радиоизлучения в пространство со скоростью света.
Электрический ток будет течь от плюса к минусу с той же субсветовой скоростью.
Электронный газ будет увлекаться электромагнитным полем от минуса к плюсу с небольшой скоростью, порядка 1 м/с.
Отдельных электронов, как частиц, в металле нет.
В Android с измерением свободного места было что-то ещё более странное
А именно, по крайней мере у Samsung, разницу между приставками на 2023 год прибавляют к размеру операционной системы.
Т.е. в телефоне имеется флеш-память на 512 ГиБ, без учёта служебной ёмкости (overprovisioning) доступно 512 ГБ, но в Android их хочется показать в двоичных гигабайтах (477 ГиБ), но красивее (477 двоичных контекстно-зависимых ГБ), но нет, ещё красивее (512 поддельных рекламных ГБ) - для этого разницу между 512 ГиБ и 512 ГБ прибавляют к размеру ОС, чтобы сошлось - и поэтому чем больше памяти у телефона, тем больше "весит" ОС.
В существование этих точек зрения после перечисленного не верится
Это взял непосредственно с сайта IEC https://web.archive.org/web/20090403051731/http://www.iec.ch/zone/si/si_bytes.htm
Только второй пункт (и Гбит => Мбит).
"Network designers have generally used megabits per second (Mbit/s) to mean 1 048 576 bit/s, while telecommunications engineers have traditionally used the same term to mean 1 000 000 bit/s"
Спасибо. Всё равно странно, я о таком слышу в первый раз, а в google books только один результат с таким подходом есть.
https://books.google.ru/books?id=HhsoAQAAMAAJ&q="Kbit/s"+OR+"kbps"+"1024+bit/s"&dq="Kbit/s"+OR+"kbps"+"1024+bit/s"
Но интересно, что они отсылают к рекламной стороне.
"term was also easy for salesmen and shops to use, and it caught on with the public. Take, for example, the ubiquitous and so-called 3,5 inch floppy disk"
Которая после их нововведения никуда не делась (имею в виду непоследовательность в macOS и Android)
И приводят в пример величину 133,3 MB/s, хотя она как раз иллюстрирует невозможность указать - по старой системе она записана или по новой.
В этой статье прямо прослеживаются аналогии с Вавилонской башней. Когда бог спутал системы мер людей, и каждый из них стал строить башню по своему, в результате башня развалилась. С компьютерами может произойти тоже самое.
Хах, угараю с названия поста. Ничего такого, просто забавляет)
Маркетологи решили "округлить", ибо *2 считать им слишком тяжко, да и круглая цифра красивей, технари к слову за это их ненавидели, а теперь безмозглые малолетки хотят это дерьмо распространить на всю область.
ЗЫ: Ото не зря Торвальдс сразу на место таких "гэниев" ставит...
ЗЫЫ: Мб это единица занимаемого места, Мбит это единица скорости, 100МБит/сек /8 ~12.5Мб/сек, не так и трудно и всем понятно, так может стоит хотя-бы чутка вникнуть перед тем как писать?
Бедный автор, думает что 2^10 это около миллиона...
а это что тогда?

Про размер кластера не забываем
А винда самая неочевидная в этом плане — цифры отображает, как будто это двоичные единицы, а сами единицы указывает десятичными. Т.е. по факту размер 20,8 ГиБ, а не 20,8 ГБ.
Вот и я о чем говорю.
Даже производители накопителей стали писать нормально. А Винда... Ну вот такая эта Винда...
Ну и вакханалия.
Даже производители накопителей стали писать нормально
Их тут успели обвинить и в переходе на двоичные приставки, и в отказе от двоичных приставок, хотя они ничего не меняли.
А Винда... Ну вот такая эта Винда...
А винда продолжает использовать традиционные килобайты (у винды они всегда двоичные), как было до появления кибибайтов. Как в Android, только последовательнее.
Вот это в соседнем комменте тоже было славно вброшено:
Про размер кластера не забываем
Веселей всего читать комментарии в маркетплейсах под флешками. Каждый второй отрицательный отзыв про то, что память не соответствует заявленной.
Шутки шутками, но я не поддерживаю нападки на "американские" единицы измерения. Можно сколько угодно доводов приводить в пользу как будто бы стройности и логичности метрической системы - и преимущественно соглашаться с ними, но если ты родился и вырос в месте, где в футе двенадцать дюймов, то футы и дюймы так и останутся для тебя, как бы это сказать, родными, интуитивно понятными, а сантиметры с метрами - чуждыми, пусть и несложно пересчитываемыми. Американский автопром, например, значимо качнулся в сторону метрического крепежа, но наследие имперских единиц измерения живет и здравствует даже в оплоте метрическрй системы - континентальной Европе. Сантехника почти вся дюймовая, разве что новомодные пластиковые и композитные трубы уже в миллиметрах - все трубные резьбы в долях дюйма, и профиль резьбы, помимо размеров как таковых, не сказать, что метрический, да и размеры, если уж измерить диаметры резьбовых соединений, не вполне точно соответствуют тем дюймам, которыми маркированы - полдюймовая (1/2") трубная резьба имеет диаметр примерно 13/16". И это, повторюсь, в оплоте метрической системы. В Америке, хотя бы, винт с резьбой 3/8" будет иметь диаметр 3/8" - примерно 9.5мм, как и следует из прямого пересчета одних единиц в другие.
вырос в месте, где в футе двенадцать дюймов
А в дюйме - 16 как-они-их-там называют.... Было бы у них все по основанию 12 - может, и метрическая система по основанию 10 не появилась бы.
Вы смешиваете понятия. Трубная резьба характеризуется не параметрами самой резьбы, а диаметром проходного отверстия в трубе. И это самый идиотский способ обозначения резьбы, который вообще только можно было придумать. И трубная резьба, хоть в России, хоть в Европе, хоть в США будет измеряться таким же идиотским способом, и нормальная дюймовая резьба, хоть в США, в Европе, хоть в России будет обозначаться её внешним диаметром.
Ещё пример весёлого округления: мобильные операторы массово стали считать, что месяц это ровно 4 недели, т.е. 28 дней. В результате списание абонентки приходится каждый раз на новую дату. Жутко неудобно стало пополнять карту для автосписания.
Это какие так считают? Ну вообще это еще и удорожаение получается.
Зато в году теперь 13 месяцев - шах и мат критиканам астрологии, ставящим на вид, что в зодиакальном поясе тринадцать созвездий, классические двенадцать плюс Змееносец.
О, вот кто-то это заметил! Как по мне, так это скрытый побор (у меня билайн)
Мне нравится в файловом менеджере Nemo (линуксовый "проводник") можно указать явно как показывать.

Автор, а сколько вам лет?
(Upd: посмотрел в профиле... Да, не вам рассуждать об эффекте Манделы в данном случае).
Мибибайты появились на моей памяти – программисты ещё в 80-е привыкли, что в килобайте 1024 байта, и эта разница никого не смущала. Необходимость как-то отделить "двоичные" килобайты от "десятичных" появилась позже, когда в ход пошли мегабайты и гигабайты, и разница стала слишком велика.
Upd2: The term "mibibyte" (MiB) was first officially defined in December 1998 by the International Electrotechnical Commission (IEC).
До того момента (и долгое время после) были разночтения, но среди программистов считалось, что в килобайте 1024 байта.
Запишись на чекап, старик! Все мы не вечные.
Теперь будут "староверы", кто учился до 99 года и по-прежнему считают как было придумано изначально, то есть использует степени двойки и "православные" с MiB -ами, хотя, для меня это обозначение скорее обозначает формат файла для SNMP :)
Считал и считаю что везде 1024, все эти миби киби это как изобретение новых местоимений, что бы подчеркнуть индивидуальность субъекта.
Т.е. выходит что корень проблемы в том что кто-то притягивал сисему Си, которая появилась задолго до потребости считать бинарные данные, но очень уж хотелось её притянуть.
Айтишник-первокурсник думает, что в килобайте 1000 байтов.
...
Айтишник-пятикурсник думает, что в километре 1024 метра.
Раньше было так, теперь по-другому. Причём тут эффект Манделы?
Этим вашим мебибайтам и мебибитам 27 лет от роду. Большинство исправлялок до сих пор не знают этих слов и предлагают исправить на мегабайт и мегабит. Пройдёт ещё столько же лет, а то и больше, прежде чем новые названия укоренятся.
И эффект Манделы тут совершенно не причём.
Это не эффект Манделы.
В 99% учебников по программированию для новичков (особенно 1990-2000 годов) Вы найдете, что 1 МБ = 1024 * 1024 байт и иногда будет в качестве бонуса байка про ушлых маркетологов, которые продают миллион байт вместо настоящего 1 МБ.
Эффект Манделы - это когда чего-то не было, а все уверены, что было. Кликбейтненько.
Открываем руководство пользователя системы 360 от IBM, и видим отдельным пунктом оговорку, что понятие "кило" и "мега" применительно к единицам объема информации в данном руководстве означают не 10^3 и 10^6, а 2^10 и 2^20.
Ну что опять со своим бибибайтом? Нам так удобно. Точка. Мебибайты нам не удобно, а мегабайты нам удобно.
А Эффект Манделы это про "покатай меня большая черепаха" и про мишек Бернштейн/Бернштай.
ИМХО все эти киби-хуиби придумали умные мужи с большими головами, наяривающие на систему СИ, у которых 1024 и кило в одном предложении вызывают большая боль дырка анус. Но по факту 1024 байта в килобайте - это следствие того, что расчеты на компах прибиты гвоздями к аппаратной платформе, и использовать степени двойки в данном контексте просто удобнее (у компа не десять пальцев, а вкл/выкл)
Т.е. когда на первом курсе ВМиК МГУ в 2001 нам рассказывали про 8-1024 - это был эффект Манделы? Так и запишем.
ухх. имеем диск p1643a
в зависимости от сервистэга он может быть объема
версия для дисковых полок
3.2Tb (кластер 520) в винде виден как 2.97тб
Версия для серверов
3.8Tb (каластер 512) в винде виден как 3.49тб
При всём моём уважении к СИ, я твёрдо убеждён, что десятичные/СИшные/маркетологические мегабайты размером 10e6 байт надо предать анфеме. Пусть даже в документах они буду обозначаться этим странным МиБ, но и в железе и в речи людской мегабайт должен содержать 2e20 байт.
Мне больше нравятся оригинальные названия приставок и степени двойки, так что здесь я на стороне "старичков", и продолжу использовать "неправильные" названия. Правильность в подобных вопросах определяется исключительно общественным консенсусом.
Количество информации не физическая величина, с СИ она пересекается только в смысле заимствования приставок. Приставки кило-, мега-, гига- и тера- чисто субъективно звучат лучше и привычнее киби-, меби-, гиби- и теби-. Да и о существовании последних простой люд почти не слышал, во всяком случае народный стандарт "1 Кбайт = 1024 байт" многократно популярнее альтернативы от IEC.
Скажите, меня одного смущает, что СИ регламентирована для применения в десятичной системе исчисления, и что её примение в отношении двоичной системы исчисления, мягко говоря, выглядит маразмом?
А вообще, если уж натягивать сову на глобус, то приставка мега- означает количество значений в 6 разрядах, т.е. в десятичной это 10^6, а в двоичной 2^6 (разрядов даже на байт не хватает). Если же принять, что это про объем в стиле физической величины, этакие клеточки в тетради, в которые вписано число, то мы уже сможем притянуть СИ, но использование такой величины как байт будет нарушением. Согласно нормам СИ мы должны использовать мегабит равный 10^6 бит.
Кстати, кто-нибудь слышал про гигадюйм, или мегаунцию?
Вопрос тут не в СИ, а в формальном значении приставок, которые сами по сути являются безразмерными единицами измерения. Поэтому аргументы той и другой стороны имеют право на существование. Но для программистов, конечно, привычно килобайтом называть 1024 байта, и с этой практикой сложно что-либо сделать.
Но для программистов, конечно, привычно килобайтом называть 1024 байта
И привычно, и логично.
500000 м = 500 км - сокращенная запись. Смысл приставки в сокращении записи.
524288 байт(512 нормальных килобайт) = 524,288 "десятичных килобайт" - удлиненная на запятую запись. Какой смысл в масштабирующей приставке, если она не приводит к сокращению записи? Бюрократы победили здравый смысл.
Чиновничьи "десятичные килобайты" не имеют практического смысла. Они исказили смысл хорошего слова "килобайт", и сделали его непригодным к практическому применению. Вместо него навязывают попугайский "кибибайт".
СИ регламентирована для применения в десятичной системе исчисления
СИ и система исчисления из общего имеют только первые буквы слов. Больше ничего общего они не имеют.
и что её примение в отношении двоичной системы исчисления, мягко говоря, выглядит маразмом?
Маразмом выглядит смешение систем счисления и единиц измерения.
СИ и система исчисления из общего имеют только первые буквы слов. Больше ничего общего они не имеют.
Я их не смешивал, я лишь указывал, что СИ применяется к единицам измерения, в основе использования которых лежит десятичная система. Те же метры и километры, например. Всё остальное банально в СИ не входит, например фут равный двенадцати дюймам. Единицы объёма информации туда тоже не входят, но вот почему-то споры на эту тему возникают.
В основе единиц измерения не лежит никакая десятичная система. Единицы измерения это метр, грамм, секунда итп. Они вообще системой счета не связаны. В километре отстанется тысяча метров вне зависимости от того, запишем мы эту тысячу в десятичной системе, двоичной или любой другой.
в основе использования которых лежит десятичная система. Те же метры и километры, например.
Это масло масляное. Вы берете пример, где используется десятичная система и используете его как доказательство того, что десятичная система используется в этом примере.
Такое ощущение, что доказываем одно и то же, но никак этого не можем понять...
Где я утверждал что в основе единиц измерения лежит хоть какая-то система исчисления?
Хорошо, давайте вы ответите на следующие вопросы:
Вы согласны с тем, что для единиц измерения, регламентированнных в СИ, применеие описанных в СИ приставок будет правильным и иметь именно то значение, которое им приписывается?
Вы согласны с тем, что для единиц измерения не принятых в СИ использование приставок из СИ может быть некорректным, или иметь иное значение?
Маразмом выглядит смешение систем счисления и единиц измерения.
Так пусть чиновники не смешивают теплое с зеленым.
КилоБАЙТ - из контекста понятно что речь не о физических величинах. И у этого слова есть особое значение.
"Единица измерения информации" - это бред по определению. Информация - это не метрологическая сущность. Это абстракция.
Сколько информации содержится в одном байте? Это зависит от того, что этим байтом кодируют, и в какой кодировке.
"Кило" не защищено копирайтом. Можно создавать любые слова с использованием этого сочетания букв, и наделять их любым значением.
"Кило" не защищено копирайтом
Однако регламентируется техническим стандартом.
Однако регламентируется техническим стандартом.
Не регламентируется, а интерпретируется. Это не запрещает использовать другую интерпретацию. Этот вопрос относится к лингвистике. Можно считать "килобайт" как неделимое слово. Фактически синоним для "1024 байта". А условное сходство с другими "кило-чем-то" не является существенным.
Ага. Сначала взяли именно ту самую приставку "кило", а потом начинаем говорить, что сходство условно и вообще случайно.
а потом начинаем говорить, что сходство условно и вообще случайно
Случайным был выбор. Могли взять 256 байт как основу. "Кило" к ней не подошло бы. Подошло бы что-то другое. Например "диа" от греческого 200.
Сначала взяли именно ту самую приставку "кило"
Да, термин был создан по шаблону. Однако "кило" при этом потеряло свое первоначальное значение. В составе слова "килобайт", "кило" перестало обозначать "греческую" тысячу. Это лингвистика.
А чиновники изменили первоначальное значение слова "килобайт", которое являлось синонимом "1024 байта", потому что им показалось что "кило" очень похоже на масштабирующую приставку из СИ. "Килобайт" не был защищен авторским правом, поэтому юридических ограничений на такую его трактовку не было.
Однако юридически, стандарт не является нормативным правовым актом. https://www.advgazeta.ru/novosti/vs-poyasnil-chto-gost-ne-yavlyaetsya-normativnym-pravovym-aktom/ Так что если в стандарте "килобайт" указан как 1000 байт, это никак не ограничивает возможность другой трактовки, и использование этого слова в его первоначальном смысле, как 1024 байта.
Поэтому еще раз напоминаю - когда говорите о каком-то правиле, обязательно указывайте в рамках какого стандарта оно действует.
"Единица измерения информации" - это бред по определению. Информация - это не метрологическая сущность.
Признаю, не корректно выразился, речь шла о единицах хранения и обработки цифровой информации.
Хотя в некоторых источниках используется "Единица измерения информации закодированной в двоичном виде", но тут действительно, даётся важное уточнение.
Признаю, не корректно выразился
Про "бред" это было не в ваш адрес. Это в адрес чиновников, которые ввели в стандарт "количество информации". Информация безразмерная сущность. Это просто обобщенное понятие. Чиновники пытаются формализовать неформализуемое.
"Единица измерения информации закодированной в двоичном виде", но тут действительно, даётся важное уточнение.
Это не добавляет смысла.
Есть размер файла, емкость накопителя или микросхем памяти. Однако емкость накопителя или размер файла, ничего не говорит о количестве информации которую они содержат или могут содержать.
Для баз данных измеряемой величиной является количество записей. Нет прямой связи между количеством байт и количеством записей.
По существу, бит и байт являются единицами логической структуры, а не единицами информации. Они используются при описании логической структуры программно-аппартных систем. Их правильно называть "единицами двоичной логики". Причем "бит" фундаментальная единица, а "байт" равный 8 бит это чисто технический момент. Технически ничего не мешает делать программно-аппаратные системы с разрядностью не кратной 8, в том числе с нечетной разрядностью. 8 бит сохраняется только ради совместимости с логикой предыдущих поколений.
По существу, бит и байт являются единицами логической структуры, а не единицами информации.
Байт - да, а вот бит - вполне себе единица информации. И не только информации, в битах при желании можно измерять всё то же самое, что обычно измеряют в децибелах, 1 бит ≈ 3.01... дБ
бит - вполне себе единица информации.
Бит - один разряд в двоичной системе. Несет один бит какую-либо информацию, зависит от типа информации. Для этого может быть нужно минимум два бита, или несколько байт. Для информации о координате точки в трехмерном пространстве, одного бита явно недостаточно. В этом случае представление о бите как о единице информации теряет смысл.
то же самое, что обычно измеряют в децибелах, 1 бит ≈ 3.01... дБ
Бит не несет информацию сам по себе. К нему нужно приложить контекст. Поэтому единицей информации будет "значение бита + описание того что он кодирует". Иначе бит будет "нести информацию" только о своем состоянии.
Для информации о координате точки в трехмерном пространстве, одного бита явно недостаточно.
Зато для определения в какой из половин пространства точка находится - достаточно.
Бит не несет информацию сам по себе. К нему нужно приложить контекст.
Контекст нужен всему. Метр не означает ничего пока не сказано что именно измерялось, с секундой и килограммом та же ерунда. Но это не мешает им всем быть единицами измерения.
Зато для определения в какой из половин пространства точка находится - достаточно.
Для определения "в какой из половин пространства" - бит будет нести информацию. Для координаты в трехмерном пространстве - один бит это ниже информационного уровня. Количество бит не указывает на количество информации, поэтому бит в принципе не может быть единицей измерения количества информации.
Контекст нужен всему. Метр не означает ничего пока не сказано что именно измерялось, с секундой и килограммом та же ерунда
Все правильно. Поэтому метр и секунда это не единицы информации. Хотя длина и время совершено явно несут какую-то информацию. Бит тоже не единица информации. Он может быть единицей объема накопителя, или размера файла, или разрядности шины процессора. Но не единицей информации.
Для координаты в трехмерном пространстве - один бит это ниже информационного уровня.
Что такое "информационный уровень" и откуда он тут вязялся?
Что такое "информационный уровень"
Информация - обработанные, организованные и связанные данные, которые порождают смысл (значение). Информационный уровень - минимально необходимое количество данных, порождающее смысл.
и откуда он тут вязялся?
Логически следует из определения информации. Количество данных, меньше определенного уровня, не порождает смысл.
Что такое "единица информации"?
Однако емкость накопителя или размер файла, ничего не говорит о количестве информации которую они содержат или могут содержать.
Конечно же размер файла в совершенно однозначно говорит нам о том, сколько в нем информации.
"Единица измерения информации" - это бред по определению. Информация - это не метрологическая сущность
Нет, информация имеет вполне количественный характер, в смысле теории информации. Там она определяется как I(A) = - P(A) \log P(A). Другое дело, что её нельзя напрямую измерить — только оценить статистическими методами.
И вот бит в терминах теории информации вполне себе "единица измерения информации" и соответствует использованию в формуле выше двоичного логарифма. Для троичного логарифма — трит и т.д.
"Физический смысл" бита — это информация, которая содержится в событии, что выпал орёл при броске идеальной монетки.
информация имеет вполне количественный характер, в смысле теории информации.
При этом информация все равно является абстракцией, хоть и имеет "количественный характер". Стандартизировать эту информацию невозможно.
Там она определяется как I(A) = - P(A) \log P(A)
Эта формула не для вычислений количества информации. Она лишь отражает зависимость - количество информации связанной с событием, обратно пропорционально вероятности этого события. Из нее можно получить некий коэффициент, но не конкретное значение.
И вот бит в терминах теории информации вполне себе "единица измерения информации" и соответствует использованию в формуле выше двоичного логарифма. Для троичного логарифма — трит и т.д.
Да, значение этой переменной влияет на характер графика зависимости количества от вероятности. Можно провести относительное сравнение для разных базовых единиц (бит, трит, и тд).
"Физический смысл" бита — это информация, которая содержится в событии, что выпал орёл при броске идеальной монетки
Сложная для понимания формулировка. Неоднозначная, с точки зрения лингвистики. Вероятность правильной трактовки неоднозначной фразы, обратно пропорциональна количеству смыслов которое она содержит.
Эта формула не для вычислений количества информации.
Буквально для вычисления (если мы откуда-то знаем распределение, разумеется). И есть вполне себе утверждения и теоремы, которые используют количественные значения информации.
Например, известно, что любого префиксного кода средняя длина кодировки для символа не может быть меньше средней информации в символе (оба средних в смысле матожидания).
Стандартизировать эту информацию невозможно.
Затрудняюсь понять что Вы имеете ввиду. Это вполне себе стандартное определение (см P.S.).
"Физический смысл" бита — это информация, которая содержится в событии, что выпал орёл при броске идеальной монетки
Ну вообще, современное определение информации пришло к нам из продвинутой статистике. Если неформально, то там рассматривается модель, когда у нас есть априорные вероятности (до "эксперимента"), эксперимент завершается событием A; и в зависимости от произошедшего события пересчитываться апостериорные вероятности. И информация в событии A, это количественная величина, которая характеризует насколько сильно могут выродиться апостериорные вероятности, если произошло это событие.
В такой постановке, когда мы подбрасываем монетку, то в событии "выпал Орёл" содержится один бит информации.
Продолжая тейк про теорию кодирования, если у нас есть эксперимент по подбрасыванию n монеток, то для точного описания исхода этого эксперимента требуется n бит.
P.S. посыпаю голову пеплом: я указал формулу для энтропии, а не для информации. Информация - это просто -log(p).
Продолжая тейк про теорию кодирования, если у нас есть эксперимент по подбрасыванию n монеток, то для точного описания исхода этого эксперимента требуется n бит.
"Информационный" бит может иметь разный размер в логических двоичных битах? Для частного случая с монетой, результат падения которой имеет только два значения, размеры логического и "информационного" бита одинаковы. Но если записывать угол наклона монеты при касании поверхности, то размер одного "информационного" бита станет равен нескольким логическим битам?
И информация в событии A, это количественная величина, которая характеризует насколько сильно могут выродиться апостериорные вероятности, если произошло это событие.
Да, но это очень далеко от информации в компьютерах и накопителях данных.
Про стандартизацию, это было к вопросу о том, стоило ли включать в стандарты слово "информация" - "Единицы количества информации, используемые при обработке, хранении и передаче результатов измерений величин". Объем данных это не то же самое что количество информации.
Ммм... тут встает неудобный вопрос сколько содержится информации (или чего иного) в неком шуме (который зашифрованный сигнал), если наблюдатель ключа от него не знает. И сможет ли наблюдатель вообще понять, что перед ним сигнал, а не шум.
Если это хороший шифр а поток данных достаточно короткий, то шифротекст практически неотличим от шума. Это, собственно, один из основных критериев оценки алгоритмов шифрования.
Но в целом, это всё упирается в проблему, что очень плохо умеем оценивать количество информации в сообщении. Для хоть сколько-нибудь серьёзной точности требуется слишком много данных и слишком много вычислительног времени.
Но если записывать угол наклона монеты при касании поверхности, то размер одного "информационного" бита станет равен нескольким логическим битам?
Нет, не станет, разумеется. Это вопрос оптимальности кодирования всего лишь.
Да, но это очень далеко от информации в компьютерах и накопителях данных.
Почему? Просто при обработке в компьютерах зачастую не фиксируют распределение вероятностей. Ну и схему записи не всегда оптимальную выбирают. Подход у учёту информации остаётся всё тот же.
Должно быть "кило бинари-лоджик" - KIlo BInary-LOgic BYTE. Кибилобайт.
MEga BInary-LOgic BYTE.
DEka BInary-LOgic BYTE.
Главный эффект Манделы в мире программистов — сколько байт в мегабайте