Pull to refresh

Comments 58

Мне одному показалось, что Гончаров говорил с сарказмом?
Богачёву так не показалось. Да это и не важно :)
Стало быть не зря мы используем IWDG и WWDG )
Как, коллега, вы правы. Вот делаем мы сейчас аппаратуру для работы под землей в области где есть граниты и, соответственно, рождаются частицы высоких энергий. Там это строго обязательно, даже если софт идеален.
Очень любопытно, спасибо!
Но не во всех сбоях электроники стоит винить ТЗЧ и космос. Есть еще такая штука, как метастабильность: это как заряженное ружье на стене, раз в сто лет может выстрелить. На тему метастабильности и «бога в машине» есть отличная книжка на английском: He Who Hesitates is Lost: Decisions and free will in men and machines

Действительно, опасность метастабильности недооценивается. Но, в отличие от сбоев, вызванных ОЯЧ, метастабильность не коррелирует с солнечными вспышками.

FPGA от Altera (Intel) уже лет десять (как минимум — со Stratix III и ArriaGX) снабжены средствами противодействия SEU.
И остальные, думаю, — тоже.

Всё верно. Просто любая встроенная защита от сбоев рассчитана на определенную максимальную частоту событий (попаданий ОЯЧ в чувствительную область). Во время вспышки события могут происходить так часто, что схема коррекции начнёт "захлёбываться".

В прошлое вс сначала мертво встал комп, потом ноут. Просто картинка, как скриншот, ни мышка не двигается, ни на клавиши не реагирует. Предпосылок никаких не было (тихий день и вечер, открыт разве что браузер), никаких blue screen не вылетало. Так что более чем реально;)

PS: всё бегает на SSD.
Реальную причину инцидента с самолетом Qantas так и не установили. Учитывая что сбоев было два с интервалом в 3 минуты и сбоила одна и таже инерциальная система из трех установленных на борту вероятность того что сбой был вызван высокоэнргитической частицей очень маленькая.
Противоречия версии сбоя от ОЯЧ в Ваших словах нет. Сбой от ОЯЧ в авионике — вещь вообще не очень частая, но в данном случае вероятность такого сбоя выше вероятности других событий.
Есть еще один факт не очень вписываеющийся в теорию что это была ОЯЧ. Двумя годами раньше, на том-же самом самолете, таже самая система из трех уже сбоила аналогичным образом. В тот раз обошлось без последствий потому что она, хотя и нестабильно, но выдавала сигнал ошибки оборудования и автопилот не начал рулить самолетом по ее данным. В результате пилоты перешли на резервную систему. Коммисия посчитал что эти оба случая скорее всего связаны с производственным браком который проявляется при очень редком стечении обстоятельств потому что тестирование на земле показывало полную исправность системы.
Не видя отчета, сложно сказать что-то определенно. Не могли бы Вы дать ссылку, если отчет выложен в открытый доступ?

Вообще говоря, в систему и раньше могли попадать нейтроны, только в других случаях сбои были в некритичных битах (как вариант).
Да конечно, ATSB report. В приложении H подробно написано про эффекты от ОЯЧ. Сам вывод на стр. 213. «a marginal weakness in its hardware» с указанием серийного номера железки это такая вежливая форма для «подозревам что железка глючная, но доказать не можем».
Спасибо за ссылку! Я немного иначе понял сказанное в отчёте. Если суммировать написанное в 6.1, получается следующее: сами по себе элементы чувствительны к сбоям от ОЯЧ (и это подтверждено), а софт разрабатывался в ранние 1990-е и не включал ставшие позднее обязательными проверки целостности данных.

Тут нельзя сказать, что железо плохое и всё. Железо восприимчиво к сбоям (вообще говоря, любое восприимчиво). Но если это так, нужно принимать меры для парирования сбоев, а принятых мер в том случае было недостаточно.

Приведу такой пример. Есть БЦВМ А-15АР, в состав которой входит микропроцессор 1890ВМ2Т, не имеющий встроенных средств защиты от сбоев. Тем не менее, на уровне модуля задача парирования сбоев разработчиками решена. Чтобы облегчить задачу и сэкономить место, массу и энергию (что актуально для космоса), 1890ВМ2Т заменяли на его «потомков» 5890ВМ1Т и 1900ВМ2Т (оба — КНИ, последний — с троированным ядром).

На такие случаи, например, вендоры предлагают линейки отказоустойчивых контроллеров с архитектурой Cortex R с аппаратной защитой: ядро дублируется, причем топология дубля повернута на вафле на 90 градусов и отзеркалена. Код выполнянтся одинаковый на обоих ядрах, но выполнение, команд на втором ядре сдвинуто по времени на несколько тактов. результат выполнения на разных ядрах сравнивается аппаратно, если результаты разные, привет, прерывание

Как вариант. Если не жалко потребляемой мощности (для спутников обычно каждый Ватт на счету). Вообще этот приём годится и для небольшого блока: можно дублировать с задержкой порядка ожидаемого времени импульса от ОЯЧ, и выходы 2х копий подавать на С-элемент Маллера, тогда помеха не пройдет. Если троировать с задержкой на t и 2t, то можно и исправлять ошибку, но цена за это — максимальная скорость и повышенное потребление.
Кстати, космонавты утверждают, что значение каждого Ватта на борту на самом деле преувеличено, и мощности на больших аппаратах более чем хватает.
Было бы хорошо, если бы космонавты могли это донести до МНИИРИПа и Минпромторга, а то на микромодуль с процессорным ядром, ПЛИС и СОЗУ требования ТЗ — 6 Вт. :)
Более 10 лет была статья, там были выкладки, что при памяти от 200 мБ становилось актуально. Помню ещё задумывался как у меня память стоит геометрически. Сейчас в серверах на сколько видел по картинкам — DIMMы стоят вертикально. Хотя в ливне наверное уже всё под разными углами летит.
Под двадцать пять лет назад статья была, по-моему. Про ИБМовские серверы. Вот только не помню, не «Радио» ли это был
UFO just landed and posted this here
На Земле — да. В космосе — не всё однозначно, возможен ливень вторичных частиц например.
Все способы защиты с помощью материала (типа RADPACK) направлены на повышение стойкости к накопленной дозе. Если известно распределение частиц на орбите вашего аппарата (рис.9), то вы можете подобрать материал покрытия корпуса, который может уменьшить поток основного компонента. Для другой орбиты, с другим распределением частиц, это решение будет уже не таким эффективным.

Если же вы просто будете наращивать толщину защиты (допустим, Al), то, во-первых, увеличится масса (что критично для спутника), во-вторых, хоть частиц с меньшей энергией будет меньше (они будут застревать), частицы с большей энергией или дойдут до кристалла с меньшей энергией и, соответственно, с большей ЛПЭ, или вызовут каскад вторичных частиц. Это можно рассчитать программами типа SRIM и GEANT.
Толстый слой материала защитит много от чего. Если энергия частицы конечно не 200 ГэВ, то слишком далеко она не пролетит через слой свинца.
Она не пролетит, а вторичные частицы- ещё как пролетят.

Опасность сбоев и отказов от отдельных ядерных частиц — уже вполне описанная реальность в силовой электронике: https://www.semikron.com/dl/service-support/downloads/download/semikron-application-note-cosmic-ray-failures-in-power-electronics-en-2017-06-08-rev-00/
https://library.e.abb.com/public/3d76b0a0916e4c0eac3469f5f22f350b/Failure%20of%20HiPak%20due%20to%20cosmic%20rays5SYA%202042-06-10-2016.pdf
Известна и степень влияния и зависимость от температуры, площади и высоты и даны соответствующие расчеты надежности. Поэтому при повышенной солнечной активности весьма вероятны отказы различных инверторов, которые широко используются и в самолетах(причем на высоте более вероятные) и на подводных лодках и на автомобилях (особенно электромобилях, но в обычных тоже — например в ЭУР).

Вообще говоря, эти эффекты подробно описаны и для силовой, и для обычной электроники ещё в 1980-1990-х, но по сей день что у нас, что на Западе многие считают эту опасность преувеличенной или вовсе несуществующей.
Вы верно отметили, что для силовой электроники характерна бОльшая вероятность именно катастрофического отказа (естественно: поля-то большие): помимо общего для объемной КМОП технологии тиристорного эффекта, там есть эффекты пробоя подзатвоорного диэлектрика (SEGR) и выгорания (SEB).
Ну не генерирует Солнце частиц с энергиями, достаточными для генерации широких атмосферных ливней (за это отвечают галактические космические лучи), так что вероятность сбоев наземной и воздушной электроники от активности Солнца в части попадания именно заряженной/нейтральной частицы не должна зависеть.
Меня все удивляет как же все таки ОЯЧ могут повредить силовой трансформатор.
Не удивляйтесь: ОЯЧ там ни при чем — трансформатор погиб от электромагнитного импульса.
Из какого материала изоляция между обмотками? Какой-нибудь органический полимер, в котором ОЯЧ может проделать наблюдаемые в микроскоп дыры? В изолирующем дилектрике даже единичные дефекты радикальное уменьшают напряжение пробоя, вот и весь секрет, и этот эффект вполне наблюдается в интегральных трансформаторах. Точно не скажу, но возможно, что в силовых он тоже есть.

Большая часть силовых трансформаторов в качестве диэлектрика используют жидкий изолятор — трансформаторное масло. Такой ничтожный пробой очень быстро "заплывет" и не скажется на общей диэлектрической прочности.

Если так, тогда ОЯЧ никак не могут повлиять. Но автор правильно говорит, что там сыграли роль другие виды излучения.

Правильно говорят, там не ОЯЧ, а совершенно другой эффект: из-за изменения формы магнитного поля Земли на длинных ЛЭП наводится ток, который: 1. разогревает обмотки трансформатора, и если не работает защита по перегреву, то он сгорает, 2. может наводить потенциал на индуктивностях и сопротивлениях трансформатора, после чего обмотку пробивает и опять же транс сгорает.

Повреждение трансформатора повышенным напряжением маловероятно, ограничители перенапряжения его неплохо защищают даже во время грозы, а вот первый вариант вполне вероятен.

А от повышенного тока защищает связка "измерительный трансформатор тока — автоматика — выключатель", теоретически.

Насколько я понимаю, изменения магнитного поля относительно медленные и, следовательно, наводят токи частотой сильно меньше промышленной. Для трансформатора это фактически постоянный ток. Трансформатор тока его не чувствует и защита не работает, а на обмотках силового он себя нагревом и проявит.

Это называется геомагнитная буря. От нее страдают электросети и трансформаторы. ОЯЧ тут не причем.

Странно, Максим, что не привел довольно хорошую статистику по изменению интенсивности одиночных сбоев в трансатлантических авиаперелётах. Таких работ было несколько, и там уже ни на что другое не спишешь, потому что они проводили прямые изменения.
Да я и по сбоям на спутниках не привел статистику: мне показалось, что и так много информации, а главное- не то, сколько, а где и как.
Подтверждаю солнечные вспышки и выход электроники из строя!
Примеров 4.
Первое — 8-го числа я ехал на своем электровелосипеде.ехал медленно по тротуару, на газ не давил. и тут в тишине вечера — ПАХ. сгорает 4 транзистора в контроллере. просто так на пустом месте. Крутя ручку газа — так не спалиш, коротить провода — аналогично, проблемы с питанием — аналогично. поменял транзисторы и до сих пор езжу — все норм. аномалия.
остальные три принесли вчера — на ремонт с аналогичными симптомами. у когото он просто стоял на улице ВЫКЛЮЧЕННЫЙ! характерной особенностью всех случаев — вышли их строя полевики внутри алюминевого прямоугольного корпуса 3-5 мм толщиной стенки. но они располагались с торца! там где у этого профиля пластиковая крышка. у меня контроллер горизонтально расположенный. вышли феты на северной стороны(на север смотрел тот торец. Сам процессор стоит в центре конструкции и не пострадал.
У других — контроллеры стояли вертикально — повыгорали феты верхнего торца вне зависимости вверх или вниз выходили провода.
Аналогично в позапрошлом году был такой же прецендент но тогда я о вспышках на солнце не знал и не связывал эти события. Сейчас же очень охотно верю.

Зачем заострять внимание на влиянии солнечной активности на электронику, когда солнечная активность и так замечательно влияет на людей, а ведь их гораздо больше. Пока. Выгляньте в окно на дорогу — ни одного робоавтомобиля (возможны погрешности в 1-10 штук). Зато есть сотни пяти-десяти тонных машин, управляемых комочком из пяти килограммов нейронов. Который отлично ловит "сигналы" с солнца!
Говоря менее экспрессивно, графики солнечной активности имеют прямую корреляцию с количеством водителей-лихачей, неадекватных пешеходах, и неадекватной руганью в чатах. Некоторое время назад я обратил внимание на аномалию — я находился в нескольких текстовых скайп-конференциях (приятелей), и (почти) одновременно в трёх поднялась непонятная, неадекватная ругань по высосанным из пальца причинам. Участники споров были все разные. Это заставило меня задуматься, и я погуглил графики. Удивился: в этот момент они показывали сильное увеличение солнечной радиации. С тех пор я каждый раз проверяю графики, и каждый раз нахожу всплеск. Более того, вооружившись этим наблюдением, я начал искать другие взаимосвязи, и ситуация на дорогах сразу же попала мне на глаза. Автомобилистов несравнимо больше, и из-за этого корреляция получается практически идеальная. Немного потренировавшись, вы сможете, проехав днём пять километров по городу, достаточно точно предсказывать текущий уровень радиации.


Что отсюда следует? Я рекомендую в моменты повышенного солнечного воздействия быть аккуратными рядом с, и на дороге. В первую очередь контролировать себя и своё поведение. Обращать повышенное внимание на других участников движения: как на водителей, так и на пешеходов с велосипедистами. Не двигаться с максимально разрешённой скоростью.


сайт с графиками

Дело в том, что научный метод сложнее, чем нам порой хочется. Для того, чтобы убедиться в том, что от ОЯЧ бывают сбои, нужно взять несколько микросхем и протестировать их без воздействия и с воздействием. Чтобы доказать влияние солнечной активности (или движения планет, как в астрологии) на человека, нужно взять 2 случайные репрезентативные выборки и провести двойной слепой тест: поведение одной группы исследовать во время солнечных вспышек, поведение другой — без солнечных вспышек, причём исследователи не должны знать, происходят вспышки или нет. Мне неизвестны такие исследования, а Вам?

Было бы здорово заключить город в свинцовый короб для проведения нормального исследования)
Понятное дело, что это мои личные наблюдения, я претендую лишь на то, что они укладываются в систему. А используя эти знания я облегчаю свою жизнь и повышаю собственную безопасность. Вот и распространяю эту инфу, потому что хочу другим помочь.

Кроме эксперимента искусственного, есть наблюдение и корреляция. В статье так же есть множество примеров, спутники на орбите Земли, сотни устройств, по которым можно анализировать солнечную активность с достоверностью в 0.99, этого разве мало? Не было же речи о том что на орбите нужно устраивать слепой тест и прочее.
В случае с дорогами всё еще проще математически, так как больше объектов, на планете под миллиард участников движения, в том числе и пешеходы, что могут совершать ошибки. Этого материала более чем достаточно. Тяжелых ДТП в день около 1000 в день, которые обязательно фиксируются статистикой, тоже не единичные случае, а имеющие статистическую значимость.
Но трактовать статистику уже сложнее. На севере может быть повышенная утомляемость от банального ночного света, люди хуже спят из-за света на улице, не вырабатывается мелатонин, нарушается режим дня и падает внимательность на улице. Может быть влияние электромагнитных полей. И так-же как с электроникой, может быть реакция нейронов на тяжелые частицы. Предположу теоретически: тяжелая частица активирует или «выжигает» часть нейронов, связей между нейронами и мозгу нужно время на восстановление (если оно вообще возможно), а с точки зрения человека его «переклинило», необъяснимая реакция для самого себя, не заметил что-то на дороге или перепутал торможение и ускорение.
С другой стороны космонавты на МКС описывают попадание в потоки ионизированного излучения — покалывание в теле, очень неприятно, но без заметных побочных и видимых эффектов, нет ни агрессии или подобного.

Но с другой стороны это
1. Единичные наблюдения и от космонавтов
2. Не нужна реакция в доли секунды. Любой эксперимент можно отложить сославшись на плохое самочувствие.
3. Космонавты могут так-же совершать мелкие ошибки, но они не фатальны, в отличие от ситуации на дороге, где на доли секунды руль достаточно повернуть на пару сантиметров в самый неподходящий момент. Например, если космонавт «зависнет» на пару секунд уйдя в себя, он сам может не заметить произошедшего, с его точки зрения ничего не случилось. А на дороге водитель уже может попасть в ДТП по непонятной причине для него причине и он сам может не понять что это его вина.

Так что в целом статистика по ДТП и корреляция с солнечной активностью весьма интересна и полезна, как для безопасности на дорогах, так и для изучения работы мозга.
Пожгли как-то один планшет — пытались сфотографировать небольшой сосуд с фтордезоксиглукозой с изотопом F-18 (используется в ПЭТ). Больше не включался :)
Те, кто делал высокочувствительную аппаратуру (каскады предварительного усиления и подобное, для гитары например), те, конечно, слышали редкие тихие щелчки. Кто же его знает, что было их источником — отдельная рекомбинация в полупроводнике, неустойчивость энергетического состояния локальной области или космическая частица. Особенно часто такое наблюдается у полевых транзисторов. Причем, если кристалл большой площади (КП302 в большом корпусе, старого выпуска), импульсы были чаще, но тише.
Но так, к слову, было у меня в одном концертном УНЧ (2х300 вт, на 6Р3С) непонятное «тиканье» — раз в 5 — 30 минут тихий щелчок, отчетливо слышимый в паузе, в тихом зале. прощупал все каскады осциллографом, заменил электролиты, лампы (УНЧ гибридного типа). Но дальше просто не было времени и сил искать. Так и работал он, «с тиканьем». На концертах не мешало, зрители не замечали или обращали внимание. Но звукооператоры были в бешенстве — «на нервы действует»!
Простите, вопрос дилетанта: а возможна ли какая-нибудь эээ активная защита от подобных угроз? Защитное поле, экран. Пусть не сейчас, но в обозримом будущем
Создание защитного поля или экрана — затратно по энергии и/или по массе. Сейчас и в обозримом будущем будут использовать сочетание конструктивно-топологических (схемотехника, топология), архитектурных методов и помехоустойчивое кодирование.
Ну я так понимаю, существующие методы не обеспечивают защиты как таковой? Они просто смягчают последствия
Ну почему же: аппаратура упомянутых UoSAT'ов была с защитой критических памятей кодом Хэмминга. Если бы в этих памятях были сбои, не удалось бы передать данные, а то и вовсе спутники бы потеряли. А события (т.е. попадания ОЯЧ в чувствительную область) — были в большом количестве, о чём говорят данные по (специально) незащищённым памятям.
Надо помнить, что сбой может быть не страшен — отказ страшен всегда. Защита от отказов — топологическая (охранные кольца и др.), технологическая (кремний на изоляторе и др.), архитектурная (холодный резерв и др.) и аппаратурная (монитор тока потребления и др.).
«Защиту как таковую» может обеспечить только отключение ядерных реакций в звездах.
А существующие методы да, делают так, чтобы сбои не влияли на работу системы.
Кстати добавлю, что частицы из космоса и до земли долетают, я писал статью как их фотографировать:
geektimes.ru/post/283914
Спасибо! Правда, я думаю, что наблюдали Вы продукты не космического, а земного происхождения. См., например, Удельные активности Ra-226 и Th-232 в различных строительных материалах (стр. 19): www.ncm.unn.ru/files/2015/11/Radioactivity_in_the_environment.pdf
Чтобы понять, какие именно частицы Вы видели, нужно оценить
— величину ионизации вещества,
— кривизну траектрии частиц в камере Вильсона в магнитном поле,
— длину пробега в веществе.
В НИЯУ МИФИ есть интересная лаба на эту тему (5.15, стр. 45):
www.docme.ru/doc/1345621/surkov-laboratornyj-praktikum-atomnaya-fizika-2012
Sign up to leave a comment.

Articles