Как стать автором
Обновить
2
0.1
Drone @dorne

Пользователь

Отправить сообщение

Есть более простые способы консервации, чем заморозка.
https://patents.google.com/patent/RU2322058C2/ru
Это 2005ый год.
И, восстанавливать полную последовательность ДНК из фрагментов за счет избыточности уже тоже научились.

донорский биоматериал из образца кожи

Образец кожи называется, - "соскоб".

привез ткани животного

Кожа, это вид ткани живого существа. Еще можно взять волосы или шерсть. Это тоже виды ткани.

Клонированный эмбрион, - это когда берут яйцеклетку у другого живого существа, возможно, даже, другого вида, например, собаки, и заменяют в ней ДНК на то, что было извлечено из образца ткани, получая таким образом "клонированный эмбрион арктического волка".

Неизвестного охотника и лабораторию, конечно, не нашли....

Скорее всего вы неверно понимаете процесс клонирования. Там достаточно даже простого соскоба с поверхности кожи. Причем клетки не обязательно должны быть живые. Иначе бы были невозможны попытки восстановления давно вымерших видов.

На современном уровне даже набор полностью целых цепочек ДНК вроде не нужен. Их можно из сохранившихся фрагментов собрать.

Сейчас это просто способ попиарится, ну, еще, и, немного, задел под контроль общественного мнения, который, со временем, превратится в инструмент управления индустрией и сдерживания конкурентов.

Это все будет развиваться по тем же лейкалам, что поддержка эко-движения, которая сначала была просто способом попиариться, потом полилась куча антипиара на тех, кто не участвует и не поддерживает, а, потом, некоторые "экоактивисты" переквалифицировались в "экотеррористов".

Корпорации, которые поддерживают, естественно, нипричем, но, изначально, видят, куда все идет, и, с самого начала, хотят находиться с "правильной" стороны забора.

"Не можешь побелить, - возглавь." (с)

"Пчёлы против меда..." (с)

К сожалению, бывают плавающие ошибки. Поэтому, тестирование производится еще на заводе в запредельных режимах эксплуатации, которые никогда не достигаются в условиях конечного потребителя.

Есть специальные регистры программируемой ПЗУ на основе "пережигаемых предохранителей" a.k.a fuse. Плюс, на эти регистры можно программно накладывать маски отключая некоторые дополнительные блоки.

В процессе тестирования кристалла fuse-регистр пустой, а тестовая программа перебирает различные комбинации масок, таким образом выясняя, какие блоки рабочие. После завершения тестирования в fuse-регистр прописывается маска, которая намертво блокирует блоки, которые в результате тестирования были выявлены как неисправные.

Регистр же остается доступным пользователям, позволяя, например, дополнительно отключить часть ядер или кэш-памяти ЦП.

Я думаю, что заблокированные пользователи переехали на другие площадки, и, заодно, решили перевести на них всю аудиторию той площадки, которая их заблокировала, устранив, таким образом, конкурентов. Как своих, так и площадок, на которых они теперь публикуются.

Ничего личного... Просто бизнес... (c)

Большинство LLM в данный момент для комфортного использования (в real-time) на десктопных видеокартах упираются именно в пропускную способность и/или объем памяти. При этом, все технологии, необходимые для увеличения и того, и другого, уже давно существуют и используются в специализированных процессорах для AI. С точки зрения чисто вычислительных возможностей же современные топовые видеокарты и так уже находятся на уровне AI ускорителей или близко к ним.

Увеличение видеопамяти и её пропускной способности (переход на HBM) искусственно ограничивается с целью сегментирования/разделения рынка.

Появление спроса рано или поздно приведет к изменениям на десктопном рынке, и эти технологии станут доступны и на десктопе.

Интересно, а мышкам с клавой тоже будут накидывать баллы за "совместимость с ОС"?

Ну, это вы, видимо, клавиатур и мышек несовместимых из коробки с Linux не встречали... А они есть.

Ставишь какую-нить вполне себе импортную Убунту, а там клавиатура не работает. Вообще. Причем, чем "навороченнее" и "круче" бренд, тем чаще это встречается.

Если вы не используете шифрование. Иначе, сжатие не работает.

Из-за этого, как раз, производители, зачастую, уходят от практики сжатия данных на SSD.

Статья как раз о том, что предлагается новое решение, которое по задержкам раза в два-три быстрее чем свопинг VRAM в RAM.

PCIe Gen5x16 примерно как 1-2 планки DDR5 по пропускной способности. Но, конечно, медленнее, чем специализированная память GPU. Однако, Gen7 уже будет сравнимо с встроенной памятью GPU.

Но, это не так важно. Тут решение, как раз, походу, предлагается для случаев, когда объем важнее пропускной способности. Они там даже SSD прикрутили.

Ваш аргумент именно про производительность вставки (и даже проверки).

Структура, которую я описал выше, при прочих равных (и при условии правильного подбора fill factor и длины сигнатуры), может давать меньшую вероятность ошибки, занимать меньше места в памяти, и показывать лучшую производительность, чем фильтры Блума как на вставке, так и на проверке.

Все вместе и одновременно.

Причем, это самая простая в реализации альтернатива фильтрам Блума.

Помимо этого, есть более сложные и еще более эффективные варианты с точки зрения потребления памяти, сравнимые по производительности на проверке:

https://en.wikipedia.org/wiki/Cuckoo_filter

https://arxiv.org/abs/1912.08258

Но, там вставка медленная.

На самом деле, отдельных статей на эту тему я не видел. Вероятно, потому, что это просто частный случай хэш-таблицы. Причем, один из самых тривиальных по построению.

Для анализа вероятностей с минимальными изменениями работает математика, описанная здесь:

https://preshing.com/20110504/hash-collision-probabilities/

Для реализации и понимания механизма работы достаточно вот этого:

https://ru.wikipedia.org/wiki/Линейное_зондирование

Используется тривиальное зондирование с шагом 1. С учетом того, что нам не требуется (в силу невозможности реализации) удаление ключа из таблицы и изменение её размера, реализуются только упрощенная вставка и поиск. Оба алгоритма тривиальны и представляют собой простой цикл.

На практике я встречал (и сам писал код) для частного случая с фиксированной длиной сигнатуры в 32 бита. В этом случае не надо возиться с битовой арифметикой и алгоритмы становятся совсем тривиальными. 32 бита дают вероятность ошибки примерно в 0,0000001% (один на миллиард), что более чем достаточно для большинства сценариев, и, в качестве бонуса, допускают атомарную вставку.

Технически структура применяться может везде где могут использоваться фильтры Блума, за исключением случаев, где требуется удаление (фильтры с счетчиками) или свойство комбинации фильтров Блума через логическое OR (семантика объединения множеств).

Дополнительно, т.к. результатом поиска/вставки является не только признак успеха, но и индекс в массиве сигнатур, то, структуру, дополнительно, можно использовать как отображение (map), используя этот индекс для доступа к данным в другом массиве. Это хорошо подходит для организации всевозможных кэшей, in-memory key-value хранилищ, баз данных и индексов. Можно использовать везде, где требуется высокая производительность и работа с большими объемами данных.

Например, для реализации операции Hash Join при выполнении запроса в БД.

Бабло побеждает зло. ©

Думаю, что "бабло", конечно, важный фактор, но, в списке приоритетов при принятии такого решения он не на первом месте, вероятно.

Однако, политика и пиар тут, вероятно, имеют больший приоритет.

Тут "имеет место быть" своеобразная дилемма:

С одной стороны, полное отключение всего (почти) возможно технически, и, вероятно, принесет значительный ущерб "подсанкционным юрисдикциям".

С другой стороны, этот инструмент одноразовой, и, вероятно, не приведет к полному коллапсу. В итоге, будут потеряны бесценные инструменты для мониторинга и слежки (гуглить по словосочетанию third-party doctrine). Будет создан колоссальный стимул для роста "постиндустриального аспекта" и "цифровой" экономики в подсанкционных юрисдикциях. Будет колоссальный ущерб в 3-их странах, которые находятся "в зоне санкционного риска". Со временем будет потерян "политический" эффект.

Так что, политикам, как оказалось, выгоднее всего, чтобы жители подсанкционных юрисдикций, как в старом анекдоте, "плакали, кололись, но, продолжали жрать кактус".

МС, же, претендует на деньги, и, существенно снижает (хоть и не устраняет) репутационный и экономический ущерб.

Замечу, что МС, - Американская компания, а, санкция, - Евросоюза. Так что, скорее всего, просто перекроют каналы поставок, проходящие через Евросоюз, и перенаправят пользователей на дата-центры за пределами ЕС. А остальные каналы, - останутся. Пока, конечно, не изменится политическая ситуация. И, тут, конечно, никто гарантий никогда не даст.

Фильтры Блума, это хорошая структура с красивой математикой, однако, на современных ЦП они являются неэффективными с точки зрения производительности на больших объемах данных. Причин тому две:

  1. Необходимо вычисление большого количества хэш-функций, что создаёт большое количество ситуаций branch-mispredict.

  2. Случайный доступ к одному биту в большом массиве повторяется для каждой хэш-функции. Это генерирует большое количество ситуаций cache-miss и доступов в память, что очень медленно. Это неэффективно расходует пропускную способность шины памяти, т.к. ради одного бита мы читаем из памяти ~256 байт (а то и больше).

Гораздо более эффективно на современных ЦП работает простая хэш-таблица с linear-probing для разрешения коллизий, которая содержит не сами ключи, а их хэши (сигнатуры), посчитанные второй хэш-функцией.

Итого, имеем всего две хэш-функции. Одна для вычисления смещения в массиве сигнатур. Вторая для вычисления самой сигнатуры.

В приведенном выше примере:

Допустим, существует 1 000 000 вредоносных ссылок по 20 символов каждая,
что составляет 20 МБ. Однако, если мы готовы принять вероятность ошибки
в 0,0001% (1 на миллион), можно использовать фильтр Блума. Это позволит
хранить те же данные всего в 3,59 МБ.

С такой структурой нам потребуется всего 3,27 MB для хранения 1 000 000 ключей и обеспечения вероятности ошибки в 0,0001% при заполнении таблицы в 75% и длине сигнатуры 22 бита.

При этом, структура будет работать гораздо быстрее фильтров Блума, т.к. мы будем делать всего 1-2 случайных доступа в память, и считать всего два хэша.

П.С.

Спасибо фильтрам Блума, но, им пора на пенсию!

Важно то, что есть и такие, и такие. И раньше, в обоих случаях нужна была соль, а теперь только в одном.

Солью не только при гололеде пользуются. А всю зиму. Пока не потеплеет.

Позже начнешь пользоваться, раньше закончишь. Отсюда экономия.

Эта система, по сути, запасает энергию днем, когда тепло, а, потом, медленно отдает её ночью. До тех пор, пока днем будет температура подниматься выше +3-5, запасенной энергии будет хватать, чтобы не дать образоваться гололеду ночью при -3-5.

То есть, значительную часть периода, когда ночью уже минус, а днем еще пока плюс, можно не пользоваться солью и снегоуборочной техникой.

1
23 ...

Информация

В рейтинге
2 934-й
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность