Articles / Bookmarks / Profile of r12doc / Habr

@r12doc

User

ProfileArticlesPostsNewsComments14

Razant May 22 2024 at 09:47

Большие языковые модели гораздо линейнее, чем мы думали

Hard

4 min

19K

AIRI corporate blogNatural Language Processing*Artificial IntelligenceMachine learning*Algorithms*

Case

Хабр, привет! Это снова Антон Разжигаев, аспирант Сколтеха и научный сотрудник лаборатории Fusion Brain в Институте AIRI, где мы продолжаем углубляться в изучение языковых моделей. В прошлый раз мы выяснили, что эмбеддинги трансформеров-декодеров сильно анизотропны. На этот раз я бы хотел рассказать об их удивительной линейности, ведь нашу статью про обнаруженный эффект («Your Transformer is Secretly Linear») несколько дней назад приняли на международную конференцию ACL!

+68

agusarev96 May 22 2024 at 10:15

Распознавание капчи при помощи CNN модели

Medium

11 min

4.6K

Python*Machine learning*

From sandbox

Привет, Хабр!

Хочу поделиться своим опытом предобработки картиной с капчей и созданием модели, которая может определить, что же за символы в этой картинке. Код с архитектурой модели и обучением тоже будет, но основной упор часть с предобработкой картинок, поскольку это самая сложная часть. Также стоит упомянуть о допущениях, которые делались для упрощения задачи: использовались только латинские буквы (без цифр), все буквы в верхнем регистре, все капчи состоят из четырех символов (это самое серьезное допущение).

Нажмите, чтобы подвердить, что вы не робот

Cloud4Y May 22 2024 at 13:39

Город в бутылке — движок Raycasting всего на 256 байт

8 min

17K

Cloud4Y corporate blogProgramming*Perfect code*

Tutorial

Translation

Привет любителям микро-кодирования. Вот вам кое-что невероятное: крошечный движок raycasting (метод “бросания лучей”) и генератор городов, который помещается в отдельный 256-байтовый HTML-файл.

+66

PatientZero May 20 2024 at 08:00

Двоичный поиск против вероятностного

Easy

7 min

6.9K

Programming*Algorithms*Database Administration*

Review

Translation

Внутри Dolt, первой в мире базе данных SQL с полнофункциональными возможностями контроля версий, таится много интересной computer science. Недавно я писал о системе хранения Dolt, в ней есть очень тонкая особенность — применение вероятностного поиска на больших выборках 64-битных целых чисел.

В любом учебном плане по Computer Science есть курс алгоритмов. Моим был CS 102, и одним из пунктов, который объяснялся в нём досконально, было то, что поиск — это, по сути, задача O(log2(N)) при условии, если данные отсортированы. За свою карьеру я многократно встречался с этим в том или ином виде — если сортируешь информацию и сохраняешь её, то стоит ожидать, что для поиска потребуется время O(log2(N)). В общем случае мы соглашаемся на время поиска O(log2(N)), потому что оказывается, что можно перебрать большой объём данных с логарифмическим коэффициентом масштабирования. Эта система работает, потому что мы уже почти автоматически сортируем всё заранее.

Но что если мы добавим дополнительные ограничения на наши данные, которые позволят нам выполнять поиск за константное время?

Будет ли эта статья историей о необязательной оптимизации? Да, будет. В этом конкретном случае поиск будет занимать гораздо меньше времени, чем чтение с диска. Мы говорим о величинах менее чем 0,1% от суммарного времени. Будет ли эта статья историей о преждевременной оптимизации? Нет, не будет. Это бы подразумевало, что мы не осознаём, что время тратится не на то. Эта статья — история о заманчивости алгоритма константного времени.

+28

ru_vds May 20 2024 at 13:00

Compiler Explorer — уникальный проект для исследования компилируемого кода

Medium

7 min

14K

RUVDS.com corporate blogAssembler*Compilers*Programming*

Review

Translation

Этот пост посвящён замечательному инструменту, полезному для каждого, кто интересуется компиляторами или архитектурой компьютеров. Это Compiler Explorer, который я в дальнейшем будут называть CE.

CE — потрясающий инструмент. Если вы с ним не знакомы, то прервите чтение и перейдите на веб-сайт CE, где вы увидите примерно такой экран:

Предупреждение: вы забираетесь в «кроличью нору», на которую можете потратить несколько часов своего времени.

В основе CE лежит очень простая идея. Достаточно ввести исходный код в левую панель, и сайт мгновенно покажет вам на правой панели скомпилированный результат (обычно на языке ассемблера).

CE поддерживает 69 языков, более двух тысяч компиляторов и широкий спектр архитектур, включая x86, arm, risc-v, avr, mips, vax, tensa, 68k, PowerPC, SPARC и даже древний 6502.

То есть теперь для просмотра результата работы компилятора достаточно открыть godbolt.org и скопировать туда блок кода.

Это само по себе удивительно, но у CE есть гораздо больше возможностей. Это инструмент, который должны знать все интересующиеся компиляторами и архитектурами компьютеров. В статье мы сможем лишь поверхностно рассмотреть функции CE. Вам стоит самим перейти на сайт CE и попробовать всё самостоятельно.

Читать дальше →

+80

mynameco May 20 2024 at 21:32

Delta-Rle-Huffman (DRH) Texture Format

8 min

4.2K

Abnormal programming*Algorithms*Image processing*C#*Data compression*

Всем привет! В этой статье я опишу алгоритм работы формата сжатия изображений без потерь. Сжатие использует известные методики, которые и дали ему название. Проект начинался с простых экспериментов, которые вышли из под контроля. Не смотря на то, что формат чаще сжимает лучше чем png, никакого практического применения этот формат не имеет, оставаясь чисто академическим.

Внимание! В статье много картинок.

Кому интересно, добро пожаловать под кат!

+53

vasilisa_b May 21 2024 at 08:05

Наука против возраста: как перепрограммировать организм

Easy

8 min

Газпромбанк corporate blogPopular scienceHealth

Победить старение человека и позволить ему обрести вечную (ну, или хотя бы более продолжительную) жизнь — одна из самых желанных и труднодостижимых целей науки. Огромное количество загадок, связанных с причинами и механизмами этого процесса, делало задачу нереальной. Но в последние годы ученые, кажется, нашли способ не просто останавливать старение, но обращать его вспять.

Вообще, этот текст совсем не похож на то, что мы обычно публикуем на Хабре. Но мимо такой темы пройти очень сложно: слишком редко в этой области случаются прорывы, подобные этому. Ну, и потом, решение вопроса старения очень похоже на попытки разобраться, как работает код, местами еще и обфусцированный, чтобы заставить приложение делать то, что нужно. На этом заканчиваем оправдываться и переходим к сути.

+13

Hanamime May 21 2024 at 08:14

Алгоритмы, вдохновлённые природой

Hard

7 min

6.2K

Сбер corporate blogAlgorithms*Mathematics*Biology

Review

В последние годы в нашей повседневной речи плотно закрепилось словосочетание «нейронные сети». Этот термин означает набор методов и программных решений из машинного обучения, дискретной математики и информатики. Но про что совсем часто забывают — он происходит из нейробиологии. Несмотря на очевидное название, нейросети — это не набор операторов IF и ELSE, а модели, вдохновлённые нервной системой живых организмов. Их эффективность в пору, когда у нас есть такие генеративные модели как GigaChat и Kandinsky, наглядно видна каждому.

Но окружающая нас живая природа не ограничивается одними лишь нейронами. Наблюдение за поведением от крошечных клеток до колоний в миллионы особей подарило нам множество полезных математических алгоритмов. И продолжает дарить дальше. Остаётся только догадываться, сколько всего нам ещё предстоит открыть. Да, математикой и компьютерными науками можно заниматься не только в лаборатории над микроскопом, но и вовсе в полевой экспедиции.

И именно об этом я хочу рассказать в этой статье, заодно показав, сколь тонка грань между нашими творениями из бездушного кремния и металла и окружающим нас царством жизни.

+27

freQuensy23 May 21 2024 at 08:47

Разбираем KAN по полочкам

4 min

8.8K

Mathematics*Machine learning*

Analytics

Недавно аспиранты из MIT выпустили очень интересную статью про концептуально новый подход к проектированию наверное самого базового "кирпичика" нейронок - полносвязного слоя.

Постараюсь дать небольшое описание того, что происходит под каптом кана, при этом не превращая публикацию в учебник по матанализу

+27

FirstJohn May 21 2024 at 09:25

Новый прорыв приближает умножение матриц к идеалу

Medium

7 min

42K

FirstVDS corporate blogMathematics*Algorithms*

Digest

Translation

Устранив скрытую неэффективность, учёные придумали новый способ умножения больших матриц, который работает быстрее, чем когда-либо.

Учёные, занимающиеся информатикой, — это требовательная группа. Им недостаточно получить правильный ответ — цель почти всегда состоит в том, чтобы получить ответ как можно эффективнее.

Возьмем, к примеру, умножение матриц или массивов чисел. В 1812 году французский математик Жак Филипп Мари Бине разработал базовый набор правил, которым мы до сих пор обучаем студентов. Это работает прекрасно, но другие математики нашли способы упростить и ускорить процесс умножения матриц.

+52

Tapatakt May 21 2024 at 11:54

В остаточном потоке трансформеров представлена геометрия состояний их убеждений

Medium

15 min

1.4K

Machine learning*Artificial Intelligence

Analytics

Translation

Какую вычислительную структуру мы встраиваем в LLM, когда обучаем их предсказанию следующего токена? В этом посте мы представляем свидетельство того, что это структура задаётся мета-закономерностями обновления убеждений о скрытых состояниях генерирующего данные процесса.

aio350 May 21 2024 at 14:01

Туториал по Tokio. 1/2

Medium

35 min

14K

Timeweb Cloud corporate blogRust*Decentralized networks*Programming*System Programming*

Tutorial

Translation

Hello world!

Представляю вашему вниманию первую часть туториала по Tokio.

Tokio — это асинхронная среда выполнения (runtime) кода Rust. Она предоставляет строительные блоки, необходимые для разработки сетевых приложений любого размера.

Читать дальше →

+34

digit4lsh4d0w May 21 2024 at 15:42

Реализация Streebog256 и Streebog512 на языке RUST

Easy

18 min

3.6K

Information Security*Cryptography*Programming*Algorithms*Rust*

Tutorial

Как и планировалось, следом за реализацией семейства хэш-функций SHA, появляется Стрибог и тоже в двух версиях, для 256 и 512 бит на выходе. Надеюсь эта статья будет полезна другим студентам. Более опытные разработчики в комментариях приветствуются.

Весь код сохранен в репозитории GitVerse.

+13

The-Founder-1 May 17 2024 at 03:07

Ансамблевое обучение для самых маленьких

Medium

13 min

4.6K

Python*Programming*Machine learning*Artificial Intelligence

Review

В прошлой статье мы лишь мельком затронули такую тему, как ансамблевое обучение, дав краткое определение парочке терминов. Сегодня в планах зарыться в это дело подробнее, рассмотрев некоторые из популярных методов. Поэтому предупреждаем сразу: букв будет много. А также концептов, терминов и примеров. Со своей стороны обещаем рассказать настолько простым языком, насколько это возможно в контексте машинного обучения. В любом случае располагайтесь поудобнее. Мы здесь надолго.

SLY_G May 17 2024 at 07:21

Учёные связали органические молекулы с гидротермальными источниками на Энцеладе

5 min

1.4K

Popular scienceAstronomyBiology

Translation

Несмотря на огромное расстояние между нами и сверкающим спутником Сатурна Энцеладом, этот ледяной спутник с океаном является главной целью в наших текущих поисках внеземной жизни. Он выбрасывает в космос водяной пар и крупные органические молекулы через трещины в своей ледяной оболочке, которая относительно тонка по сравнению с другими ледяными океаническими спутниками, такими как Европа Юпитера. Хотя она всё ещё находится вне пределов досягаемости, научный доступ к её океану не так сложен, как у Европы, ледяная оболочка которой гораздо толще.

Наличие крупных органических молекул не вызывает особых споров. Но они не обязательно означают, что в древнем, невидимом океане скрывается что-то живое. Напротив, они могут образовываться в результате гидротермальных процессов. Сложность в том, что гидротермальные процессы также могут быть связаны с возникновением жизни.

SLY_G May 17 2024 at 09:53

AlphaFold 3 предсказывает структуру и взаимодействие всех молекул жизни

Medium

6 min

4.1K

Translation

Внутри каждой растительной, животной и человеческой клетки находятся миллиарды молекулярных машин. Они состоят из белков, ДНК и других молекул, но ни одна из них не работает сама по себе. Только наблюдая за тем, как они взаимодействуют друг с другом в миллионах комбинаций, мы можем по-настоящему понять жизненные процессы.

В статье, опубликованной в журнале Nature, мы представляем AlphaFold 3 — революционную модель, которая может предсказать структуру и взаимодействие всех молекул жизни с беспрецедентной точностью. Для взаимодействий белков с другими типами молекул мы наблюдаем как минимум 50-процентное улучшение по сравнению с существующими методами предсказания, а для некоторых важных категорий взаимодействий мы удвоили точность предсказания.

Flokis_guy May 17 2024 at 11:20

Интуитивное понимание пространств и ядер в машинном обучении: Часть 1

Hard

9 min

12K

Data Mining*Mathematics*Machine learning*Artificial Intelligence

Tutorial

При изучении темы ядер (kernel) в ML/DS программы вузов, роадмэпы и видео на YouTube обычно рассматривают её через призму SVM, не говоря уже о всеми любимых курсах:). Казалось бы, это неплохо: вот тебе краткое объяснение и модель, которая использует ядра. Но, увы, в этих областях желательно понимать многие процессы интуитивно, так сказать — «тяжело в учении, легко в бою». К тому же, эта тема нечто большее, чем просто метод; она позволяет связать многие вещи в машинном обучении в единую картину через пространство, что я и хочу показать в этой статье.

+20

aabzel May 18 2024 at 00:07

КодоГенератор Линейных Отображений (как ускорить создание ASIC драйвера)

Easy

5 min

2.3K

C*Mathematics*Industrial Programming*Programming microcontrollers*DevOps*

Tutorial

В программировании микроконтроллеров на Си часто приходится писать драйверы для умных и навороченных ASIC чипов с управлением по I2C/SPI/MDIO интерфейсам.

Обычно перед запуском эти чипы надо правильным образом сконфигурировать.

Такие чипы всегда оперируют с реальными физическими величинами. Одновременно с этим ячейки памяти этих ASIC чипов - дискретные, двоичные. Поэтому все производители микросхем кодируют эти переменные бинарными кодами разной разрядности.

В этом тексте я показал как можно делать интерпретаторы этих величин.

aansty4U May 18 2024 at 14:30

За гранью возможного: создание полимерных электродов, способных восстановить зрение

5 min

5.3K

BotHub corporate blogPopular scienceHealth

Review

Исследователи разработали крошечный имплантат с гибкими полимерными электродами, который может оставаться целым в теле, предоставляя потенциал для будущих зрительных имплантатов для слепых. Этот имплантат может стимулировать зрительную кору мозга, создавая изображения с помощью множества электродов, действующих как отдельные пиксели.

Имплантируемые электроды зачастую негативно воспринимаются обществом, из-за недостаточной информации об эффективности и биосовместимости спустя какое-то время пребывания в организме, ограничиваясь первичными успехами. Это исследование затрагивает производительность и состояние электродов (и тканей мозга) как в начале экспериментов, так и спустя 55 недель!

Подробнее об исследовании далее в статье! Приятного прочтения :)

+26

veseluha May 18 2024 at 15:00

DIY для шпиона: использование обнаружения объектов с помощью YOLOv8 в рамках военных стратегий

8 min

9.8K

BotHub corporate blogMachine learning*Artificial IntelligenceDIY

Translation

Применим геопространственную разведку для точного количественного учета воздушных судов противника? Используем для этого технологию обнаружения объектов YOLOv8 на основе аэрофотосъемки, выполненной разведывательными беспилотниками, что обеспечит надежное планирование военных действий.

В рамках глобальной системы мониторинга, известной как «The Machine». , функционируют разнообразные элементы. Данная система объединяет множество устройств, распределенных по всему земному шару, что обеспечивает комплексное наблюдение. Это позволяет государственным органам осуществлять мониторинг за индивидуальными лицами, анализировать общественные поведенческие тенденции и контролировать военные объекты на международном уровне. Геопространственная разведка (GEOINT) занимает центральное место в этой системе.

В этой статье основное внимание уделим GEOINT в качестве ключевого средства для мониторинга военных авиабаз противника. Такой подход к наблюдению за объектами и базирующейся на них авиацией способствует глубокой проработке стратегии и тактики ведения боевых действий.

+24

1 2 3 4

6 7 8 9 10