Search
Write a publication
Pull to refresh
48
0
Alice V @oisee

Ms Dev

Send message

Как обучать огромные модели машинного обучения на случайных GPU

Reading time11 min
Views11K
Вы можете спросить: почему эти полумагические модели машинного обучения работают так хорошо? Короткий ответ: эти модели чрезвычайно сложны и обучаются на огромном количестве данных. На самом деле, Lambda Labs недавно подсчитала, что для обучения GPT-3 на одном GPU потребовалось бы 4,6 миллиона долларов — если бы такое было возможно.

Такие платформы, как PyTorch и Tensorflow, могут обучать эти огромные модели, потому что распределяют рабочую нагрузку по сотням (или тысячам) GPU одновременно. К сожалению, этим платформам требуется идентичность графических процессоров (они должны иметь одинаковую память и вычислительную производительность). Но многие организации не имеют тысячи одинаковых GPU. Малые и средние организации покупают разные компьютерные системы, что приводит к неоднородной инфраструктуре, которую нелегко адаптировать для вычисления больших моделей. В этих условиях обучение моделей даже среднего размера может занимать недели или даже месяцы. Если не принять меры, университеты и другие небольшие организации рискуют потерять конкурентоспособность в погоне за разработкой новых, лучших моделей машинного обучения. Но это можно исправить.

В этом посте представлена предыстория и практические шаги по обучению BERT с нуля в университете с использованием пакета HetSeq. Это адаптация популярного пакета PyTorch, которая предоставляет возможность обучать большие модели нейронных сетей на гетерогенной инфраструктуре.


Приятного чтения!

Какой софт и базы использует Bellingcat в своих расследованиях?

Reading time7 min
Views127K


Весь мир обсуждает последнее расследование детективного агентства Bellingcat. Кажется невероятным, что группа обычных пользователей способна распутать такое дело. При этом они используют стандартные инструменты и базы данных, зачастую доступные в интернете.

Неужели сегодня можно раскрыть преступление вообще не вставая из-за компьютера? Только на основании следов, которые люди оставляют в базах данных, в истории мессенджеров, в логах операторов связи, на камерах наблюдения?

Или это фантастический киберпанк?
Читать дальше →

Планировщик Windows? Это очень просто

Reading time19 min
Views22K

Реализация одной из ответственных задач моделирования в очередной раз привела к сложностям с операционной системой (ОС). Попытка решить задачу «под Windows», т.е. просто запустить программу, не применяя специальных средств, почти удалась, однако время от времени возникали недопустимые задержки. Эти, возникавшие случайно и редко (раз в несколько минут) задержки никак не удавалось убрать. Например, последовательное снятие всех «лишних» процессов Windows улучшало ситуацию, но, в конце концов, приводило к отказу самой ОС. Положение затрудняло и то, что проведение сравнительно долгого сеанса моделирования не позволяло на все 20-30 минут сеанса установить работающему потоку приоритет «реального времени», так как при этом нормальная работа компьютера нарушалась. Таким образом, несмотря на мощный и гибкий механизм планирования на основе приоритетов, потребовалось особое планирование, не предусмотренное в Windows, а именно: заданный поток в течение определенного периода не должен прерываться по истечению кванта времени, и на время его работы потоки с более низким приоритетом вообще не должны получать управление. Но при этом потоки с изначально более высоким приоритетом должны выполняться как обычно. Поскольку такие высоко приоритетные потоки обычно не занимают весь свой квант времени, время отклика для нужного потока в целом уменьшается и зависит от быстродействия компьютера.

Встал вопрос: можно ли настроить Windows на такой режим работы и как это сделать?

Читать далее

Фронтендеры — герои. Yehuda Katz объясняет почему

Reading time6 min
Views22K

Идея что фронтенд это "для джунов", расстраивает меня тем, что никто не скажет так про другие специализации.

Кто-то может сказать, что неплохо, если б автор компилятора был более "фуллстековым".

Но они не скажут, что "писать компиляторы это для джунов".

Это перевод треда Yehuda Katz из твиттера. Под фронтендом здесь подразумеваются именно браузерные приложения на JS (и, отчасти, вся JS-экосистема).

Читать далее

Создаем приложение на Node.JS, Express и Typescript с Jest, Swagger, log4js и Routing-controllers

Reading time7 min
Views64K
Это пошаговая инструкция создания приложение на Node.JS, с использованием typescript и express. Новое приложение создается не часто, отсюда забываются шаги по его созданию. И я решил написать некую шпаргалку, в помощь самому себе и другим разработчикам. Помимо шагов, я так же снял небольшие видео ролики для наглядности. Существуют уже готовые фреймворки для Node.JS, которые уже содержат в себе все необходимые пакеты и можно работать с ними, но это уже другой путь. Идея была в том, чтобы не зависить целиком от какого-то фреймворка и в случае необходимости менять одни пакеты на другие.
Читать дальше →

Эмуляция компьютера: интерпретатор CHIP-8, графика и стриминг текстур

Reading time6 min
Views3.3K
В прошлый раз мы остановились на том, что создали интерпретатор CHIP-8 и оснастили его системой для формирования кадров. Видеть то, что должно попасть на экран, можно в консоли. Теперь же мы собираемся взять то, что формирует интерпретатор, вынести это за пределы консоли и показать на экране.

Решать вышеозначенные задачи мы будем с помощью библиотеки SDL, которая умеет выводить графические данные на экран, принимать то, что вводит пользователь, и проигрывать звуки. Настройка SDL-проекта может вызвать некоторые сложности. Поэтому я рекомендую перед началом работы с библиотекой почитать мой материал о ней.



Есть много способов вывести что-либо на экран с использованием SDL. В играх, в основном, изображения не формируются, как в нашем случае, средствами CPU. Но при эмуляции и (что встречается чаще) при воспроизведении видео изображение (вполне возможно — сжатое) готовится к выводу средствами CPU. Такое изображение, для вывода его на экране, нужно загрузить в GPU. После того, как изображение попадёт в GPU, мы называем его «текстурой», а весь этот процесс называют «стримингом текстур».
Читать дальше →

Представлен дистрибутив Linux Mint 20.1

Reading time3 min
Views43K

Пару дней назад разработчики Linux Mint выложили новый релиз Linux Mint 20.1, который является продолжением ветки Ubuntu 20.04 LTS. Особенность новинки — полная совместимость с Ubuntu, но разный подход к организации интерфейса пользователя и подбора используемых по умолчанию приложений.

Что касается интерфейса, то пользователи получают классический рабочий стол, отличающийся от GNOME 3. Что касается оболочек, доступны сборки для MATE 1.24 (1.9 ГБ), Cinnamon 4.8 (1.9 ГБ) и Xfce 4.14 (1.8 Гб). Хорошая новость для пользователей Linux Mint 20: он будет получать обновления вплоть до 2025 года.
Читать дальше →

Грозит ли лунному льду загрязнение от грядущей экспансии?

Reading time6 min
Views5.3K
image

В прошлом месяце Китай своей миссией по доставке образцов лунной породы подстегнул других игроков к активному освоению Луны. По крайней мере, восемь космических аппаратов из таких стран, как Россия, Индия, Китай, Япония и США должны сесть на поверхность Луны в ближайшие три года.

Впервые за все время изучения Луны будут исследованы некоторые из наиболее интригующих с научной точки зрения, но и чувствительных ее регионов — те, что находятся на полюсах. Ученых интересует вода, которая находится в замороженном состоянии в затененных кратерах. Но они также обеспокоены тем, что увеличение грузо- и пассажиропотока на Луну может привести к загрязнению самого льда.
Читать дальше →

Проклятье Циолковского и благодать Оберта

Reading time15 min
Views35K

Здравствуйте, уважаемые читатели Хабра.

Продолжаем изучать орбитальную механику на пальце и двух энергиях. В этой статье вы узнаете о формуле Циолковского, эффекте Оберта, чем энергия отличается от импульса, как работают ракеты и всё это на максимально простых примерах с крепкой 90 градусной геометрией.

Эффект Оберта


Начнем пожалуй с Эффекта Оберта, хотя это крайне сложный эффект, но зато разобравшись с ним — мы поймем всю орбитальную физику. Для начала давайте зададимся вопросом — В чем сила, брат? — В лошадиных силах!

Сколько лошадиных сил у ракетного двигателя?

Ответ странный — по разному, один и тот же килограмм топлива в одном и том же двигателе дает разное количество энергии. Причина в разной скорости на которой используется это топливо, чем больше скорость самой ракеты — тем больше энергии дает двигатель, причем этот же двигатель ускоряющий вбок (относительно текущей скорости) — будет давать меньше энергии, чем при ускорении вперед.

Давайте сразу рассмотрим 2 хороших и наглядных примера. Один из Ютуба от гаражного учёного Игоря Белецкого продемонстрировавшего эффект Оберта с помощью шприца, резинки и кое чего еще, а второй пример из Википедии.
Читать дальше →

Ограничен, но не сломлен. Или как игры могут изменить жизнь

Reading time10 min
Views23K

Привет всем. Это моя первая попытка что-то написать, так что не судите строго… Я хотел бы рассказать историю, о том, как люди с ограниченными возможностями смогли побороть эти самые ограничения, и у них получилось не только освоить компьютер и свободно играть в игры, но и получилось начать стримить. Рассказ будет идти от моего лица, но также я расскажу о человеке, без которого этого блога не было бы вовсе. Ну что, начнём.  

 Расскажу очень коротко о себе. Меня зовут Андрей, 27 лет, живу в приморском крае, город Артём. Сомневаюсь,   что вы о нём слышали. Я родился с дцп. Да это то,  чем наш русский народ любит оскорблять друг друга в интернете, возможно даже не осознавая, что это слово значит.

Дцп бьёт каждого по-разному. У кого-то не работают руки, у кого-то ноги, у меня же не работают ноги, и где-то на 80% руки. К  примеру, сейчас я пишу одним пальцем и это ужасно медленно. Ну, хотя бы мозг вроде работает нормально. Всё что я могу — это сидеть в инвалидном кресле и смотреть по сторонам. Но я особо не переживаю по этому поводу, так как моя семья,  и единственный друг сделали всё возможное, и даже больше, чтобы я мог забыть о своём недуге. Но давайте не будем о  грустном, а  перейдем к играм.

Моей первой   игровой консолью стала денди. По началу я просто смотрел, как играли родители. Помню, у них были эпичные замесы в Battle city  или как  у нас их называют «Танчики». 

читать далее

Пишем загрузчик на Ассемблере и С. Часть 2

Reading time10 min
Views11K

В предыдущей статье я рассказал о процессе загрузки, а также продемонстрировал написание загрузочного кода на C и ассемблере, в том числе с вложением инструкций последнего в код первого. При этом мы написали несколько простых программ для проверки работоспособности внедренного в загрузочный сектор кода. В этой же статье мы рассмотрим процесс сегментации и чтения данных с дискеты в ходе загрузки, а также их вывод на экран.

Здесь я ограничусь написанием программы на ассемблере и ее копированием в загрузочный сектор образа дискеты 3.5”, после чего мы, как и в прошлой статье, протестируем записанный загрузочный код при помощи эмулятора bochs. Для реализации этих задач я задействую службы BIOS, что позволит нам лучше понять их функционирование и более уверенно работать в реальном режиме (Real Mode).
Читать дальше →

Самообучение в Data science, с нуля до Senior за два года

Reading time9 min
Views273K

Хочу поделиться методами освоения Data science с нуля человеком из другой ИТ специальности. Цель: дать понять, подходит ли Вам эта специальность в принципе, и рассказать про эффективные подходы к самообучению, которые мне помогли.

Отличные материалы уже существуют по большинству конкретных тем, я сам по ним учился. Думаю, многим будут полезны "мета" материалы о том, как выбирать курсы и статьи, по которым учиться.

Читать далее

Дао программирования

Reading time12 min
Views14K


Книга 1: Безмолвная пустота


Сказано мастером-программистом: "Уходи, когда поймёшь как найти код ошибки в трап фрейме"


1.1


Нечто загадочное сформировалось, зародилось в безмолвной пустоте. Оно одиноко ждёт без движения. Оно замерло, но постоянно двигается. Оно — источник всех программ. Я не знаю его имени и назову его Дао программирования.


 Если Дао прекрасно — операционная система прекрасна.
 Если операционная система прекрасна — компилятор прекрасен.
 Если компилятор прекрасен — приложение прекрасно.
 Пользователь доволен и в мире царит гармония.

Дао программирования уносится вдаль и возвращается с утренним ветром

Читать дальше →

MarkedText — маркдаун здорового человека

Reading time10 min
Views41K

Здравствуйте, меня зовут Дмитрий Карловский и все свои статьи (и презентации) пишу я в MarkDown разметке. И знаете что? Она уже порядочно меня подзаелозила! Тексты я пишу на русском, но большая часть спецсимволов есть только в английской раскладке клавиатуры. А редактирование таблиц - это вечная пизанская башня из вертикальных линий. Короче, есть у него проблемы как с удобством редактирования, так и с наглядностью представления. Так что давайте попробуем спроектировать его с нуля, не таща за собой килотонны головоломных конструкций.

Поехали..

IBM PC/AT

Reading time7 min
Views18K

Представляю вам очередной обзор ретро ЭВМ – на этот раз клона компьютера IBM PC AT, он же 286, он же "двойка" . Несмотря на то, что это клон, он почти один-в-один, вплоть до расположения микросхем на печатной плате, повторяет оригинальный IBM 5170.

Читать далее

Менеджмент будущего. Без начальников, переработок и KPI

Reading time6 min
Views19K

Нанимай людей сильнее себя, сам решай, над чем работать, отдыхай за счёт компании, работай без начальника — и другие удивительные принципы компания Valve опубликовала в своем руководстве для новых сотрудников.

Читать далее

Почему я не могу найти Яндекс.Такси через системный поиск на iPhone?

Reading time2 min
Views27K

Переименовав недавно Яндекс.Такси в «Яндекс Go», разработчики приложения сделали невозможным его поиск через Spotlight по главному ключевому слову — «такси». Однако дело здесь вовсе не в названии, поскольку в iOS давно уже предусмотрено всё необходимое для решения разработчиками «супераппа» сложившейся проблемы. Было бы только желание...

Читать полностью

Пытаясь композировать некомпозируемое: монады

Reading time5 min
Views5.2K

Сколько раз вы слышали эту мантру "монады не композируются"? Я потратил достаточно много времени, чтобы попробовать опровергнуть это утверждение, пытаясь решить проблему в лоб. Но как и многие вещи в математике, порой, чтобы попробовать что-то понять, иногда стоит сменить масштаб.

Читать далее

Более 10 лет ставлю цели на год: рассказываю, как это делать эффективно

Reading time12 min
Views216K

Меня зовут Павел Комаровский, и я алкоголик занимаюсь саморазвитием уже более 10 лет. Эта статья о том, какой подход к личному целеполаганию я выработал для себя в итоге – надеюсь, она поможет вам избежать ошибок, которых в своё время наделал я.

Я полностью прошёл все стадии грехопадения: в студенческие годы искал сакральные ответы в стопках self-help макулатуры; затем разочаровался и решил, что весь этот «успешный успех» – это разводилово для дурачков (до сих пор уверен, что Наполеон Хилл – шизофреник); позже переосмыслил всё ещё раз и пришёл к своему пониманию того, как может выглядеть саморазвитие с адекватным лицом.

Читать далее

Open-source ПК Dragonbox Pyra начали отгружать покупателям после четырех лет разработки

Reading time2 min
Views24K

DragonBox Pyra — карманный (в буквальном смысле слова) компьютер с 5-дюймовым дисплеем, процессором TI OMAP 5 и QWERTY-клавиатурой. В нее же встроены два стика и D-pad.

Устройство разрабатывалось в качестве легко модифицируемой открытой платформы. Поставляется гаджет с Debian Linux, но поддерживаются и многие другие ОС, так что ПК можно использовать в качестве десктопного или игрового. О DragonBox Pyra известно уже давно, но только сейчас его начали отгружать покупателям. К слову, предзаказы на девайс стали принимать еще четыре года назад.

Information

Rating
Does not participate
Location
Dublin, Dublin, Ирландия
Registered
Activity