Articles / Bookmarks / Profile of Tarolrr / Habr

@Tarolrr

User

Profile Publications Comments 8Bookmarks 104

dima_yiu Aug 1 2023 at 12:21

Самое понятное объяснения CFG Scale в нейросетях. Как эта штука повлияла на появление Stable Diffusion

Medium

4 min

17K

Python*Algorithms*Machine learning*Artificial IntelligenceData Engineering*

From sandbox

Меня поразил тот факт, что метод CFG Scale и позволил диффузным моделям родиться. До них были GAN-модели, которые совмещали в себе генератор и дискриминатор. Т.е. моделька сначала генерирует изображение, а потом вторая полноценная модель оценивает его на вшивость и корректирует вместе с первой.

breakmirrors Sep 5 at 13:15

«А можно быстрее?»: разбираем методы ускорения обучения нейронных сетей

Medium

21 min

Magnus Tech corporate blogProgramming*Machine learning*Artificial IntelligenceTensorFlow*

Review

Современные нейросетевые архитектуры достигают впечатляющих результатов в сложных задачах ИИ благодаря росту объемов данных и вычислительных мощностей. Однако обратной стороной медали стала высокая ресурсоемкость обучения.

Например, последняя версия GPT-4 от OpenAI обучалась на большом GPU-кластере. По некоторым данным, она содержит около 1,8 триллиона параметров, а ее обучение обошлось более чем в 100 млн долларов. А модель Llama 3.1 405B, вроде бы оптимизированная под ограниченные ресурсы, все равно требовала более 15 триллионов токенов и свыше 16 тысяч GPU NVIDIA H100.

И хотя нынешнее качество работы LLM уже можно действительно назвать выдающимся, на практике они подкидывают разработчикам широкий ряд проблем производительности: от запредельных объемов данных до оптимизации гиперпараметров. Все это приводит к потребности в ускорении обучения.

Мы подготовили серию материалов, которые помогут разобраться в ускорении обучения нейросетей. В этой статье рассмотрим различные теоретические аспекты от аппаратного ускорения до правильной организации самого обучения, в следующей — поговорим о практике. В общем, нас ждет глубокое погружение в тему. Приятного прочтения!

+28

Mycofarmfungi Jun 24 at 13:10

Научный подход к медитации. Начало пути

Easy

3 min

2.3K

Brain

Review

Главная проблема, когда пишешь про мозг и тонкости его работы, это остаться на грани между научными фактами и субъективным «я так чувствую». Одних только клинических исследований по практикам mindfulness наберется свыше 700. Поэтому, в статье разберем базовые точки, от которых развивается научный подход к медитации.

MechanikArtem May 14 at 10:20

Перчатка-джойстик

Easy

12 min

7.4K

Manufacture and development of electronics*DesignCyberpunkWearable electronics

Case

Это будет история моего проекта, который я развивал, будучи студентом.

Написать этот текст меня заставило следующее.

Во‑первых, хочу обобщить весь опыт разработки и решения по эргономике, в частности, которые я смог сформулировать благодаря обширной базе фидбека пользователей.

Во‑вторых, технические решения, которые я буду описывать, могут помочь тем, кто (то есть, возможно, мне в ближайшем будущем) задумывается над реализацией чего‑то похожего.

+76

murat_apishev Nov 13 2023 at 10:56

«ИИ без границ»: как научить Transformer обрабатывать длинные тексты

Hard

12 min

8.7K

Machine learning*Artificial IntelligenceNatural Language Processing*

Review

Разносторонний системный рассказ о том, какими способами можно научить модель работать с длинными последовательностями. Для специалистов, занимающихся обучением LLM, и всех, кто хочет разобраться в теме.

+30

murat_apishev May 4 2023 at 15:11

Зоопарк трансформеров: большой обзор моделей от BERT до Alpaca

Hard

59 min

21K

Just AI corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Review

Авторский обзор 90+ нейросетевых моделей на основе Transformer для тех, кто не успевает читать статьи, но хочет быть в курсе ситуации и понимать технические детали идущей революции ИИ.

+28

Shannon Nov 28 2023 at 12:14

Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT

8 min

90K

Machine learning*Artificial Intelligence

Есть много локальных аналогов ChatGPT, но им не хватает качества, даже 65B модели не могут конкурировать хотя бы с ChatGPT-3.5. И здесь я хочу рассказать про 2 открытые модели, которые всё-таки могут составить такую конкуренцию.

Речь пойдет о OpenChat 7B и DeepSeek Coder. Обе модели за счет размера быстры, можно запускать на CPU, можно запускать локально, можно частично ускорять на GPU (перенося часть слоев на GPU, на сколько хватит видеопамяти) и для такого типа моделей есть графический удобный интерфейс.

И бонусом затронем новую модель для качественного подробного описания фото.

UPD: Добавлена информация для запуска на Windows с ускорением на AMD.

+102

makushevkm Oct 28 2022 at 15:12

Как улучшить английский в документации

11 min

35K

documentat.io corporate blogLearning languagesTechnical Writing*

Technotext 2022

From sandbox

Я работаю техническим писателем в компании documentat.io. Мы занимаемся заказной разработкой технической документации, в том числе на английском языке. Иногда я дорабатываю уже существующие документы или спецификации к API на английском. Как правило, такие документы написаны русскоязычными разработчиками, которые неплохо владеют английским. И всё же они часто допускают характерные грамматические, пунктуационные и стилистические ошибки.

Корень этих ошибок один — разные языковые механизмы. Нам бывает легко запутаться в употреблении временных форм, порядке слов или непонятно зачем придуманных артиклях.

Поэтому в этой статье я постарался не просто дать рекомендации о том, как можно избежать распространённых ошибок, но и подсветить те отличительные черты английского языка, которые к этим ошибкам приводят.

+97

DAN_SEA Nov 9 2023 at 12:00

Как собрать рентген-аппарат из мотка скотча

13 min

29K

RUVDS.com corporate blogDIYManufacture and development of electronics*PhysicsElectronics for beginners

✏️ Technotext 2023

Картинка kjpargeter, Gpointstudio, Freepik

Задумывались ли вы над тем, что прямо под руками, может, даже и сейчас, у вас находится весьма мощный потенциальный источник рентгеновского излучения, о котором мало кто знает, потому что «его надо правильно готовить»? А что, если я скажу вам, что это самый обыкновенный скотч? Да-да, та самая банальная клейкая лента, которой мы упаковываем всё подряд! Тем не менее, в определённых условиях она обладает поразительными свойствами, несмотря на кажущуюся странность такого утверждения…

Читать дальше →

+120

mr-pickles Jul 24 2023 at 12:30

Качественный набор данных от Microsoft для обучения компактных, но мощных языковых моделей, генерирующих код

Medium

4 min

Wunder Fund corporate blogProgramming*Algorithms*Artificial Intelligence

Translation

Обучение больших нейронных сетей — это искусство. В сфере ИИ уже давно известны следующие два факта. Во-первых — высококачественные учебные данные оказывают значительное влияние на улучшение результатов работы больших моделей. Во-вторых — применение таких данных способно бросить вызов законам масштабирования, имеющим отношение к размерам моделей и данных.

Исследовательская команда Microsoft, вдохновлённая этими идеями, провела эксперимент, отчёт о котором — Textbooks Are All You Need — можно найти на arXiv.org. В рамках эксперимента была создана большая языковая модель для генерирования кода, названная phi-1. Обучение этой модели проводилось с использованием специально подготовленного набора данных, качество которого сопоставимо с учебниками по программированию. В результате модель phi-1, при том, что в ней используется всего 1,3 миллиарда параметров, показала результаты, превосходящие то, на что способны самые совершенные большие языковые модели.

Исследование направлено на обучение языковых моделей для генерирования кода. Оно ориентировано на демонстрацию того, что в высококачественных данных есть сила, способная изменить текущую ситуацию, когда улучшение возможностей моделей напрямую связано с увеличением их размеров.

+13

Tsarek Jun 22 2023 at 13:38

Как использовать Midjourney: подробный гайд, лайфхаки, промты

Easy

7 min

99K

РСХБ.цифра (Россельхозбанк) corporate blogPopular scienceMachine learning*Artificial Intelligence

Tutorial

✏️ Technotext 2023

Ранее мы рассказывали о своих впечатлениях и результатах тестирования приложений на основе нейросети. В своей работе на платформе «РСХБ в цифре» мы активно используем Midjourney и искусственный интеллект. В новой статье хотим поделиться советами, которые позволят с нуля разобраться в основных функциях и командах, чтобы приступить к созданию интересных изображений с помощью этого приложения.

+52

Serpentarius13 Apr 28 2023 at 12:22

Как использовать Midjourney с умом

Easy

10 min

22K

Artificial Intelligence

From sandbox

Мне довелось познакомиться с нейросетями совсем недавно. На работе дали задание — найти подходящую бесплатную картинку для сайта. В первую очередь, я вспомнил про Crayion (Бывший DALL-E), но качество результата на нем совсем меня не удивило. После этого я вспомнил о существовании Midjourney и о том, что разработчики предоставляют пробный доступ в Discord. Я подключился к серверу и сделал свою первую картинку. Результат был сногсшибательным.

+16

4eJIoBek Apr 22 2023 at 14:43

Vicuna, Stable Diffusion и другие нейронки на винде без боли

Easy

3 min

15K

Open source*Artificial Intelligence

Привет всем, хочу поделиться своим сборником всяких портабелек нейронок разного пошиба для винды, где уже всё установлено и надо приложить минимальные усилия, чтобы всё это запустить. Вообще все эти штуки я собирал и делал для себя, но когда я выложил это всё на itch, то оказалось, что они кому-то пригодились, и я решил репостнуть всё это безобразие на хабр. Здесь напишу небольшой список того, что реально может кому-нибудь быть полезно. Полный список с ссылками на скачивание здесь.

KoboldAI - удобный граф. интерфейс для запуска вообще всех GPT-подобных текстовых нейронок, которые поддерживает библиотека transformers. Онлайн версия со всякими модельками.

Vicuna 1.1 - очень хороший чат-бот на базе слитой LLaMa от фейсбука на 7 миллиардов, специально квантованная в 4бита и сконвертированная в формат ggml для быстрой работы на ЦПУ с граф. интерфейсом koboldcpp. Умеет в русский. Требует от 4гб RAM и процессор с AVX (любой после 2009 года вроде). Koboldcpp тоже может запускать почти всё текстовое в ggml. Онлайн версию 1.0 можно попробовать здесь.

NLLB - переводчик от фейсбука между 200 языками. Запуск не совсем однокнопочный и в jupytere, на цпу. Жрёт 4 гига оперативы. Онлайн демка.

FreeVC - не очень хороший, зато открытый клонер голоса с одного аудио на другое. Запуск тоже немножко через консоль, зато с вебгуем и на цпу. Онлайн потыкать здесь.

Whisper - транскрибатор на 60 языках от openai, работает на ЛЮБОМ гпу, даже на встроенном в ноутах(на цпу тоже, но немного помендленнее), ест мало видеопамяти, но есть и большие прожорливые модельки. Очень хорошая онлайн демка.

+22

Arnak Oct 18 2022 at 10:04

Ученые нашли упражнение, позволяющее худеть, сидя по 10 часов в день

6 min

351K

getmatch corporate blogHealthLifehacks for geeks

Недавно опять разгорелась дискуссия, как можно похудеть, работая в IT. Так вот, хороший (и научный) способ есть, и он на самом деле проще, чем можно было бы ожидать.

Конечно, если ничего не делать, то будешь только толстеть. Средний офисный сотрудник сегодня сидит больше 10 часов в день. Мы с вами, чувствую, ещё больше, особенно если на досуге играем, читаем Хабр или смотрим ютуб. Лично меня от компьютера вообще не оттащить. Хотя читал полно исследований, говорящих о больших проблемах со здоровьем, возникающих из-за малоподвижного образа жизни.

Например, было доказано, что независимо от уровня физической активности слишком много сидения увеличивает риск сердечных заболеваний, диабета, деменции и серьезных проблем со спиной. Более половины всех людей в мире сегодня уже страдают от этих проблем, и больше 80% людей в возрасте 60+.

Решение, конечно, простое — упражнения, в любой возможной форме. Но если вы такие как я, то тренироваться скучно и тяжело, правда? Большинство из нас ненавидят физкультуру. К тому же, на это нет лишнего времени. Бонусные часы каждый день магически не появятся.

Но похоже, есть способ ускорить обмен веществ в организме, даже сидя за ПК. И точно избежать проблем с метаболизмом и ожирением. Несколько недель назад вышла работа ученых под руководством Марка Гамильтона из Хьюстонского университета. Они разработали технику, позволяющую задействовать неожиданное свойство икроножных мышц, и делать для своего организма полноценную тренировку, не вставая со стула. Оказывается, похудеть, работая в IT, — это не так уж и сложно. Испытываю на себе, полёт нормальный. А какие у вас ноги будут прокачанные!

Читать дальше →

+151

296

vandiemen Sep 2 2022 at 14:30

Экструдер для получения филамента из PET тары

5 min

61K

3D printers

Technotext 2022

Всем привет! Цены на филамент в последнее время вообще не радуют. Также особенностью 3D печати является тот факт, что некоторые детали приходится перепечатывать по нескольку раз для достижения желаемых результатов. Процесс разработки и печати детали иногда бывает достаточно итеративным и медитативным )).А что если бы у Вас был безлимитный пластик? Эдакая "супер способность" - человек-филамент? Помогло бы это Вам в Вашем 3D ремесле?

Представляю Вашему вниманию компактный экструдер филамента из PET бутылок!

+81

GraDea Oct 8 2018 at 09:22

DDIA book (книга с кабанчиком) — сделай level up в понимании баз данных

4 min

36K

NoSQL*SQL*Database Administration*Distributed systems*Reading room

Несколько месяцев назад на одной из ретроспектив мы решили попробовать совместное чтение.

Наш формат:

Выбираем книгу.
Определяем часть, которую необходимо прочитать за неделю. Выбираем небольшой объем.
В пятницу обсуждаем прочитанное.
Читаем в нерабочее время, обсуждаем в рабочее.
После окончания книги совместно выбираем следующую.

Что дает:

Мотивация на чтение и дочитывание.
Развитие скиллов (в том числе на будущее).
Выравнивание майндсета и терминологии в команде.
Рост доверия.
Лишний повод пообщаться.

Одна из недавних книг, которую мы читали — Designing Data-Intensive Applications. Да-да, та самая книга с кабанчиком. И эта книга настолько всем понравилась, что я решил сделать здесь обзор, чтобы большее количество людей ее прочитали.

Карта в исходном качестве

Читать дальше →

+22

un1t Apr 7 2022 at 11:20

Как я учился скоростной печати, но что-то пошло не так

4 min

34K

Programming*IT careerLifehacks for geeks

В конце прошлого года на просторах ютюба смотрел какой-то ролик про программирование, и парень упомянул, что он умеет очень быстро печатать. Настолько быстро, что никогда не видел человека, кто бы печатал также быстро как он. И он показал цифры - 170 WPM.

WPM - это Words Per Minute, в английском принята эта единица измерения, считается что одно слово это 5 букв, т.е. это 850 символов в минуту. В других языках слова обычно длиннее и используется единица CPM (Characters Per Minute).

И я вроде бы мог печатать вслепую и печатал быстро, как мне казалось. Но после детального изучения оказалось все плохо.

+46

112

RationalAnswer Mar 2 2022 at 22:44

Гайд: работающие способы вывести деньги за рубеж / завести в Россию

8 min

225K

IT-emigrationLegislation in ITFinance in ITLifehacks for geeksCryptocurrencies

Tutorial

В этой статье я постарался систематизировать всю имеющуюся на текущий момент информацию о том, как можно переместить капитал в том или ином виде через российскую границу.

+90

173

RationalAnswer Mar 31 2022 at 09:03

В какую крипту не страшно вкладывать деньги: выбираем самый надежный стейблкоин из USDT, USDC, BUSD, DAI, UST

14 min

82K

Finance in ITCryptocurrencies

Окончательно разбираемся с выводами о том, какая криптовалюта наименее подвержена рискам внезапного и резкого обесценения; и в какой крипте риск санкционных заморозок минимален.

+108

andrey_ssh Mar 23 2022 at 09:25

Скрутки, клеммники и WAGO под лёгкой перегрузкой

4 min

70K

Energy and batteries

В позапрошлом году я начал испытания различных способов соединения проводов, во избежание ситуации описанной в посте. Сейчас пришло время посмотреть как соединения стареют со временем и ведут себя при перегрузках.

Здесь рассматриваются наиболее доступные способы соединить наиболее типичный для квартирной проводки медный однопроволочный провод сечением 2,5 кв.мм.

Читать дальше →

+256

206

2 3 4 5