Pull to refresh
8
0
Send message

Как развивалась технология экстремального сжатия LLM: от QuIP до AQLM с PV-tuning

Reading time4 min
Views3K

Мы живём в эпоху LLM — компании применяют на практике всё более крупные модели с миллиардами параметров. Это здорово, потом что большие модели открывают пользователям сервисов новые возможности, но не всё так просто. Размер накладывает ограничения — запускать такие модели очень дорого, а на пользовательских компьютерах — ещё дороже и сложнее. Поэтому часто исследователи и инженеры сначала обучают большую модель, а потом придумывают, как сжать её с минимальными потерями качества, чтобы сделать доступнее. 

Модели выкладываются в формате float16, где на один вес выделяется 16 бит. Два года назад человечество научилось хорошо сжимать нейросети до 4 бит с помощью таких методов, как GPTQ. Но на этом исследователи не остановились, и сейчас актуальная задача — сжатие моделей до 2 бит, то есть в 8 раз. 

Недавно исследователи Yandex Research совместно с коллегами из IST Austria и KAUST предложили новый способ сжатия моделей в 8 раз с помощью комбинации методов AQLM и PV-tuning, который уже доступен разработчикам и исследователям по всему миру — код опубликован в репозитории GitHub. Специалисты также могут скачать сжатые с помощью наших методов популярные опенсорс-модели. Кроме того, мы выложили обучающие материалы, которые помогут разработчикам дообучить уменьшенные нейросети под свои сценарии.

О том, как исследователи пришли к сегодняшним результатам, мы расскажем на примере двух «конкурирующих» команд и их state-of-the-art алгоритмов сжатия — QuIP и AQLM. Это короткая, но увлекательная история «противостояния» исследователей, в которой каждые пару месяцев случаются новые повороты, появляются оптимизации и оригинальные подходы к решению проблем.

Читать далее
Total votes 23: ↑23 and ↓0+30
Comments5

Щупаем первый 8-битный процессор от Intel — 8008

Level of difficultyEasy
Reading time8 min
Views7.3K

После того как я собрал систему на самом первом процессоре от Intel (4004), логичным, в каком-то смысле, шагом было перейти к Intel 8008. Концепция проекта та же - компилируем ассемблерный код на обычном ПК, отправляем скомпилированный бинарник на системную плату через USB, а современный микроконтроллер (stm32) эмулирует ПЗУ и ОЗУ для реального 50-летнего процессора, вставленного в DIP-сокет.

Вполне возможно собрать систему на аутентичных микросхемах, но такое решение проигрывает в удобстве использования - вместо запуска одной команды на ПК нужно будет постоянно перепрограммировать ПЗУ. Да и для меня основной интерес представляет сам процессор, а не его обвязка.

Так же как и в случае с 4004, моя плата эмулирует максимально возможный объем памяти, который нативно адресуется процессором. В данном случае, это 16Кб с некоторыми нюансами (об этом отдельно расскажу ниже).

И, конечно же, было занятно сравнить 4004 и 8008 в небольшой нишевой задачке. Да, сравнение весьма условное и какие-либо выводы по нему сделать сложно, но всё равно результаты вышли интересными.

Читать далее
Total votes 43: ↑42 and ↓1+48
Comments3

Как работает Python Asyncio: воссоздаем с нуля

Level of difficultyMedium
Reading time10 min
Views884

Автор оригинала: Jacob Padilla

Сейчас asyncio — одна из самых модных тем в Python, и это справедливо — это отличный способ обработки программ, связанных с вводом-выводом! Когда я изучал asyncio, мне потребовалось некоторое время, чтобы понять, как это на самом деле работает. Но позже я узнал, что это по сути просто очень хороший слой поверх генераторов Python. В этой статье я собираюсь создать упрощенную версию asyncio, используя только генераторы Python. Затем я собираюсь реорганизовать пример, чтобы использовать ключевые слова async и await с помощью dunder-метода __await__, прежде чем замкнуть круг и заменить свою версию на настоящий asyncio. Надеюсь, создав простую версию asyncio в конце этой статьи, вы сможете лучше понять, как он творит свою магию!

Читать далее
Total votes 6: ↑6 and ↓0+7
Comments1

Как рост вычислительных мощностей отражается на точности и качестве моделей

Level of difficultyEasy
Reading time5 min
Views344
image

ИИ развивается стремительными темпами, но чем сложнее становятся технологии, тем больше усилий требуется для создания подходящей инфраструктуры. По данным TrendForce, объём поставок ИИ-серверов во втором квартале 2024 года увеличился почти на 20% по сравнению с предыдущим кварталом. Аналитики ожидают, что по сравнению с 2023 годом годовой рост может составить 41,5%. Облачные провайдеры перенаправляют бюджеты на закупку ИИ-серверов. Для сравнения, рост поставок обычных серверов составит всего 1,9%.


Один из главных способов получить доступ к передовым чипам — облако. Виртуальные GPU-серверы — эффективное решение для работы с нейронными сетями, большими данными и параллельными вычислениями. Однако необходимость сокращения издержек разработки систем ИИ становится всё более очевидной, а преимущества в решении данной задачи — фактором конкуренции в этой области.


Посмотрим, что происходит в сфере аппаратного и программного обеспечения.

Читать дальше →
Total votes 6: ↑6 and ↓0+7
Comments0

Проклятие литографов: что мешает электронике Китая активно развиваться

Reading time4 min
Views6.9K

На днях Китайская ассоциация науки и технологий (CAST) перечислила проблемы, с которыми сталкивается страна в полупроводниковой промышленности. Их немало, включая дефицит квалифицированных кадров, сложности с логистикой и давление торговых санкций. Но основная проблема — отсутствие современных литографов и возможности производить их внутри страны. Подробности — под катом.

Читать далее
Total votes 8: ↑8 and ↓0+12
Comments12

Как я превратил обычный бизнес в IT компанию, читая книги

Level of difficultyEasy
Reading time14 min
Views3.6K

Началось с того, что я феерически прогорел при попытке создать IT компанию с нуля. Это произошло в дремучие года: у меня были длинные волосы, оранжевая рубашка, один из первых огромных смартфонов и белоснежный микро-ноутбук с большим черным модемом. Поэтому я мог сидеть в интернете прямо в Макдачной, что в те годы было реже, чем встретить Феррари на улице. И это почему-то приманивало ко мне разные интересные личности, они кидались ко мне чуть завидев издалека с кучей вопросов про компьютеры. И я почему-то решил, что было бы круто организовать телефонные консультации для пользователей компьютеров. 

Я готовился к настоящему валу звонков, ведь никто ничего похожего не предлагал.

Казалось бы, что могло пойти так?
Total votes 35: ↑28 and ↓7+36
Comments11

Самые дикие налоговые проблемы, в которые встряли уехавшие из России айтишники в 2024

Reading time10 min
Views28K

Попытка налоговой отхватить 6% с продажи квартиры в Грузии у налогового нерезидента РФ, двойное налогообложение заработанной крипты от российской ФНС, а также штраф 30% за сдачу в аренду недвижимости в Германии – в этой статье мы собрали самые жуткие истории из жизни, с которыми налоговые юристы сталкивались на практике.

Читать далее
Total votes 102: ↑88 and ↓14+90
Comments156

Профессиональные игроки в покер знают оптимальную стратегию, но не всегда её используют

Level of difficultyEasy
Reading time8 min
Views9.4K
Сегодня игроки в покер могут использовать ИИ для поиска оптимальной стратегии игры, но делают это не так часто.


«Олл-ин». Ваш противник двигает стопку фишек по столу для покера с высокими ставками. Вы смотрите на свои карты, там пара шестёрок. В партии техасского холдема ход остался только у вас, а общие карты (выкладываемые лицевой стороной) ещё не сдали. Для покера это очень простая ситуация, вам нужно сделать двоичный выбор: уравнять свою ставку со ставкой соперника (call) или спасовать (fold). Однако профессиональный игрок учитывает каждую деталь. Каким был паттерн ставок до олл-ина? Кто действовал первым? По сколько фишек есть у каждого игрока и сколько фишек на кону? Когда будут увеличиваться блайнды (вынужденные ставки)? И, разумеется, с какой вероятностью шестёрки выиграют? Вы выучили стратегию покера, запомнили таблицы вероятностей и выполняете вычисления в голове. Всё это указывает на то, что объективно лучшим решением будет спасовать. Но в течение долгого турнира вы заметили, что у противника есть склонность делать слишком большие ставки, имея слабую руку. Согласитесь ли вы с изученной информацией и спасуете, или подстроите свою стратегию на лету, чтобы воспользоваться замеченной слабостью?

Вопрос о том, использовать ли оптимальную с точки зрения теории игр стратегию или пользоваться хитростями — это главная тема обсуждений в покере высокого уровня. Его математические основы заложены ещё восемьдесят лет назад, но быстрый прогресс в развитии ИИ выдвинул математику середины двадцатого века на передний план современных игр. Новые инструменты учат игроков в покер оптимальной стратегии, но почему же те постоянно от неё отказываются?
Читать дальше →
Total votes 24: ↑24 and ↓0+34
Comments4

Golang убивает PHP

Level of difficultyMedium
Reading time3 min
Views28K

Последние несколько лет на рынке, по моему сугубо личному мнению, golang вытесняет PHP с рынка, а многие компании считают, что проекты, которые сейчас написаны и работают на PHP должны быть переписаны на golang, чтобы было хорошо.

Такой подход только частично является правдой. На самом деле каждый язык программирования предназначен на решение определенного вида задач, а вопросы производительности в основном зависят очень сильно от разработчика, а не от языка программирования.

Видя это несправедливое отношение PHP, хочу опубликовать ряд статей, в котором рассказывать об особенностях разработки, проблемах, которые нужно учитывать, а также участников разработки, которых также часто забывают, например, devops-инженеров.

Читать далее
Total votes 68: ↑44 and ↓24+36
Comments384

Hamster Kombat. Сколько ты реально заработаешь? Вся правда. Большой разбор проекта, токена HMSTR и команды

Reading time21 min
Views203K

В сегодняшнем материале мы разберем проект Hamster Kombat по косточкам. Поговорим о том, как вас разводят на время и внимание, как создатели Хомяка продают свою аудиторию, подсветим все его зашквары и несостыковки. Разберем экономику его токена, инвестиции и предположим, по какой цене он выйдет на рынок. Ну и самое главное — попытаемся понять, сколько же удастся на проекте заработать.

Для того, чтобы понять, сколько денег раздаст проект (и раздаст ли вообще), стоит ли вообще тратить на него свое время, необходимо проанализировать массу метрик, в том числе его фундаментальные показатели, фандрайзинг, токеномику, команду и многое другое. Этим прямо сейчас и займемся. Устраивайтесь поудобней.

И да, вынужден предупредить. Не всем этот материал понравится. За время, проведенное в крипте я привык видеть людей, желающих быть обманутыми. Ну ничего. К хейту я тоже готов. Должен же хоть кто‑то открывать ваши глазки на этот жесткий мир и показывать, что он не так уже и приветлив.

Читать далее
Total votes 183: ↑168 and ↓15+183
Comments204

Изобретатель Бомбардье: трагедия и преодоление

Reading time3 min
Views3.9K

В январе 1934 года деревня Валькур (Квебек) имела идиллический вид рождественской открытки. Всё занесено снегом, машины заперты в гаражах до весны, если надо куда‑то съездить — есть сани и лошадь. Там жил 26-летний Жозеф‑Арман Бомбардье, хозяин мастерской по ремонту почти всей техники, которой пользовались сельские жители. Недостаток технического образования (всего два года в ученичестве у механиков и на разных вечерних курсах) он компенсировал врожденным талантом и страстью к конструированию. Еще в 13 лет он построил модель паровоза с двигателем из деталей часового механизма, а в 15 — аэросани с мотором от «форда» и собственноручно выточенным пропеллером.

Читать далее
Total votes 30: ↑27 and ↓3+31
Comments1

Корректорские заметки: где ошибаются и как не ошибаться

Level of difficultyEasy
Reading time6 min
Views3.2K

Привет, Хабр! На связи Дарья, корректор информационной службы, время от времени забегающий и в пользовательские тексты, особенно в Песочнице. Недавно — и не без помощи модераторов — мне на глаза попался бугурт в комментариях, где технари — о чудо! — обсуждали, как важна грамотность при написании текстов. Не согласиться не имею права, и потому спешу рассказать, какие ошибки чаще всего встречаются на просторах Хабра, как их не допустить или исправить, а еще — что можно сделать, чтобы текст был покруче.

Читать далее
Total votes 27: ↑27 and ↓0+44
Comments63

5 общих черт между Cаутгейтом и плохим менеджером

Level of difficultyEasy
Reading time3 min
Views2.6K

В мире технологий и футбола есть свои герои и антигерои. Сегодня я решил провести параллель между плохим менеджером и Гаретом Саутгейтом, тренером сборной Англии по футболу. На первый взгляд кажется, что у них нет ничего общего, но если присмотреться, можно найти много забавных и поучительных моментов. Давайте разберемся, что объединяет этих двух персонажей.

Читать далее
Total votes 10: ↑8 and ↓2+6
Comments13

Книга: «Фактор Ч, или Как не угробить хорошую идею»

Reading time12 min
Views1.3K
image Привет, Хаброжители!

Почему некоторые инновационные идеи «выстреливают», а другие — нет. Что им мешает? Или, точнее… кто? Ответ, дорогой друг, прост: ты — Человек! Ты ленишься и выбираешь привычное и знакомое, боишься и сопротивляешься переменам.

Авторы этой книги талантливо объясняют истоки «сил трения» и рассказывают о том, как их преодолеть, чтобы новым продуктам, услугам или пользовательскому опыту сопутствовал заслуженный успех на сегодняшнем высококонкурентном рынке.
Читать дальше →
Total votes 3: ↑3 and ↓0+7
Comments0

Локализация интерфейса на языки, пишущие справа налево. Противоположный взгляд на мир

Level of difficultyEasy
Reading time4 min
Views1.3K

Локализация IT продуктов — всегда непростая задача, но если вам предстоит выход на азиатские рынки, вы можете столкнуться с языками, которые потребуют дополнительных усилий по адаптации пользовательского интерфейса. В последнее время Ближний Восток представляет особый интерес для владельцев IT бизнеса, а значит возникает необходимость в локализации цифровых продуктов на языки этого региона, письменность трех из которых направлена справа налево.

Эта статья будет интересна менеджерам локализации, продакт и проджект менеджерам, UX дизайнерам и частично фронтенд‑разработчикам, занятым в международных проектах с целевой аудиторией в странах Ближнего Востока. В статье рассматриваются особенности подготовки пользовательского интерфейса к локализации на языки, пишущие справа налево (RTL‑языки). Хотя приводятся примеры локализации на арабский язык, информация из этой статьи применима ко всем RTL‑языкам.

Читать далее
Total votes 4: ↑4 and ↓0+7
Comments4

Какой агрегатор нейросетей выбрать?

Level of difficultyEasy
Reading time5 min
Views12K

Многие ИИ-сервисы имеют для нас с вами ограничения и это не может не огорчать. Какие-то сервисы требуют только подключения через VPN, например, ChatGPT от OpenAI, а какие-то, например, Claude от Anthropic, просят душных и долгих танцев с бубном, чтобы просто использовать модель.

Но ладно доступ, а что если хочется расширить функционал, купив подписку? Так же не у каждого есть такая возможность, а потому нам приходят на помощь наши "адаптаторы", которые расшаривают доступ к интересующим нейросеткам и помогают нам избежать трудностей при использовании.

А еще вкуснее, когда любимые модели собраны в одном месте - это же очень удобно, не нужно бегать с места на место, а также платить за несколько подписок. А посему я хотела бы рассмотреть различные агрегаторы, их плюсы и минусы сравнить и понять, стоят они вашего с нами внимания, или нет.

Приятного прочтения!

Читать далее
Total votes 18: ↑15 and ↓3+15
Comments30

Управление проектами: обзор публикаций за неделю

Level of difficultyEasy
Reading time6 min
Views1.9K

Что интересного писали про управление проектами за неделю? Мы прочитали все публикации с Хабра, VC (и не только) и выбрали самые крутые и полезные. Читайте, сохраняйте и применяйте!

Читать далее
Total votes 10: ↑9 and ↓1+9
Comments1

Ассанж — свобода после 1901 дня в тюрьме и $520 000 за чартер в Австралию

Level of difficultyEasy
Reading time9 min
Views12K

Основатель WikiLeaks Джулиан Ассанж оказался на свободе после подписания соглашения с Министерством юстиции США. С 2019 года журналист находился в британской тюрьме строгого режима Белмарш, из которой его отпустили под залог после решения Высокого суда Лондона от 24 июня 2024 года. В рамках сделки с американским Минюстом 52-летний Ассанж частично признал вину в заговоре с целью получения и раскрытия информации о национальной обороне США. Слушания по делу прошли на тихоокеанском острове Сайпан, находящемся в американской юрисдикции.

Читать далее
Total votes 58: ↑55 and ↓3+73
Comments43

Выжимаем из Go максимум производительности

Level of difficultyMedium
Reading time11 min
Views17K

Разработчики, которые используют Go, сталкиваются с задачей выжать максимальную производительность из каждой строки кода. Но что делать, если оптимизировать уже нечего, а увеличивать скорость всё равно надо?

Меня зовут Никита Галушко. Я старший программист-разработчик в отделе высоконагруженных систем и оптимизации ВКонтакте. В статье поделюсь, какие хитрости помогут использовать Go на полную мощность.

Читать далее
Total votes 76: ↑74 and ↓2+87
Comments40

Пользовательские интерфейсы в упадке

Reading time5 min
Views15K
Когда у нас впервые появились персональные компьютеры, мы не слишком заботились о том, каково с ними работать. По правде сказать, мы были слишком потрясены тем, что у нас вообще есть нечто подобное. Чтобы ввести команду DOS, нужно было выучить какой-то секретный язык. Нам и в голову не приходило, что пользоваться компьютером сложно или неудобно. Но постепенно компьютеры становились более продвинутыми и, когда появился первый Macintosh со своим мощным графическим пользовательским интерфейсом, мы стали осознавать, что процесс взаимодействия с компьютером тоже имеет для нас значение.

Программистам теперь приходилось думать не только о том, как программа справится с задачей, но и о том, как пользователь справится с программой, чтобы выполнить задачу. Стало ясно, что хороший пользовательский интерфейс может повысить продажи. Если приложение простое и интуитивное в использовании, пользователи большего с ним добьются и останутся довольны.
Читать дальше →
Total votes 66: ↑61 and ↓5+71
Comments65
1
23 ...

Information

Rating
4,687-th
Registered
Activity