Как стать автором
Обновить
33
0
Nick Linker @nlinker

Пользователь

Отправить сообщение

9. Nix в пилюлях: Автоматические зависимости времени выполнения

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров831

Исследуем пакетный менеджер Nix и операционную систему NixOS.
Ранее мы разработали универсальный скрипт сборки для проектов autotools.

Сегодня мы обратимся к программе GNU hello, чтобы исследовать зависимости времени сборки и времени выполнения.

Читать далее
Всего голосов 4: ↑4 и ↓0+7
Комментарии0

Памятка по BPMN и BPMN-диаграммам

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров29K

Я написал эту статью для себя, но подумал, что она будет полезна и начинающим айтишникам, и тем, кому необходимо освежить знания или быстро вспомнить основные вещи, не открывая полное руководство.

Ещё раз подчеркну, статья задумывалась как базовая памятка и помощь для начинающих, а никак не исчерпывающая документация. Многое я опускаю ввиду избыточности или неактульности, по крайней мере в моей работе.

Читать далее
Всего голосов 49: ↑47 и ↓2+60
Комментарии35

Fine-tuning больших языковых моделей в 2024 году

Время на прочтение14 мин
Количество просмотров4.2K

Не секрет, что большие языковые модели (LLM) эволюционируют с безумной скоростью и привлекают внимание всей отрасли генеративного ИИ. Корпорации не просто заинтригованы, они одержимы LLM, и в частности, потенциалом fine-tuning LLM. В исследования и разработку LLM сейчас вкладываются миллиарды долларов. Лидеры отрасли и энтузиасты технологий всё сильнее стремятся углубить своё понимание LLM и их fine-tuning. Эта сфера natural language processing (NLP) постоянно расширяется, поэтому критически важно иметь актуальную информацию. Польза, которую LLM могут принести вашему бизнесу, зависит от ваших знаний и понимания этой технологии.

Цикл жизни большой языковой модели состоит из множества важных этапов, и сегодня мы рассмотрим один из самых любопытных и активно развивающихся частей этого цикла — процесс fine-tuning моделей LLM. Это трудозатратная, тяжёлая, но перспективная задача, используемая во многих процессах обучения языковых моделей.
Читать дальше →
Всего голосов 4: ↑4 и ↓0+5
Комментарии2

RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров651

Заканчиваем разбирать части пайплайна RLHF с точки зрения исторической ретроспективы, чтобы понять, как сформировалась идея, которая сегодня лежит в основе самых популярных LLM.

В первой части мы ознакомились с общим пайплайном RLHF, LLM, KL-контролем и необходимостью предобучения на пусть и грязных, но больших данных

Во второй - сравнили Offline RL и Online RL, увидели их ограничения, попробовали имитировать Online RL через self-play и непрерывную обратную связь от среды через Reward Modelling. А еще первый раз задумались о сборе непротиворечивой но достаточно полной обратной связи от человека.

В третьей - добавили этап дообучения с учителем на качественных демонстрациях и осознали важность контроля за сбором человеческой обратной связи.

В этой, финальной части, мы узнаем современное и будто бы общепринятое понятие и определение "согласованной модели" - HHH: helpful, honest, harmless, поиграемся с различными комбинациями RM для представления HHH моделей, а еще увидим, как обогащать и собирать обратную связь не от человека, а от LLM.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Повышаем живучесть Raft в реальных условиях

Время на прочтение14 мин
Количество просмотров4.6K
Популярность алгоритма Raft в последние годы растёт. У него достаточно ясное описание, а реализации появляются во всё большем количестве проектов. На бумаге, будь то математика или рекламные статьи, выглядит хорошо. Но на практике не все обещания Raft можно реализовать без дополнительных решений.

Меня зовут Сергей Останевич. Я архитектор репликации в проекте Tarantool, платформе in-memory-вычислений с гибкой схемой данных для эффективного создания высоконагруженных приложений. Над материалом этой статьи мы работали вместе с Бориславом Демидовым. Мы поделимся нашим опытом реализации Raft, расскажем о поддержке работоспособности кластера Tarantool в условиях частичной связности и приведём реальные примеры того, как чистый Raft не справился с задачей.


Читать дальше →
Всего голосов 42: ↑42 и ↓0+42
Комментарии4

Как мы помогли Альфа-Банку выйти из трудного положения с помощью WASM

Время на прочтение4 мин
Количество просмотров9.2K

Привет, Хабр! Раньше мы уже рассказывали о распознавании документов прямо в браузере и технологии WebAssembly (или WASM), которая позволяет это делать. Теперь давайте разберем, как и где это работает в реальной жизни.

Читать далее
Всего голосов 19: ↑13 и ↓6+9
Комментарии6

Ортолинейная сплит клавиатура — это что такое? Обзор Iris Keyboard

Время на прочтение13 мин
Количество просмотров105K
За сто с лишним лет клавиатуры сильно изменились внешне: стали лёгкими, тонкими, есть даже проекционные со сканером. Но рынок ничего не меняет в их раскладке («QWERTY» появилась в 1890 году), клавиатуры не стали удобней для пальцев, не адаптированы для положения кистей и предплечий. Всё человечество стало проводить жизнь за компьютером, но эргономика главного инструмента ввода осталась в позапрошлом веке.

Я решил узнать, можно ли купить удобную клавиатуру в 2020 году. Краткий ответ: пришлось паять самому.


Всего голосов 100: ↑96 и ↓4+114
Комментарии293

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

Время на прочтение8 мин
Количество просмотров51K

hero_image


В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество.


Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом своими успехами:


  • Снизили размер модели в 2 раза;
  • Научили наши модели делать паузы;
  • Добавили один высококачественный голос (и бесконечное число случайных);
  • Ускорили наши модели где-то примерно в 10 раз (!);
  • Упаковали всех спикеров одного языка в одну модель;
  • Наши модели теперь могут принимать на вход даже целые абзацы текста;
  • Добавили функции контроля скорости и высоты речи через SSML;
  • Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;
  • Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;

Это по-настоящему уникальное и прорывное достижение и мы не собираемся останавливаться. В ближайшее время мы добавим большое количество моделей на разных языках и напишем целый ряд публикаций на эту и смежные темы, а также продолжим делать наши модели лучше (например, еще в 2-5 раз быстрее).


Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →
Всего голосов 130: ↑129 и ↓1+156
Комментарии101

Интуитивный RL (Reinforcement Learning): введение в Advantage-Actor-Critic (A2C)

Время на прочтение6 мин
Количество просмотров15K

Привет, Хабр! Предлагаю вашему вниманию перевод статьи Rudy Gilman и Katherine Wang Intuitive RL: Intro to Advantage-Actor-Critic (A2C).

Специалисты по обучению с подкреплением (RL) подготовили множество отличных учебных пособий. Большинство, однако, описывают RL в терминах математических уравнений и абстрактных диаграмм. Нам нравится думать о предмете с другой точки зрения. Сама RL вдохновлена ​​тем, как учатся животные, так почему бы не перевести лежащий в основе этого механизм RL обратно в природные явления, которые он призван имитировать? Люди учатся лучше всего через истории.


Это история о модели Actor Advantage Critic (A2C). Модель «Субъект-критик» — это популярная форма модели Policy Gradient, которая сама по себе является традиционным алгоритмом RL. Если вы понимаете A2C, вы понимаете глубокий RL.


Читать дальше →
Всего голосов 11: ↑11 и ↓0+11
Комментарии0
Привет, Хабр! Меня зовут Лавров Сергей (@lavs). Я разрабатываю мобильные приложения под Android и iOS, преподаю IT в двух университетах и уже 15 лет изучаю новые технологии, а также языки программирования, которых знаю более десятка. В этот раз я выступлю в непривычной для себя роли обзорщика: меня попросили посмотреть, чем может быть интересен для разработчика планшет Huawei MatePad 11. Что ж, challenge accepted: я проверю, можно ли на нём программировать; разберусь, что из себя представляет новая HarmonyOS и попробую написать для неё приложение.
Читать далее
Всего голосов 20: ↑10 и ↓10+14
Комментарии84

Научный прогресс ускорится, если ИИ начнёт анализировать данные в автономном режиме

Время на прочтение9 мин
Количество просмотров6.2K


Научно-технический прогресс — это магистраль, которая ведёт в фантастическое будущее с неизведанными возможностями. Но с какой скоростью мы помчимся по этой магистрали — зависит только от нас. Мы можем вообще развернуться и двинуть в обратном направлении, как сделала европейская цивилизация 1500 лет назад.

Что мы видим сейчас в традиционных социальных иерархиях? Борьба за статус, власть, деньги, карму — всё это побочные эффекты нашей биологической природы. К сожалению, личное эго и предубеждения присущи и самым рациональным людям: инженерам и исследователям. Иногда такое ЧСВ мешает научному прогрессу.
Читать дальше →
Всего голосов 29: ↑24 и ↓5+28
Комментарии30

Как самостоятельно выучиться на дата-саентиста — адаптированная подборка

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров29K

"Cтоит ли тратить деньги на тот или иной дорогой курс с codename «Стань DS за два месяца» или все же выучиться на дата-саентиста самостоятельно и бесплатно, и в таком случае, с чего начать?" такие вопросы я получаю от аудитории своего блога. Меня зовут Айра, я делаю проекты в DS&ML, продюсирую курсы по созданию ML-проектов и веду блог по теме.

Недавно собрала ответ на этот вопрос достаточно развернуто, чтобы поделиться им с широкой аудиторией. Не все платные курсы плохие (хотя большинство — да — из-за механизмов отбора, продаж и слабой программы), но о них напишу отдельно. Мне кажется, нужно учитывать больше персонализированных параметров для того, чтобы грамотно выбирать хороший курс за деньги.

Читать далее
Всего голосов 12: ↑11 и ↓1+11
Комментарии10

Дефицит есть, а денег не дают. Почему?

Время на прочтение27 мин
Количество просмотров296K

Мы уже выяснили, что у нас есть дефицит рабочих рук во всех отраслях. На примере СССР увидели, что дефицит легко закрывается деньгами и плюшками, что сейчас и происходит в IT. Однако при дефиците рабочих рук в остальных отраслях зарплаты остаются на уровне Румынии и никак не подтягиваются. Почему?

Читать далее
Всего голосов 512: ↑497 и ↓15+588
Комментарии1205

Что было в мире искусственного интеллекта в 2021 году

Время на прочтение5 мин
Количество просмотров8.2K

Пару недель назад вышел новый отчет «State of AI Report 2021». Уже несколько лет подряд такой отчет ежегодно выпускает венчурный фонд «Air Street Capital» (https://www.airstreet.com). Он инвестирует в компании в области искусственного интеллекта (ИИ) и наук о жизни (НЖ) на ранних стадиях. Миссия фонда – создавать устойчивые компании, оказывающие долгосрочное влияние на рынки. В портфеле фонда сейчас шесть стартапов в ИИ и семь в НЖ. Еще тринадцать стартапов было проинвестировано в прошлом. Портфель диверсифицирован по странам – сейчас их семь в портфеле. Ссылка на слайды – в конце.

Читать далее
Всего голосов 6: ↑4 и ↓2+3
Комментарии8

Релизы без выгорания и овертаймов: как мы меняли процессы работы над крупными игровыми фичами

Время на прочтение7 мин
Количество просмотров7.5K

Выстраивание производственных процессов — распространенная боль в IT-разработке. Это большая и комплексная задача, с которой неизбежно приходится сталкиваться на проектах, чтобы доставить фичу в срок. Однозначного и единственно правильного решения здесь нет. Зато есть множество маркеров: кранчи, выгорание, фичекат, — указывающих на то, что что-то вы все-таки делаете не так.

Изменение воркфлоу — процесс, способный растянуться не на один год, и, конечно, не обойдется без собственных набитых шишек. Ниже я расскажу об опыте команды War Robots: с чего мы когда-то начинали и каких результатов добились сейчас. И, поверьте, для нас это того стоило.

Читать далее
Всего голосов 21: ↑20 и ↓1+21
Комментарии15

Самопаркующаяся тачка в 500 строк кода

Время на прочтение25 мин
Количество просмотров12K

В этой статье мы "научим" автомобиль выполнять самостоятельную парковку с помощью генетического алгоритма.

В 1-м поколении автомобили будут иметь случайный геном и будут вести себя хаотично.

К ≈40-му поколению автомобили понемногу начнут учиться парковке и будут все ближе и ближе подбираться к парковочному месту

Чтобы увидеть эволюционный процесс прямо в браузере вы можете запустить ? симулятор эволюции, .

Генетический алгоритм для этого проекта будем реализовывать на TypeScript. В этой статье будет показан полный исходный код алгоритма, но вы также можете найти финальные примеры кода в репозитории симулятора.

Читать далее
Всего голосов 30: ↑29 и ↓1+36
Комментарии8

Как перейти в Data Science из другой сферы

Время на прочтение4 мин
Количество просмотров7.1K

Меня зовут Павел Куницын, я работаю в Первой грузовой компании (ПГК) главным специалистом по анализу данных и машинному обучению. Недавно опубликовал пост на Kaggle с рекомендациями для тех, кто хочет перейти в Data Science, не имея релевантного опыта. Он оказался интересным сообществу, и я решил подготовить специально для вас расширенную версию публикации – дополнить важной информацией, рекомендациями.

Здесь я не напишу список онлайн-платформ с курсами по Data Science. Об этом писали уже много раз, а расскажу о том, как нужно учиться. У меня есть список правил, которых придерживаюсь сам, когда хочу развить свои профессиональные навыки в какой-то новой сфере. Используйте их не только при изучении Data Science, но и других областей.

1. Сформулируйте для себя конечную цель

Вы можете прийти в Data Science по разным причинам: от интереса к новой сфере до желания устроиться на высокооплачиваемую работу. Возможно, вы — руководитель проекта, и ваша цель – получить краткое представление о том, какие этапы включают в себя проекты по машинному обучению (ML), чтобы сделать общение со своей командой эффективнее. Или, может быть, вы аналитик, и ваша цель – получить новые технические навыки? А, может быть, ваша нынешняя работа никак не связана со статистикой или разработкой, вы никогда не писали код, но хотели бы научиться. Тогда целью может быть получение всех необходимых для этого знаний.

Для достижения каждой из перечисленных целей требуются разные стратегии и разное количество времени, поэтому формулируйте их четко. Чтобы правильно сформулировать свою цель, спросите себя:

Читать далее
Всего голосов 5: ↑3 и ↓2+2
Комментарии4

Как сделать из линейного сотрудника начальника и потом с этим жить

Время на прочтение7 мин
Количество просмотров23K

И так, вот команда растёт, растёт и дорастает хотя бы до 15+ человек. В этот момент вы неожиданно понимаете, что у вас 3 бекенд-разработчика или даже 5. Здесь возникает неудержимое желание сделать одного из них Самым-Главным-Бекенд-Разработчиком-Проекта. Это желание понятно, и даже логично...

Читать далее
Всего голосов 49: ↑47 и ↓2+53
Комментарии38

Как устранить баг с конвейерами в Factorio

Время на прочтение5 мин
Количество просмотров12K
Factorio — это игра про строительство фабрики, в которой множество конвейерных лент. Реализующий эти ленты код является чудом оптимизации, однако, к сожалению, он не может справляться со всеми конструкциями.

Проблема с суши-конвейером


Проблема возникает, когда конвейер представляет собой петлю. Поначалу помещённые на конвейер предметы работают нормально, двигаясь как возвращаемый пассажирам багаж в аэропорту. Но как только конвейер достигает полной загрузки, он останавливается.

Читать дальше →
Всего голосов 10: ↑9 и ↓1+13
Комментарии16

Как я потерял работу программиста в 65 лет

Время на прочтение4 мин
Количество просмотров115K

Ведь я профессионал в IT. Как такое могло произойти?

65 лет, по идее, это год «выхода на пенсию». Для меня этот год стал годом «окончания» всего. В этой статье я решил рассказать о своем двухлетнем пути без работы. Ну и как теперь я работаю неполный день.

Дисклеймер. Эта статья -- перевод текста разработчика из США. Думаю, разница в том, что в странах СНГ подобные проблемы начинаются еще раньше. В дополнение к переводу предлагаю обсудить проблемы поиска работы среди возрастных соискателей в нашей стране. Об этом в конце статьи.

Читать далее
Всего голосов 67: ↑52 и ↓15+58
Комментарии442

Информация

В рейтинге
5 996-й
Зарегистрирован
Активность