Articles / Bookmarks / Profile of thethee / Habr

How to become an author

Владимир @thethee

User

Profile Publications Comments 5Bookmarks 96

MrsWallbreaker Aug 3 at 09:00

RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL

Easy

8 min

638

Machine learning*Artificial IntelligenceNatural Language Processing*

Продолжаем разбирать части пайплайна RLHF с точки зрения исторической ретроспективы, чтобы понять, как сформировалась идея, которая сегодня лежит в основе самых популярных LLM.

В первой части мы ознакомились с общим пайплайном RLHF, LLM, KL-контролем и необходимостью предобучения на пусть и грязных, но больших данных

Во второй - сравнили Offline RL и Online RL, увидели их ограничения, попробовали имитировать Online RL через self-play и непрерывную обратную связь от среды через Reward Modelling. А еще первый раз задумались о сборе непротиворечивой но достаточно полной обратной связи от человека.

Здесь мы, наконец-таки, добавляем этап дообучения с учителем на качественных демонстрациях и осознаем важность контроля за сбором человеческой обратной связи.

Читать далее

0

EduardZiyaev Aug 3 at 11:16

Как проходить онбординг? С точки зрения работника

Easy

4 min

7.2K

Project management*Community management*Product Management*

Привет! Эта статья о том, как правильно ~~входить в хату~~, проходить онбординг на новом месте работы. Этот гайд будет полезен как тем, кто нашел первую работу, так и тем, кто уже работает, но испытывает стресс перед сменой работы.

Читать далее

+9

dumonten Aug 3 at 08:17

OpenSource на поле против OpenAI: Function Calls здесь и сейчас для самых маленьких… ресурсов

Medium

12 min

2.4K

Open source*Programming*Machine learning*Artificial IntelligenceNatural Language Processing*

Вызов функций на локально развернутых LLM возможен. Прочитайте статью и узнайте, как это можно реализовать и насколько хорошо это работает!

Читать далее

+8

victorbuto Aug 3 at 15:17

4 тысячи заметок?! Как я веду личную базу знаний в Obsidian

6 min

23K

Data storage*Project management*Content-marketing*Reading roomPopular science

Case

В моей базе знаний 4 000 заметок.

Да, у меня немного съехала крыша на этой теме. Но решение создать систему для ведения заметок три года назад — пока что лучшая из моих интеллектуальных инвестиций. В этом посте хочу поделиться, зачем я это делаю, в каком формате и какие полезные практические кейсы для себя нашел. Тема бездонная, на самом деле. Можете взять часть идей и развить у себя.

Читать далее

+30

StarPilgrim Aug 2 at 19:13

Как поделить не деля или оптимизация деления компиляторам(и)

Medium

5 min

6.5K

Abnormal programming*C++*Algorithms*Compilers*

Если вы никогда не пробовали смотреть как код на C++ разворачивается компилятором в код Assembly – вас ждёт много сюрпризов, причём, не нужно смотреть какой-то замудренный исходный код полный templates или других сложных конструкций: рассмотрите следущий snippet:

Смотреть код

+45

Vera_O Aug 1 at 13:15

Я стала руководителем. Что делать? Статья для тех, кому сложно в новой роли

Easy

5 min

16K

Project management*Personnel Management*

Привет! Я Вера Осолодкина, аккаунт-директор в диджитал-продакшене Далее. Полгода назад я стала руководителем проджект-менеджеров и активно стала вживаться в новую роль. За это время я успела задуматься о смысле жизни, карьере, команде, провести сотни созвонов и разрулить тысячи ситуаций. Если вы тоже в этой точке, этот текст для вас.

Руководителями не становятся на пустом месте — это результат той карьерной стратегии, которой ты придерживаешься. Она может быть разной, но абсолютно всем менеджерам нужна поддержка, особенно когда ты растёшь, — кто-то же должен сказать, что всё ок. Этот короткий текст говорит тебе, что всё ок.

Читать далее

+12

DimaFromMai Aug 2 at 11:05

Различные вычисления, многопоточность, асинхронность и мультипроцессность в Python

Medium

9 min

6.3K

Python*Programming*Сбер corporate blog

Всем привет! Меня зовут Дмитрий Первушин, я лидер Python-компетенций трайба ИСУ в Сбере.

Эта статья рассчитана на людей, которые уже знакомы с Python, хотя бы на уровне junior+. Я объясню, какие есть отличия и особенности в многопоточности, асинхронности и мультипроцессорности в Python, где и когда они используются. Как говорится в пословице: «Всё познаётся в сравнении», именно в таком стиле я подготовил примеры. Кроме этого, буду специально делать ошибки и рассматривать неправильные подходы, чтобы можно было сразу разобраться, убедиться и запомнить, почему так делать нельзя и какой другой подход в этом случае нужно использовать.

Читать далее

+20

egorborisov Aug 1 at 00:06

Введение в MLflow

Medium

19 min

2.8K

Open source*Python*Data visualization*Machine learning*Open Data Science corporate blog

Tutorial

MLflow - это инструмент для управления жизненным циклом машинного обучения: отслеживание экспериментов, управление и деплой моделей и проектов. В этом руководстве мы посмотрим, как организовать эксперименты и запуски, оптимизировать гиперпараметры с помощью optuna, сравнивать модели и выбирать лучшие параметры. Также рассмотрим логирование моделей, использование их в разных форматах, упаковку проекта в MLproject и установку удаленного Tracking Server MLflow.

Читать далее

+14

anz Jul 30 at 09:11

Рефакторинг игрового движка: от сырых указателей к умным

16 min

4.2K

C++*Game development*

Привет! Когда-то давно я уже писал статью про сырые и умные указатели, попытки использовать GC вместо них. Тогда я решил оставаться в С++ с сырыми указателями, а GC отвел место в скриптах. Но за долгое время я все больше и больше понимал что сырые указатели слишком опасны, тем более что мой движок позволяет писать игровой код на С++. Количество багов лишь подкрепляло уверенность что пора уходить от ручного управления памятью. Однако идеи про GC никак не оставляли в покое...

В статье я расскажу как переводил движок с сырых указателей на умные, разберу самые популярные концепции умных указателей, их особенности и подводные камни, и какой подход выбрал сам. Где в итоге здесь оказался GC и почему он не убивает производительность. А так же свои попытки напрячь ИИ для массового рефакторинга кода.

Читать далее

+14

AlanRobotics Jul 31 at 15:32

Вызов функций с помощью LLM

14 min

2.6K

Machine learning*Artificial IntelligenceNatural Language Processing*MTS AI corporate blog

Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.

Читать далее

+14

rapiq Jul 29 at 09:37

Тысяча и одна библиотека С++

65 min

17K

Programming*C++*Qt*C*GitHub*

В жизни каждого программиста С++ рано или поздно возникает задача, которую кто-либо уже решил. Однако найти это решение бывает очень непросто в силу разных причин: оно недостаточно разрекламировано, либо имеет нечеткую документацию, или возникает проблема языкового барьера, ну, или поисковики просто плохо ищут).

Столкнувшись много раз подряд с тем, что найти что-то толковое довольно непросто, я решил попробовать распутать это узел и предложить для русскоязычных читателей свой справочник классных библиотек на С++. Я исходил из этого источника. Это очень многогранный и объемный список библиотек языка С++, но, скажем так, у меня были к нему вопросы. Потому я сделал перевод, затем значительно улучшил его в плане содержания (далее объясню, как, почему и зачем). На выходе получилось около 1000 библиотек. Как в сказке). Они, конечно, не покрывают все возможные задачи и предметные области, но поверьте, они затрагивают действительно многое.

Прикоснуться к сокровищнице языка С++

+85

klavakurochkina Jul 25 at 13:14

Как начинающему тимлиду не сойти с ума от обилия задач: практический гайд

Easy

6 min

9.2K

Development Management*IT careerКупер corporate blog

Opinion

Привет, Хабр! Меня зовут Капитолина Кузнецова, я Ruby-разработчик и на своём текущем месте работы в Купере (ex СберМаркет) доросла до роли тимлида. За 2,5 года я, так сказать, освоилась в этом статусе и, если верить моей команде, руководитель из меня получился неплохой, но вьетнамские флэшбэки о своих первых месяцах работы в новой роли ещё свежи.

Быть начинающим тимлидом — это...

- когда встречи занимают по семь, восемь, а то и девять часов подряд;

- когда ты целый день что-то делаешь, дико устаешь, а в конце не видишь никакого результата;

- когда о Jira знаешь больше, чем о собственной семье, а встречи с друзьями планируешь на новогодние праздники 2025 года.

Эта статья — попытка структурировать всё, что может помочь вам в новой роли. А также моя рефлексия о том, какие способы помочь себе, реально облегчат вам жизнь и помогут быстрее справиться с новым масштабом. Знаю, что такие проблемы были не только у меня, но и у многих других ребят, которые раньше просто писали код, а не вот это вот всё. В общем, надеюсь, мои заметки будут вам полезны :)

Читать далее

+16

jstmeowme Jul 29 at 15:03

ИИ-модели ломаются при обучении на рекурсивно сгенерированных данных

Hard

11 min

14K

Mathematics*Machine learning*Artificial IntelligenceBotHub corporate blog

Translation

Ранее мы разбирали документ о неизбежности AGI от Леопольда Ашенбреннера, в котором говорилось о «Стене данных». Проблема заключается в том, что данные для обучения новых ИИ-моделей в интернете не бесконечны. Один из подходов для обхода этой стены — создание синтетических данных, т.е сгенерированных ИИ. Ученые из Оксфордского и Кембриджского университетов опубликовали статью, в которой исследуют возможность использования таких данных при обучении новых моделей. Небольшой спойлер: модели сломались.

Читать далее

+21

rsashka Jul 23 at 19:40

Нормализуем собственное рабочее время или «очумелые ручки» в борьбе с прокрастинацией

Easy

3 min

3.3K

Development Management*FreelanceReading roomLifehacks for geeks

Case

После перехода на удаленку у меня в полный рост встала проблема с прокрастинацией задач. Все как по написаному:

И чтобы решить эту проблему раз и навсегда, купил себе простенький таймер, чтобы максимально легким способом (без всяких смартфонов), можно было устанавливать временные периоды для работы и перерывов.

Сразу хочу написать, что это решение, что называется "зашло", и даже сейчас я пишу статью под контролем таймера. Но сама статья не о самоорганизации работы, а об устройстве для этого (непосредственно самом таймере). Точнее о том, как я его дорабатывал под собственные нужды в надежде, что вдруг кому-то пригодится мой опыт.

Читать дальше →

+14

ildarin Jul 27 at 19:49

Симуляция живущего мира, живые NPC

Easy

9 min

12K

Game development*Game design*

Opinion

Давно уже вынашиваю такую идею, периодически продумываю разные концепты. Еще когда занимался картами для WC3 хотел сделать симуляцию, когда каждый NPC в игре - герой, со своими целями и потребностями. NPC бы были такими же героями, как и игрок: фармили бы опыт и предметы, сражались бы с друг другом и т.д. Но если отойти от wc3 - суть концепта такая же - каждый NPC реально "живет" в игре. Это в теории поможет создать "реальный" живой мир, с которым игрок может взаимодействовать.

Читать далее

+24

OlgaNKrasilnikova Jul 26 at 13:38

Как приручить эмоции, чтобы прийти к успеху

10 min

11K

GTD*Personnel Management*IT careerBercut corporate blog

Привет! Я - Ольга Красильникова. Последние 2,5 года работаю в компании Bercut. Сначала отвечала за направление обучения и развития, сейчас – за психологическое благополучие команды.

За время своей работы как психолог и коуч я провела более 200 сессий с TOP-менеджерами, тимлидами, старшими и ведущими аналитиками, разработчиками и тестировщиками. На встречах мы учились распознавать эмоции и их послания, искать решение, отталкиваясь от информации, которую несет эмоция, менять мышление и поведение. Это помогало улучшать отношения в командах, выполнять KPIs, продвигаться по карьерной лестнице. Ранее я написала статью “Relax, take IT easy: как вернуть спокойствие в работу”. А сегодня мы:

- выясним, где ошибаемся, когда пробуем управлять эмоциями на работе;

- разберем, как сделать эмоции путеводной звездой в достижении целей;

- рассмотрим конкретные ситуации, когда работа с эмоциями помогла получить повышение зарплаты, новую должность и закрыть задачи в срок.

Читать далее

+17

savrus_pub Jul 17 at 10:00

Как ломаются большие системы и как их траблшутить — инсайты из интенсива ШАДа Яндекса

10 min

5.4K

High performance*Яндекс corporate blogNetwork technologies*Systems engineering*Yandex Cloud & Yandex Infrastructure corporate blog

Привет, меня зовут Руслан Савченко, я руководитель службы разработки динамических таблиц в Yandex Infrastructure и преподаватель в Школе анализа данных. Сегодня я поделюсь актуальными инсайтами о том, как ломаются большие системы и как их траблшутить. Думаю, это будет полезно разработчикам и студентам, которые интересуются Site Reliability Engineering. Вообще, мало где сейчас обучают SRE, хотя в индустрии такие задачи очень востребованы.

В основе статьи — материалы SRE Week, открытого интенсива ШАДа по работе с большими нагруженными системами.

Читать далее

+28

worldbug Oct 28 2021 at 12:10

Зачем и как хранить объекты на примере MinIO

13 min

62K

Programming*Go*Data storages*Ozon Tech corporate blogKubernetes*

Tutorial

Наша биг дата проанализировала Telegram-чаты, форумы и разговоры в кулуарах IT-мероприятий и пометила объектные хранилища как инструмент, который ещё не все осмеливаются использовать в своих проектах. Хочу поделиться с вами своим опытом в формате статьи-воркшопа. Если вы пока не знакомы с этой технологией и паттернами её применения, надеюсь, эта статья поможет вам начать использовать её в своих проектах.

Начать хранить файлы

+24

Maxilect Jul 25 at 09:58

Удаленка не для всех глазами лида

6 min

14K

FreelancePersonnel Management*IT careerMaxilect corporate blogRemote work

Opinion

Всем привет, меня зовут Сергей, я работаю удаленно уже пять лет. И сегодня буду делиться инсайтами лида об удаленке сотрудников.

В удаленном формате я успел попробовать себя в разных ролях и, кажется, умею создать себе комфортные условия, вне зависимости от позиции. Продумал рабочее место и распорядок жизни, который не вызывает ощущение одиночества и оторванности от остального мира. Да и в целом чувствую, что мне на удаленке лучше.

Читать далее

+9

Goodzonchik Jul 18 at 10:00

Web components как альтернатива iframe на примере Angular-компонентов

Medium

12 min

3.8K

Website development*JavaScript*T-Bank corporate blogAngular*TypeScript*

Review

Всем привет! Я Сергей, фронтенд-разработчик из команды привлечения Центрального университета. Занимаюсь проектами, связанными с регистрацией абитуриентов на мероприятия, и внутренними проектами по управлению мероприятиями.

Осенью мы ждем поступление бакалавров. Чтобы начать набор, нужно встроить форму регистрации в лендинг на CMS. Форма довольно простая: пара полей для ввода данных, диалоговое окно с текстом соглашения об обработке персональных данных и кнопка отправки данных на сервер. Для скорости работы и проверки работоспособности идеи решили встроить приложение через iframe. Но форма стала обрастать различными бизнес-требованиями, которые приносили проблемы. В статье расскажу, с какими трудностями мы столкнулись и как их решали.

Читать далее

+17

1