Pull to refresh
1
0
Владимир @thethee

User

Send message

RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL

Level of difficultyEasy
Reading time8 min
Views638

Продолжаем разбирать части пайплайна RLHF с точки зрения исторической ретроспективы, чтобы понять, как сформировалась идея, которая сегодня лежит в основе самых популярных LLM.

В первой части мы ознакомились с общим пайплайном RLHF, LLM, KL-контролем и необходимостью предобучения на пусть и грязных, но больших данных

Во второй - сравнили Offline RL и Online RL, увидели их ограничения, попробовали имитировать Online RL через self-play и непрерывную обратную связь от среды через Reward Modelling. А еще первый раз задумались о сборе непротиворечивой но достаточно полной обратной связи от человека.

Здесь мы, наконец-таки, добавляем этап дообучения с учителем на качественных демонстрациях и осознаем важность контроля за сбором человеческой обратной связи.

Читать далее
Total votes 4: ↑2 and ↓20
Comments0

Как проходить онбординг? С точки зрения работника

Level of difficultyEasy
Reading time4 min
Views7.2K

Привет! Эта статья о том, как правильно входить в хату, проходить онбординг на новом месте работы. Этот гайд будет полезен как тем, кто нашел первую работу, так и тем, кто уже работает, но испытывает стресс перед сменой работы.

Читать далее
Total votes 11: ↑7 and ↓4+9
Comments4

OpenSource на поле против OpenAI:  Function Calls здесь и сейчас для самых маленьких… ресурсов

Level of difficultyMedium
Reading time12 min
Views2.4K

Вызов функций на локально развернутых LLM возможен. Прочитайте статью и узнайте, как это можно реализовать и насколько хорошо это работает!

Читать далее
Total votes 7: ↑6 and ↓1+8
Comments2

4 тысячи заметок?! Как я веду личную базу знаний в Obsidian

Reading time6 min
Views23K

В моей базе знаний 4 000 заметок.

Да, у меня немного съехала крыша на этой теме. Но решение создать систему для ведения заметок три года назад — пока что лучшая из моих интеллектуальных инвестиций. В этом посте хочу поделиться, зачем я это делаю, в каком формате и какие полезные практические кейсы для себя нашел. Тема бездонная, на самом деле. Можете взять часть идей и развить у себя.

Читать далее
Total votes 35: ↑29 and ↓6+30
Comments82

Как поделить не деля или оптимизация деления компиляторам(и)

Level of difficultyMedium
Reading time5 min
Views6.5K

Если вы никогда не пробовали смотреть как код на C++ разворачивается компилятором в код Assembly – вас ждёт много сюрпризов, причём, не нужно смотреть какой-то замудренный исходный код полный templates или других сложных конструкций: рассмотрите следущий snippet:

Смотреть код
Total votes 37: ↑37 and ↓0+45
Comments27

Я стала руководителем. Что делать? Статья для тех, кому сложно в новой роли

Level of difficultyEasy
Reading time5 min
Views16K

Привет! Я Вера Осолодкина, аккаунт-директор в диджитал-продакшене Далее. Полгода назад я стала руководителем проджект-менеджеров и активно стала вживаться в новую роль. За это время я успела задуматься о смысле жизни, карьере, команде, провести сотни созвонов и разрулить тысячи ситуаций. Если вы тоже в этой точке, этот текст для вас.

Руководителями не становятся на пустом месте — это результат той карьерной стратегии, которой ты придерживаешься. Она может быть разной, но абсолютно всем менеджерам нужна поддержка, особенно когда ты растёшь, — кто-то же должен сказать, что всё ок. Этот короткий текст говорит тебе, что всё ок.

Читать далее
Total votes 19: ↑13 and ↓6+12
Comments3

Различные вычисления, многопоточность, асинхронность и мультипроцессность в Python

Level of difficultyMedium
Reading time9 min
Views6.3K

Всем привет! Меня зовут Дмитрий Первушин, я лидер Python-компетенций трайба ИСУ в Сбере. 

Эта статья рассчитана на людей, которые уже знакомы с Python, хотя бы на уровне junior+. Я объясню, какие есть отличия и особенности в многопоточности, асинхронности и мультипроцессорности в Python, где и когда они используются. Как говорится в пословице: «Всё познаётся в сравнении», именно в таком стиле я подготовил примеры. Кроме этого, буду специально делать ошибки и рассматривать неправильные подходы, чтобы можно было сразу разобраться, убедиться и запомнить, почему так делать нельзя и какой другой подход в этом случае нужно использовать.

Читать далее
Total votes 19: ↑17 and ↓2+20
Comments13

Введение в MLflow

Level of difficultyMedium
Reading time19 min
Views2.8K

MLflow - это инструмент для управления жизненным циклом машинного обучения: отслеживание экспериментов, управление и деплой моделей и проектов. В этом руководстве мы посмотрим, как организовать эксперименты и запуски, оптимизировать гиперпараметры с помощью optuna, сравнивать модели и выбирать лучшие параметры. Также рассмотрим логирование моделей, использование их в разных форматах, упаковку проекта в MLproject и установку удаленного Tracking Server MLflow.

Читать далее
Total votes 9: ↑9 and ↓0+14
Comments0

Рефакторинг игрового движка: от сырых указателей к умным

Reading time16 min
Views4.2K

Привет! Когда-то давно я уже писал статью про сырые и умные указатели, попытки использовать GC вместо них. Тогда я решил оставаться в С++ с сырыми указателями, а GC отвел место в скриптах. Но за долгое время я все больше и больше понимал что сырые указатели слишком опасны, тем более что мой движок позволяет писать игровой код на С++. Количество багов лишь подкрепляло уверенность что пора уходить от ручного управления памятью. Однако идеи про GC никак не оставляли в покое...

В статье я расскажу как переводил движок с сырых указателей на умные, разберу самые популярные концепции умных указателей, их особенности и подводные камни, и какой подход выбрал сам. Где в итоге здесь оказался GC и почему он не убивает производительность. А так же свои попытки напрячь ИИ для массового рефакторинга кода.

Читать далее
Total votes 9: ↑9 and ↓0+14
Comments46

Вызов функций с помощью LLM

Reading time14 min
Views2.6K

Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.

Читать далее
Total votes 9: ↑9 and ↓0+14
Comments3

Тысяча и одна библиотека С++

Reading time65 min
Views17K

В жизни каждого программиста С++ рано или поздно возникает задача, которую кто-либо уже решил. Однако найти это решение бывает очень непросто в силу разных причин: оно недостаточно разрекламировано, либо имеет нечеткую документацию, или возникает проблема языкового барьера, ну, или поисковики просто плохо ищут).

Столкнувшись много раз подряд с тем, что найти что-то толковое довольно непросто, я решил попробовать распутать это узел и предложить для русскоязычных читателей свой справочник классных библиотек на С++. Я исходил из этого источника. Это очень многогранный и объемный список библиотек языка С++, но, скажем так, у меня были к нему вопросы. Потому я сделал перевод, затем значительно улучшил его в плане содержания (далее объясню, как, почему и зачем). На выходе получилось около 1000 библиотек. Как в сказке). Они, конечно, не покрывают все возможные задачи и предметные области, но поверьте, они затрагивают действительно многое.

Прикоснуться к сокровищнице языка С++
Total votes 75: ↑74 and ↓1+85
Comments23

Как начинающему тимлиду не сойти с ума от обилия задач: практический гайд

Level of difficultyEasy
Reading time6 min
Views9.2K

Привет, Хабр! Меня зовут Капитолина Кузнецова, я Ruby-разработчик и на своём текущем месте работы в Купере (ex СберМаркет) доросла до роли тимлида. За 2,5 года я, так сказать, освоилась в этом статусе и, если верить моей команде, руководитель из меня получился неплохой, но вьетнамские флэшбэки о своих первых месяцах работы в новой роли ещё свежи.

Быть начинающим тимлидом — это...

- когда встречи занимают по семь, восемь, а то и девять часов подряд;

- когда ты целый день что-то делаешь, дико устаешь, а в конце не видишь никакого результата;

- когда о Jira знаешь больше, чем о собственной семье, а встречи с друзьями планируешь на новогодние праздники 2025 года.

Эта статья — попытка структурировать всё, что может помочь вам в новой роли. А также моя рефлексия о том, какие способы помочь себе, реально облегчат вам жизнь и помогут быстрее справиться с новым масштабом. Знаю, что такие проблемы были не только у меня, но и у многих других ребят, которые раньше просто писали код, а не вот это вот всё. В общем, надеюсь, мои заметки будут вам полезны :)

Читать далее
Total votes 23: ↑18 and ↓5+16
Comments13

ИИ-модели ломаются при обучении на рекурсивно сгенерированных данных

Level of difficultyHard
Reading time11 min
Views14K

Ранее мы разбирали документ о неизбежности AGI от Леопольда Ашенбреннера, в котором говорилось о «Стене данных». Проблема заключается в том, что данные для обучения новых ИИ-моделей в интернете не бесконечны. Один из подходов для обхода этой стены — создание синтетических данных, т.е сгенерированных ИИ. Ученые из Оксфордского и Кембриджского университетов опубликовали статью, в которой исследуют возможность использования таких данных при обучении новых моделей. Небольшой спойлер: модели сломались.

Читать далее
Total votes 14: ↑14 and ↓0+21
Comments22

Нормализуем собственное рабочее время или «очумелые ручки» в борьбе с прокрастинацией

Level of difficultyEasy
Reading time3 min
Views3.3K


После перехода на удаленку у меня в полный рост встала проблема с прокрастинацией задач. Все как по написаному:


И чтобы решить эту проблему раз и навсегда, купил себе простенький таймер, чтобы максимально легким способом (без всяких смартфонов), можно было устанавливать временные периоды для работы и перерывов.


Сразу хочу написать, что это решение, что называется "зашло", и даже сейчас я пишу статью под контролем таймера. Но сама статья не о самоорганизации работы, а об устройстве для этого (непосредственно самом таймере). Точнее о том, как я его дорабатывал под собственные нужды в надежде, что вдруг кому-то пригодится мой опыт.

Читать дальше →
Total votes 17: ↑14 and ↓3+14
Comments20

Симуляция живущего мира, живые NPC

Level of difficultyEasy
Reading time9 min
Views12K

Давно уже вынашиваю такую идею, периодически продумываю разные концепты. Еще когда занимался картами для WC3 хотел сделать симуляцию, когда каждый NPC в игре - герой, со своими целями и потребностями. NPC бы были такими же героями, как и игрок: фармили бы опыт и предметы, сражались бы с друг другом и т.д. Но если отойти от wc3 - суть концепта такая же - каждый NPC реально "живет" в игре. Это в теории поможет создать "реальный" живой мир, с которым игрок может взаимодействовать.

Читать далее
Total votes 23: ↑20 and ↓3+24
Comments39

Как приручить эмоции, чтобы прийти к успеху

Reading time10 min
Views11K

Привет! Я - Ольга Красильникова. Последние 2,5 года работаю в компании Bercut. Сначала отвечала за направление обучения и развития, сейчас – за психологическое благополучие команды.

За время своей работы как психолог и коуч я провела более 200 сессий с TOP-менеджерами, тимлидами, старшими и ведущими аналитиками, разработчиками и тестировщиками. На встречах мы учились распознавать эмоции и их послания, искать решение, отталкиваясь от информации, которую несет эмоция, менять мышление и поведение. Это помогало улучшать отношения в командах, выполнять KPIs, продвигаться по карьерной лестнице. Ранее я написала статью “Relax, take IT easy: как вернуть спокойствие в работу”. А сегодня мы:

- выясним, где ошибаемся, когда пробуем управлять эмоциями на работе;

- разберем, как сделать эмоции путеводной звездой в достижении целей;

- рассмотрим конкретные ситуации, когда работа с эмоциями помогла получить повышение зарплаты, новую должность и закрыть задачи в срок.

Читать далее
Total votes 18: ↑16 and ↓2+17
Comments4

Как ломаются большие системы и как их траблшутить — инсайты из интенсива ШАДа Яндекса

Reading time10 min
Views5.4K

Привет, меня зовут Руслан Савченко, я руководитель службы разработки динамических таблиц в Yandex Infrastructure и преподаватель в Школе анализа данных. Сегодня я поделюсь актуальными инсайтами о том, как ломаются большие системы и как их траблшутить. Думаю, это будет полезно разработчикам и студентам, которые интересуются Site Reliability Engineering. Вообще, мало где сейчас обучают SRE, хотя в индустрии такие задачи очень востребованы.

В основе статьи — материалы SRE Week, открытого интенсива ШАДа по работе с большими нагруженными системами.

Читать далее
Total votes 22: ↑22 and ↓0+28
Comments0

Зачем и как хранить объекты на примере MinIO

Reading time13 min
Views62K

Наша биг дата проанализировала Telegram-чаты, форумы и разговоры в кулуарах IT-мероприятий и пометила объектные хранилища как инструмент, который ещё не все осмеливаются использовать в своих проектах. Хочу поделиться с вами своим опытом в формате статьи-воркшопа. Если вы пока не знакомы с этой технологией и паттернами её применения, надеюсь, эта статья поможет вам начать использовать её в своих проектах. 

Начать хранить файлы
Total votes 18: ↑16 and ↓2+24
Comments8

Удаленка не для всех глазами лида

Reading time6 min
Views14K

Всем привет, меня зовут Сергей, я работаю удаленно уже пять лет. И сегодня буду делиться инсайтами лида об удаленке сотрудников. 

В удаленном формате я успел попробовать себя в разных ролях и, кажется, умею создать себе комфортные условия, вне зависимости от позиции. Продумал рабочее место и распорядок жизни, который не вызывает ощущение одиночества и оторванности от остального мира. Да и в целом чувствую, что мне на удаленке лучше.

 

Читать далее
Total votes 18: ↑13 and ↓5+9
Comments7

Web components как альтернатива iframe на примере Angular-компонентов

Level of difficultyMedium
Reading time12 min
Views3.8K

Всем привет! Я Сергей, фронтенд-разработчик из команды привлечения Центрального университета. Занимаюсь проектами, связанными с регистрацией абитуриентов на мероприятия, и внутренними проектами по управлению мероприятиями. 

Осенью мы ждем поступление бакалавров. Чтобы начать набор, нужно встроить форму регистрации в лендинг на CMS. Форма довольно простая: пара полей для ввода данных, диалоговое окно с текстом соглашения об обработке персональных данных и кнопка отправки данных на сервер. Для скорости работы и проверки работоспособности идеи решили встроить приложение через iframe. Но форма стала обрастать различными бизнес-требованиями, которые приносили проблемы. В статье расскажу, с какими трудностями мы столкнулись и как их решали.

Читать далее
Total votes 12: ↑12 and ↓0+17
Comments12

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity