Статьи / Закладки / Профиль yanchick / Хабр

@yanchick

Пользователь

Профиль Публикации 2Комментарии 129Закладки 657

kucev 24 сен в 15:28

Полный гид по бенчмаркам LLM

12 мин

1.3K

Big Data*Data Engineering*Data Mining*Искусственный интеллектМашинное обучение*

Перевод

В последние годы большие языковые модели (large language model, LLM) совершили революцию в мире искусственного интеллекта, став фундаментом для множества различных сфер, от чат-ботов до генерации контента. Однако такой прогресс несёт с собой и новые сложности; в частности, разработчикам нужно обеспечить оптимальность и этичность моделей. При выполнении этой задачи критически важны бенчмарки, представляющие собой стандартизированные способы численного измерения и сравнения моделей ИИ с целью обеспечения согласованности, надёжности и справедливости. В условиях быстрого развития LLM возможности бенчмарков тоже существенно расширились.

В этом посте мы представим подробный каталог бенчмарков, разбитый на категории по сложности, динамике, целям оценки, спецификациям конечных задач и типам рисков. Понимание их различий поможет вам разобраться в бенчмарках LLM в условиях их стремительного развития.

Читать дальше →

anna_schenikova 19 сен в 16:16

Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM

11 мин

1.6K

Блог компании МТСМашинное обучение*Искусственный интеллектNatural Language Processing*

Привет, Хабр! Меня зовут Анна Щеникова, я аналитик в Центре RnD в МТС Диджитал. Почти всегда при адаптации LLM-моделей встает вопрос нехватки ресурсов на проверку гипотез. Обычно у меня есть собственное рабочее время и две карточки GPU, а распределяются они на несколько задач. Бизнес же просит приемлемый результат как можно быстрее.

В прошлом посте я рассказала про разделение адаптации open-source-моделей на четыре уровня, а в этом раскрою работу с последним из них — дообучением. Под катом покажу, как быстро получить приемлемое качество, когда базовые подходы не помогают.

+11

kardamanov 24 июн 2021 в 12:27

Как проходят архитектурные секции собеседования в Яндексе: практика дизайна распределённых систем

25 мин

141K

Блог компании ЯндексАнализ и проектирование систем*Высокая производительность*Промышленное программирование*Распределённые системы*

Технотекст 2021

Привет, меня зовут Костя Кардаманов, я работаю в отделе технологий разработки Яндекса. Обычно такой же фразой я приветствую и кандидатов на собеседовании. А сегодня я хотел бы рассказать вам, как и зачем мы проводим интервью по дизайну систем с бэкенд-разработчиками. Сразу скажу: для фронтендеров, мобильных разработчиков и ML-инженеров подобный тип собеседований применим слабо, так что эти специальности мы здесь обсуждать не будем.

Технический уровень кандидата у нас оценивается за счет всего двух типов интервью: секции с кодом и секции дизайна компьютерных систем. Первый тип мы назначаем всем претендентам вне зависимости от их уровня, а вот у кандидатов, которые претендуют на должность старшего специалиста, нужно проверять не только способность писать эффективный и работоспособный код, но и способность разрабатывать сложные системы в целом.

Что такое дизайн информационных систем

Основная цель любой IT-компании — производить сервисы, которые решают задачи пользователей. Мы должны уметь собирать элементы системы в единый механизм, который будет эффективно выполнять поставленную цель, и если первый тип собеседований нацелен в первую очередь на проверку необходимого минимума, то интервью про дизайн систем проверяет достаточность навыков кандидата в достижении конечной цели. Далекому от IT пользователю принципы и устройство систем могут казаться бесконечно сложными, но мы, их разработчики, должны иметь (не обязательно детальное) представление о принципах функционирования и роли каждого компонента.

Опытный читатель может сказать — в мире полно платных и бесплатных решений, из которых я могу собрать систему как из деталей конструктора, зачем мне понимать устройство этих деталей?

Читать дальше →

+90

Extremesarova 9 сен в 14:59

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 5: Поведенческое интервью + Бонусы

Средний

7 мин

4.6K

Блог компании МегаФонМатематика*Учебный процесс в ITКарьера в IT-индустрииИнтервью

Роадмэп

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к дизайну систем машинного обучения.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к поведенческому интервью, а также ресурсы, которые не подошли по тематике ни к одной из предыдущих статей.

anna_schenikova 22 авг в 16:26

От промптов к дообучению: четыре уровня адаптации open-source моделей

12 мин

3.9K

Блог компании МТСМашинное обучение*Искусственный интеллектNatural Language Processing*

Обзор

Привет, Хабр! Меня зовут Анна Щеникова, я аналитик в Центре RnD в МТС Диджитал. Ко мне часто приходят задачи, где нужно использовать open-source LLM. Сразу же встает вопрос: а как адаптировать имеющуюся модель под конкретный кейс?

Мы выделяем четыре уровня адаптации. Для этого смотрим, какие потребуются навыки для решения этой задачи, сколько времени и человекочасов займет разработка. Поняв требуемый уровень, мы можем поставить себе дедлайны на проверку гипотезы и запланировать действия, если задача не решится выбранным способом. Ниже я расскажу, как мы разделяем разные уровни адаптации, что делаем на каждом из них и когда переходим на следующий.

+16

vandriichuk 11 авг в 15:43

Как создать автоматизированную систему проверки кода с использованием агентов LangChain

Средний

3 мин

1.3K

Управление разработкой*

Мнение

Перевод

В современном разработке программного обеспечения обзор кода играет критическую роль в обеспечении качества и надежности продукта. Однако ручной обзор кода может быть трудоемким и часто требует значительного внимания со стороны опытных разработчиков. Автоматизация этого процесса предлагает несколько преимуществ. Но возможна ли? Помогут ли LLM и Агенты решить эту задачу?

pamparumba 6 авг в 17:00

Всё уже придумали за нас: библиотеки с тысячами готовых GPT-промтов для работы, учёбы и отдыха

Простой

3 мин

55K

Контент и копирайтинг*КопирайтИскусственный интеллектЛайфхаки для гиков

Обзор

Подборка для тех, кто пробовал использовать нейросети в своих задачах, но разочаровался в них: непонятно, как чат-бот вообще может помогать с чем-то серьёзным.

+31

AlanRobotics 31 июл в 15:32

Вызов функций с помощью LLM

14 мин

4.2K

Блог компании MTS AIБлог компании МТСNatural Language Processing*Искусственный интеллектМашинное обучение*

Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.

+15

alexwortega 23 янв в 08:43

Вихрь — семейство переведенных русскоязычных LLM

Средний

5 мин

22K

Natural Language Processing*

Кейс

Мы русифицировали Mistral и он работает лучше(по бенчмаркам) чем закрытые русскоязычные LLM. Как мы это сделали, ссылки на модели и бенчмарки - в статье.

+36

mashkka_t 24 июл в 17:16

ruMTEB: новый бенчмарк для русскоязычных эмбеддеров

Средний

11 мин

5.2K

Блог компании SberDevicesИскусственный интеллектМашинное обучение*

Салют, Хабр! На связи команды AGI NLP и нейронных сетей Виртуального ассистента Салют. В SberDevices наши команды занимаются созданием бенчмарков, а также обучением моделей для векторных представлений текстов или эмбеддеров. В этой статье расскажем про наш новый русскоязычный бенчмарк для эмбеддеров текста — ruMTEB.

+35

yakvenalex 9 июл в 07:00

Создание собственного API на Python (FastAPI): структура проекта, SQLAlchemy PostgreSQL, миграции и первые модели таблиц

Средний

21 мин

17K

Python*PostgreSQL*SQL*

Туториал

Приветствую всех, друзья! Наша последняя статья по созданию собственного API на FastAPI вызвала огромный интерес, и за это я искренне благодарен.

Ранее мы рассматривали базовые аспекты работы с FastAPI: различные типы запросов, их валидацию и обработку, а также ответы на эти запросы. Однако, это лишь верхушка айсберга.

Уже на данном этапе код становится громоздким и сложным для понимания. К тому же, хранение данных в JSON‑файлах — это далеко не самый профессиональный подход. «Нормальные ребята» используют SQLAlchemy, причем асинхронно.

Сегодня мы займемся интеграцией асинхронной SQLAlchemy в наше FastAPI‑приложение. Для упрощения навигации и понимания кода я предложу структуру проекта, которую сам использую в каждом FastAPI‑приложении.

Отдельное внимание уделим миграциям с Alembic: что это такое и зачем они нужны. Конкретные функции для взаимодействия с базой данных мы будем рассматривать в следующей статье. Сегодня же займемся подключением, миграциями, описанием моделей таблиц и их созданием.

+11

Extremesarova 26 июн в 11:08

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 4: Дизайн систем машинного обучения

Средний

8 мин

7.1K

Блог компании МегаФонКарьера в IT-индустрииУчебный процесс в ITМашинное обучение*Искусственный интеллект

Роадмэп

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor). Мы строим скоринговые (credit scoring), лидогенерационные (lead generation) и антифрод (anti-fraud) модели на телеком данных, а также делаем гео-аналитику (geo-analytics).

В предыдущей статье я поделился материалами для подготовки к этапу по специализированному машинному обучению.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по дизайну систем машинного обучения.

efreelancer 2 июн в 17:31

Enbeddrus — обучение независящей от языка эмбеддинг-модели

Средний

11 мин

2.9K

Python*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Приветствую, хабровчане!

Сегодня хочу рассказать вам историю о том, как я обучил простую и компактную независящую от языка модель-эмбеддер, которая умеет работать с техническими текстами о PHP и способна извлекать схожие эмбеддинги для параллельных текстов на английском и русском языках.

Основная причина, по которой я решил заняться этим проектом, заключается в том, что мои заметки, код и документация, накопленные за более чем десять лет практики, представляют собой солянку текстов о разных технологиях, языках программирования, пометки о настройке серверов Linux и т.д. на русском и английском языках. Поэтому мне захотелось сделать Retrieval-Augmented Generation (RAG) помогалку, которая сможет принимать запросы пользователя (меня) и эффективно находить информацию в столь разношерстой базе данных, независимо от того на каком языке я сделал запрос и на каком языке написана документация.

Для достижения этой цели необходима независимая от языка модель-эмбеддер, которая будет одинаково хорошо работать с техническими текстами на русском и английском языках.

Ещё одним важным аспектом было то, чтобы модель потребляла как можно меньше ресурсов и, если возможно, чтобы её можно было преобразовать в формат GGUF.

+17

veseluha 4 мая в 18:00

Что нужно знать, чтобы успешно пройти System Design Interview

16 мин

43K

Блог компании BotHubПрограммирование*Анализ и проектирование систем*

Перевод

Для любого разработчика глубокое понимание основных принципов системного проектирования является необходимым условием для создания стабильных и масштабируемых программных систем, способных обеспечивать высокую производительность. Системное проектирование (System Design) включает разработку архитектуры и структуры программной системы, направленную на удовлетворение специфических требований и обеспечение требуемых показателей производительности.

С учетом стремительного прогресса в области технологий и возрастающей сложности программных приложений, овладение принципами системного проектирования становится критически важным для разработчиков, стремящихся создавать эффективные системы. Не имеет значения новичок вы или опытный специалист: освоение этих принципов позволит вам разрабатывать надежные и масштабируемые программные системы, отвечающие требованиям современных приложений.

Далее мы рассмотрим каждый из принципов более детально, чтобы понять их суть и способы применения в разработке приложений.

+56

slivka_83 29 апр в 18:34

Подбор гиперпараметров RAG-системы с помощью Optuna

Средний

16 мин

5.5K

Natural Language Processing*Искусственный интеллектМашинное обучение*Data Mining*Python*

Туториал

Сказ о том, как с помощью Opuna’ы сделать вашу RAG-систему чуточку (а может и не чуточку) эффективнее :)

+14

dionisdimetor 28 апр в 08:23

Теория хаоса, синергетика, неравновесная термодинамика – науки о сложных адаптивных системах

Средний

28 мин

6.2K

Научно-популярноеМатематика*Физика

Являются ли случайность и хаос фундаментальными свойствами нашего мира, или за ними всегда скрывается некий порядок, а нам просто не хватает знаний и точности измерений, чтобы его постичь? Изучением этого вопроса занимаются несколько тесно связанных между собой междисциплинарных наук: синергетика, неравновесная термодинамика, теория хаоса, теория катастроф, фрактальная геометрия, теория систем и кибернетика. На первый взгляд эти дисциплины очень абстрактны и совершенно непонятны без изучения их сложного математического аппарата. Но в действительности они гораздо ближе к жизни, чем квантовая механика или теория относительности, поскольку имеют дело не со «сферическими конями в вакууме», а с реальными процессами.

О явлениях хаоса и самоорганизации я рекомендую прочитать книгу Джеймса Глейка «Хаос. Создание новой науки» (1987). Если же у вас нет ни времени, ни желания изучать всю историю науки о хаосе, вы узнаете всё самое важное из данной статьи. Здесь я разъясняю множество специфических терминов, которые приведут в ужас даже хорошо образованного человека: эмерджентность, синергия, флуктуации, диссипативные структуры, динамический хаос, точка бифуркации, аттракторы, фракталы и т.д. Также мы выясним, не противоречит ли самоорганизация второму началу термодинамики и действительно ли случайность, необратимость и неустойчивость являются источниками всякого развития.

+14

Extremesarova 19 апр в 16:41

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 3: Специализированное машинное обучение

Средний

22 мин

8.4K

Блог компании МегаФонBig Data*Машинное обучение*Учебный процесс в ITКарьера в IT-индустрии

Роадмэп

В предыдущей статье я поделился материалами для подготовки к этапу по классическому машинному обучению.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по специализированному машинному обучению.

GeeksCat 20 янв в 11:01

Sid Meier's Civilization III от Firaxis – история создания

Простой

10 мин

11K

Блог компании Timeweb CloudИгры и игровые консолиРазработка игр*Читальный зал

Ретроспектива

Мир готовится вступить в новый век, игровая индустрия потихоньку переключает фокус внимания с приставок на компьютеры, на судебных заседаниях решается будущее Цивилизации… А что же Сид Мейер, её отец? Летит на всех парах к Альфа Центавре, строить прекрасное будущее!

Успех Sid Meier's Civilization II однозначно показал: продолжению быть. Но какому? От Microprose без Мейера или от маэстро Сида и его новой команды? Или от Activision, зашедшей с козырей и выкупившей все права у Avalon Hill – изначального правообладателя названия «Civilization»?

Читать дальше →

+51

GeeksCat 22 апр в 11:01

История создания Civilization IV: избавление от унылости

Простой

8 мин

11K

Блог компании Timeweb CloudИгры и игровые консолиРазработка игр*Читальный зал

Ретроспектива

Историю четвёртой части «Цивилизации» можно начать с очередной смены владельца бренда Civilization: Atari (Infrogames) продала их 2К Games, дочерней компании Take-Two. Сумма сделки составила 22,3 миллиона долларов. На дворе стоял 2004-й год.

Хотя на самом деле к тому моменту разработка уже весьма активно велась, так что Сид Мейер и его студия Firaxis отнеслись к происходящему философски: смена издателя не сильно влияла на планы команды. Руководил проектом Сорен Джонсон, набравшийся опыта в работе над предыдущей частью серии.

Читать дальше →

+31

GeeksCat 7 окт 2023 в 11:01

Рождение и проверка временем Sid Meier's Civilization II

Простой

11 мин

Блог компании Timeweb CloudИгры и игровые консолиРазработка игр*Читальный зал

Ретроспектива

Сейчас пятилетний перерыв между играми одной серии не кажется слишком большим: почти с таким интервалом выходили, к примеру, Anno 2070, 2205 и 1800. Но в 90-е темп разработки был совсем иным, ведь создание игры с нуля занимало не больше года. Так почему же вторая часть «Цивилизации» увидела свет только в 1996-ом году?

После выхода в 1991-ом году Sid Meier's Civilization офис MicroProse был завален письмами фанатов с предложениями новых механик. Эксперимент Сида Мейера удался: Civilization высоко оценили как критики, так и простые игроки. Идея о продолжении витала в воздухе, но «Цивилизация» казалась идеальной игрой, которую нет смысла переделывать. Да и сам Сид Мейер хотел переключиться на новый проект C.P.U. Bach – интерактивную музыкальную игру, генерирующую композиции в стиле Иоганна Себастьяна Баха.

Читать дальше →

+33

2 3 ...

32 33