Статьи / Закладки / Профиль Safronov / Хабр

Как стать автором

Вадим Сафронов @Safronov

data artist

ПрофильСтатьи14ПостыНовостиКомментарии77

kucev 3 мар в 14:30

Оценка больших языковых моделей в 2025 году: пять методов

12 мин

2.3K

Data Mining*Искусственный интеллектМашинное обучение*Big Data*Data Engineering*

Перевод

Большие языковые модели (LLM) в последнее время стремительно развиваются и несут в себе потенциал для кардинального преобразования ИИ. Точная оценка моделей LLM крайне важна, поскольку:

• Компании должны выбирать генеративные AI-модели для внедрения в работу. Базовых моделей LLM сейчас множество, и для каждой есть различные их модификации.

• После выбора модели будет проходить fine-tuning. И если производительность модели не измерена с достаточной точностью, пользователи не смогут оценить эффективность своих усилий.

Таким образом, необходимо определить:

• Оптимальные методы оценки моделей

• Подходящий тип данных для обучения и тестирования моделей

Поскольку оценка систем LLM является многомерной задачей, важно разработать комплексную методологию измерения их производительности. В этой статье рассматриваются основные проблемы существующих методов оценки и предлагаются решения для их устранения.

Читать далее

0

KissedByF1re 26 фев в 23:47

Погружение в мир диффузионных моделей — путеводитель для новичков

Простой

26 мин

3.7K

Блог компании RaftPython*Машинное обучение*Искусственный интеллект

Из песочницы

Диффузионные модели перевернули мир генеративного искусственного интеллекта, вытеснив GAN'ы и вариационные автоэнкодеры. Но как они работают? Чем отличаются друг от друга? И как научиться их использовать?

Эта статья — путеводитель для тех, кто хочет разобраться в диффузионных моделях с нуля. В ней вы найдете три подхода к изучению — теория, практика и продвинутая практика.

Читать далее

+26

CherryPieHSE 5 ноя 2024 в 13:00

Путь к геометрии Лобачевского 6: финал

Средний

8 мин

2.7K

Математика*Научно-популярное

Часть 1: скалярное произведение и метрика
Часть 2: сфера
Часть 3: стереографическая проекция
Часть 4: псевдосфера
Часть 5: модель Пуанкаре в круге

Перед подведением итогов рассмотрим ещё две модели геометрии, имеющие разные свойства. Первая модель по построению очень похожа на модель Пуанкаре в круге, по этому в основном будут визуализации, без вывода формул. Вторая модель получена другим способом, по этому формулы будут, но в минимальном количестве.

Читать далее

+6

postupashki 1 ноя 2024 в 14:14

Дорожная карта теории вероятностей для собеседований, ШАД и олимпиад

Простой

5 мин

13K

Лайфхаки для гиковМатематика*Учебный процесс в IT

Роадмэп

Теорию вероятностей спрашивают и на собеседованиях, и на экзаменах, также она является фундаментом для многих методов машинного обучения. По моим наблюдениям студентам явно не хватает того курса теор вера, который есть в ВУЗах, чтобы научиться решать основные задачи — необходимы дополнительные материалы. В этой статье хотел бы поделиться моими самыми любимыми материалами и источниками для освоения теории вероятностей, имея за плечами крепкую школьную базу и скромные навыки в математическом анализе и линейной алгебре.

Читать далее

+10

Anastasiya_Rysmyatova 24 окт 2024 в 09:00

Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито

Средний

7 мин

9.8K

Блог компании AvitoTechIT-компанииМашинное обучение*Искусственный интеллект

Обзор

Привет! Я Настя Рысьмятова, руковожу командой LLM в Авито. Эта статья — про то, какие задачи мы решаем с помощью языковых моделей и как адаптируем их под себя. Мой опыт будет интересен прежде всего тем, кто тоже занимается большими языковыми моделями в крупных продуктовых компаниях. А всем остальным любопытно будет узнать, как модели учатся и решают конкретные задачи Авито — например, помогают пользователям писать тексты объявлений.

Читать далее

+29

odmin227 1 июл 2024 в 19:30

Графы в рекомендательных системах [часть 1]

Простой

8 мин

5.5K

Python*Big Data*Машинное обучение*

Туториал

Привет, ХАБР! Недавно я писал научную статью с AIRI по графовым рекомендательным системам. Это был мой первый практический опыт работы с этой технологией, поэтому пришлось углубиться в исследования и изучение доступных материалов. Я решил, что пока я разбираюсь в этой теме, было бы полезно поделиться своими находками с вами.

Эта статья будет частью серии, состоящей из двух или трех частей. В первой части мы рассмотрим базовые понятия, концепции и простые модели, а также выделим их ключевые особенности. Вторую часть напишут мои знакомые из WildRecSys, где они расскажут о lightGCN и поделятся своим опытом использования этой модели. Все остальные части можно будет найти в моем телеграм канале, поэтому приглашаю подписаться что бы не пропустить, а вам приятного чтения.

📖 Идем разбираться!

+10

malkovsky 5 мая 2024 в 17:32

Век поиска кратчайшего решения задачи о кратчайшем пути

Средний

22 мин

12K

Python*Программирование*Алгоритмы*OpenStreetMap*Математика*

Обзор

✏️ Технотекст 7

TL;DR Очень подробный разбор алгоритмов решения задачи о кратчайшем пути от классики до двунаправленного А* и ALT с кодом и примерами на OSM

Люди пытались найти более быстрые способы передвижения на протяжении всей своей истории. Появление качественной дорожной системы в римской империи в своё время привело к её расцвету, но со временем выяснилось, что и в продуманных дорожных системах бывают забавные изъяны, как например в небезызвестной задаче о кёнигсбергских мостах, считающейся отправной точкой возникновения теории графов. Неудивительно и то, что с развитием вычислительной техники логистические задачи стали одними из первых, над которыми трудились первопроходцы компьютерных наук. Задача о кратчайшем пути -- одна из них, звучит достаточно просто: есть несколько городов и дорог, соединяющих пару городов между собой, мы хотим попасть из города А в город Б пройдя при этом минимальное расстояние. Первый системный подход к этой задаче был описан в работе Эгервари в 1931г., спустя 25 лет Эдсгер Дейкстра придумал алгоритм, который сейчас является частью любого уважающего себя базового курса алгоритмов на графах. На нём же, будем честны, заканчиваются знания о кратчайших путях у большинства профессиональных разработчиков, ибо сценариев, где реализации с википедии/stackoverflow будет не хватать, крайне мало.

Может показаться, что на самом деле просто не было существенного прогресса с 60х годов, так как Дейкстра предоставил почти асимптотически оптимальный алгоритм решения задачи. На самом деле нет, прогресс был и придумали много чего интересного, хоть и действительно с того времени фокус сместился на другие задачи. Приглашаю под кат если интересно узнать что такого напридумывали, что используется в современных логистических системах, почему меня огорчает отсутствие учёта флага единства в HOMM3 при расчёте пути, ну и наконец, что за мужики на картинке выше рядом с Дейкстрой?

Читать далее

+52

norbit 5 мар 2024 в 13:17

Как мы решали задачу оптимизации доставки грузов с использованием численных методов на примере метода имитации отжига

Средний

7 мин

4.3K

Блог компании ГК ЛАНИТАлгоритмы*Математика*Транспорт

В статье хотим поделиться своим опытом реализации алгоритма решения задачи маршрутизации на основе метода имитации отжига в Norbit CDS – умной системе управления доставкой.

Проанализировав материалы, можно обнаружить различные предлагаемые способы решения VRP-задач (Vehicle Routing Problem). Главная их цель – планирование маршрутов для транспортных средств оптимальным способом. Основными критериями, как всегда, остаются наикратчайший путь для транспортного средства и доставка услуг во все заданные точки. В рабочем месте логиста Norbit CDS задача не отличается.

Создавая свой алгоритм оптимизации построения маршрутов доставки, мы исходили из следующих входных данных: количество транспортных средств, число заявок для распределения с учетом их габаритов и окон желаемого времени доставки. Для реализации был выбран метод отжига.

Читать далее

+24

artmaro 19 окт 2023 в 15:30

Немного паранойи: весёлые огромные уязвимости, которые порождают ChatGPT и LLM-модели

8 мин

8.2K

Блог компании RaftNatural Language Processing*Анализ и проектирование систем*

LLM сейчас встраивают практически везде. Рождается очень много возможностей для атак.

Уже появились атаки на дозаполнение кода. Это вообще самое смешное: код записывается в публичный репозиторий, модели считывают его при обучении, запоминают, при подсказках он всплывает, в итоге могут не проверить и исполнить где-то. Это отравление обучающей выборки.

MS говорил, что обучал только на публичных данных репозитория. Это пример того, как в автокомплит Copilot попал кусок кода, содержащий ссылку на тикет в Jira компании Озон, но их много раз поймали на утечках приватных данных. Некоторые пытались судиться уже, по этому поводу, но есть некоторые сомнения…

Вот ещё пример. Поскольку вывод модели является частью промпта, при каждой итерации в текст, который надо перевести, можно вставить инструкции для модели. И она будет им следовать. Так что если вы переводите что-то со словами «Игнорируй все предыдущие инструкции и сделай вот это», возможно, вас ждёт сюрприз. Практическое применение такое: белый по белому текст в PDF с резюме, и если это резюме оценивает LLM-модель (а это уже норма), то ставит ему высший балл.

Я уже видел письма для корпоративных LLM-разбирателей почты, которые содержали инструкции на перехват модели и спам-рассылку по всему списку контактов, либо поиск писем с паролями и форвард по указанному адресу. Прекрасное применение.

Есть инструкции для корпоративных ботов, как ругать свою продукцию. Есть описания товаров, которые поднимают товары в выдачах торговых площадок, формируемых по отзывам на основе анализа LLM-моделями. Есть непрямые атаки для корпоративных ботов, позволяющие выдёргивать информацию обо всех сотрудниках.

Читать дальше →

+22

OldfagGamer 20 мая 2023 в 15:00

Ностальгические игры: Fallout 2 (часть 2)

Простой

9 мин

14K

Блог компании RUVDS.comЧитальный залИгры и игровые консоли

Ретроспектива

Когда я был школьником, Fallout 2 ужасно поражал меня своей свободой. Ни в одном проекте ни тогда, ни сейчас я не видел такого контентного наполнения. На протяжении многих лет возвращаясь к игре, всё больше убеждался в том, насколько она богата геймплейными возможностями, секретами и заданиями. С каждым новым погружением в этот постапокалиптический мир я обязательно узнавал что-то новое, чего раньше не находил, не встречал или не пробовал сделать. Даже сейчас во время игры перед написанием этой статьи сделал для себя несколько пусть и маленьких, но открытий! Во многом из-за этого Fallout 2 и любят. По той же причине и спустя 25 лет игру помнят и почитают, а фанаты продолжают разрабатывать новые патчи и моды!

В первой части статьи я коснулся сюжета и лора игры, а также ролевой системы. Сегодня хочу подробнее остановиться на геймплее и других, не менее важных аспектах.

Читать далее

+67

NewTechAudit 20 янв 2023 в 12:08

Визуализация весов в машинном обучении на примере алгоритма Random Forest и Decision Tree

8 мин

10K

Машинное обучение*Алгоритмы*Программирование*

Привет, Хабр!

Меня зовут Александр Серов, я Data Scientist и являюсь участником профессионального сообщества NTA. Сегодня загляну «под капот» алгоритмов, использующих в своей основе деревья решений. Один из самых мощных алгоритмов контролируемого машинного обучения на сегодня – градиентный бустинг (Catboost, XBGR), построен на столь казалось легком и базовом элементе, как бинарное дерево, или же дерево решений. Оно является строительным блоком данного алгоритма, в данном случае можно привести притчу про веник и его части, но в этом случае, иногда даже одно дерево решений способно выдать неплохой результат в решениях задач классификации и регрессии. Сегодня я рассмотрю его подробнее, на примере Decision Tree и Random Forest из библиотеки sklearn, а также визуализирую работу.

Читать далее

+6

Efaldgent 19 янв 2023 в 14:00

Интерпретируемость ML-моделей: от инструментов до потребностей пользователя

7 мин

4.5K

Блог компании Open Data ScienceИскусственный интеллектМашинное обучение*Big Data*

Интерпретируемость ML-моделей - очень широкая концепция. То, насколько интерпретация хороша, зависит не только от инструментов и отчетов, которые мы предоставляем пользователю, но и от потребностей пользователя и особенностей задач, которые он решает.

В статье разберемся, как эффективно работать с интерпретируемостью ML-моделей в зависимости от потребностей ключевых пользователей.

Читать далее

+22

AndrewYaremko 28 окт 2022 в 04:24

Не-пирамида Маслоу

34 мин

17K

БиологияЗдоровьеМозгНаучно-популярноеПрофессиональная литература*

Перевод

Недавние исследования нейробиологов в области толерантности человеческого организма к дофамину реабилитируют/легитимизируют представления Авраама Маслоу о мотивации человека.

К моему разочарованию, русскоязычные научные публикации, науч. поп материалы и пособия по маркетингу трактуют работу Маслоу, искажая суть настолько, что порой противоречат оригиналу.

Складывается впечатление, что оригинальную публикацию автора, как в поговорке, «не читал, но осуждаю». И действительно, я не смог найти полного перевода статьи. Что в соавторстве со своим студентом Афанасьевой Екатериной и спешим исправить. Ибо предстоит еще много работы по переоценке традиционных ценностей в современном обществе и приданию ей научного базиса.

По этой причине данная публикация почти дословный перевод, без сокращений, личностных трактовок и интерпретаций.

Читать далее

+25

AlekseiPodkletnov 28 июл 2022 в 09:04

Консалтинг в России — взлёт и перерождение одной из редких профессий, где можно зарабатывать больше айтишников

17 мин

42K

Управление проектами*Бизнес-модели*Карьера в IT-индустрииЧитальный зал

Долгое время в России было две индустрии, куда стремились попасть почти все лучшие выпускники главных бизнес-вузов страны. Это инвестиционный банкинг (про него в другой раз) и топовый управленческий консалтинг. Консалтинговые фирмы успешно наращивали объемы проданных проектов и расширяли офисы. Но этот год в России переживут далеко не все из них. Разбираемся, каким был российский консалтинг до 2022 г., и какой он будет теперь.

Читать далее

+56

yanwork 21 июл 2022 в 10:07

Не трогайте разработчиков. Отстаньте. Просто не беспокойте

13 мин

76K

Блог компании ГазпромбанкУправление проектами*Управление разработкой*

Технотекст 2022

Всем привет! Меня зовут Ян, я руководитель разработки Департамента ИТ инвестиционного бизнеса Газпромбанка. Совершенно неожиданно я занял первое место на конференции Highload++ с докладом про то, как организована работа в наших командах разработки.

Очень коротко: мы пересобрали процесс разработки как таковой, постаравшись выкинуть оттуда явно кривые решения. Получилось следующее: каждые две недели в команде есть дежурный, который отвечает вообще за все внешние коммуникации. То есть он не разрабатывает, а ловит всех входящих в мессенджерах и в личке и не даёт им пробиться до самой команды. Естественно, этот дежурный знает всё происходящее и может ответить на любой вопрос, а это требует и понимания архитектуры, и знания интерфейсов, и понимания особенностей кода коллег.

В результате из простой задачи «не трогайте разработчиков» получилось сделать и очень правильное обучение (если вы дежурите, то у вас нет шансов не разбираться во всех процессах команды), и снижение техдолга (дежурный не берёт таски по фичам на спринты, но может заниматься документацией и всякими вещами в наведении порядка, до чего обычно не доходят руки), и много чего ещё. Сначала казалось, что за это мы платим снижением эффективности команды на 8–10 % (ведь мы выключаем дежурного из разработки), но на деле оказалось, что эффективность даже растёт. Есть ряд вещей, которые очень поменялись и в управлении такими командами в лучшую сторону.

Естественно, такой подход имеет кучу подводных камней и подходит далеко не всем и не каждому типу команд.

Сейчас расскажу про практический опыт.

Читать дальше →

+153

just_e1f 15 июл 2022 в 09:42

Никогда не приоритизировали, а тут приспичило: как появился Dodo Score

6 мин

3K

Блог компании Dodo EngineeringУправление продуктом*

В статье расскажем, что такое Dodo Score и почему у нас появилась потребность в сквозной приоритизации задач. Будем рады, если наш опыт поможет вам прокачать скилл делать только самое ценное или приведёт к мысли, как улучшить тот фреймворк, который вы используете.

Читать далее

+5

Ccelebro 7 июл 2022 в 23:53

Случайность на страже криптографии: как Cloudflare использует лава-лампы, маятники и распад урана для шифрования трафика

5 мин

14K

Блог компании SelectelIT-инфраструктура*Криптография*Облачные сервисы*

^{Траектория движения элементов хаотического маятника — повторений нет}

Случайные числа играют важнейшую роль в криптографии. Например, алгоритмы формирования электронно-цифровых подписей используют именно случайные числа для формирования ключей. И требования к этим числам весьма строгие, поскольку надежность системы шифрования данных напрямую от них зависит. К сожалению, реально случайные числа получить сложно, хотя и возможно, поэтому обычно для решения этой задачи используются генераторы псевдослучайных чисел. Так называют алгоритм, который генерирует последовательность чисел элементы которой независимы друг от друга и подчиняются заданному распределению.

Но есть и компании, которые решают задачу иначе — они используют генераторы true-случайных чисел. Это вовсе не компьютерные программы, а необычные устройства или даже так называемые лавовые лампы. Именно их использует компания Cloudflare — примерно с 2017 года. В течение пяти лет надежность шифрования трафика, который проходит через инфраструктуру компании, зависит от ламп, а также маятников и процесса радиоактивного распада урана. Подробности — под катом.

Читать дальше →

+55

FFormula 7 июл 2022 в 17:57

Способы хранения графа в памяти компьютера

4 мин

34K

Блог компании OTUSАлгоритмы*

В предыдущей статье мы познакомились с терминами и определениями теории графов. В этой же статье обсудим различные способы представления графа в памяти компьютера для его обработки. Покажем, какие структуры данных можно использовать, а также проговорим преимущества и недостатки каждого способа.

Читать далее

+42

BeyondTheHype 19 июн 2022 в 11:08

Как правильно отвечать на вопрос “Какие у вас зарплатные ожидания?” на рынке США

6 мин

68K

IT-эмиграцияКарьера в IT-индустрии

На первом интервью чаще всего рекрутер может задать вопрос о зарплатных ожиданиях кандидата — “What Are Your Salary Expectations?”. Я принимаю участие в найме продукт-менеджеров, дизайнеров и инженеров и хочу поделиться с вами своим опытом как правильно отвечать на этот вопрос применительно к рынку США.

Я не рекомендую раскрывать никаких цифр как на ранней стадии процесса интервью, так и во время раунда интервью. В этой статье я расскажу почему именно такая стратегия является наиболее выигрышной.

Читать далее

+76

daniil_dzheparov 2 мая 2022 в 15:25

Оконные функции SQL простым языком с примерами

4 мин

646K

SQL*Администрирование баз данных*Data Engineering*

Recovery Mode

Привет всем!

Сразу хочется отметить, что данная статья написана исключительно для людей, начинающих свое путь в изучении SQL и оконных функций. Здесь могут быть не разобраны сложные применения функций и могут не использоваться сложные формулировки определений - все написано максимально простым языком для базового понимания.

P.S. Если автор что-то не разобрал и не написал, значит он посчитал это не обязательным в рамках этой статьи)))

Для примеров будем использовать небольшую таблицу, которая показывает оценки учеников по разным предметам. В БД табличка выглядит следующим образом

Читать далее

+58

1