Статьи / Профиль high

@high_fly

Пользователь

Профиль Публикации 6Комментарии 15Закладки

high_fly 16 мая в 00:10

LLM field landscape

Средний

43 мин

4.6K

Машинное обучение*Искусственный интеллектNatural Language Processing*

Обзор

Ради чего эта статья?

Сфера генеративных моделей сегодня кипит, булькает и шипит — каждый день выходят новые статьи, новые бенчмарки, новая модель вырывается вперёд на Arena, открывается очередной AI‑стартап… Только мы успеваем потрогать одну модель и сделать свои выводы, выходит другая, а Sam Altman в каждом интервью намекает, насколько GPT-5 будет умнее, лучше и круче, чем GPT-4.

В общем, за сферой LLM сегодня очень трудно уследить. Но уследить хочется. Хочется сделать снэпшот, в котором отразить максимально актуальное состояние области на текущий момент, насколько это возможно, чтоб было от чего отталкиваться потом. На самом деле, это задача для серьёзного научного review, но лучшее враг хорошего, поэтому начну я со статьи на Хабре.

+14

high_fly 16 дек 2023 в 21:04

Сможем ли мы контролировать сверх-интеллект? – новая статья от OpenAI

Средний

8 мин

13K

Машинное обучение*Искусственный интеллектNatural Language Processing*

14 декабря OpenAI опубликовали статью, в которой показывают, что люди смогут улучшать полезность потенциально созданного в будущем сверх-интеллекта несмотря на то, что будут глупее него. При этом, судя по всему, людям будет очень сложно оценивать ответы сильного ИИ,и RLHF в нынешнем его виде будет работать не слишком хорошо.

high_fly 12 дек 2023 в 22:47

Mixtral 8x7B – Sparse Mixture of Experts от Mistral AI

Средний

4 мин

12K

Open source*Машинное обучение*Искусственный интеллектNatural Language Processing*

11 декабря 2023 года Mistral AI, парижский ai-стартап, основанный 7 месяцев назад, выпустил новую модель Mixtral 8x7B – high-quality sparse mixture of experts model (SMoE). Многие считают модели Mistral AI самыми крутыми из открытых llm-ок, я тоже так считаю, поэтому интерес к новой модели есть большой. В этой статье я хочу коротко пробежаться по тому, как устроена новая модель и какие у её архитектуры преимущества. На некоторых технических моментах я буду останавливаться более подробно, на некоторых – менее.

+10

high_fly 26 июл 2022 в 23:35

LASSO и Ridge Регрессия. Что же значит та картинка

8 мин

23K

Математика*Машинное обучение*

Пыталась я вникнуть в устройство регрессии LASSO и Ridge… И сделала объективный вывод, что верхнеуровнево про них много где хорошо и подробно написано. Человеку непосвящённому легко найти понятные объяснения, просто погуглив. Но я-то человек посвящённый! Я хочу понять! Но вот беда — в русскоязычных блогах я нигде не смогла найти толкового прояснения некоторых метаматематических моментов работы лассо и ридж регрессии. Пришлось доходить до понимания самой с опорой на пару англоязычных источников, и я решила изложить некоторую математику, лежащую в основе лассо и ридж в этой статье.

+11

high_fly 17 июл 2022 в 20:45

Глубокое погружение в рекомендательную систему Netflix

12 мин

Big Data*Data Engineering*

Перевод

Как Netflix добился 80 процентов от всего своего стримингового времени благодаря персонализации.

high_fly 20 июн 2022 в 11:00

Netflix. Архитектура системы персонализации и рекомендаций

9 мин

4.5K

Анализ и проектирование систем*IT-инфраструктура*Big Data*Машинное обучение*Data Engineering*

Из песочницы

Перевод неточный, некоторые куски пропущены, так как показались мне повторением уже высказанных выше мыслей, некоторые - уточнены и дополнены примерами.

В предыдущих постах о персонализации в Netflix уже говорилось о том, что и данные, и алгоритмы их обработки одинаковы важны в задаче персонализации пользовательского опыта. Также важно вовлекать пользователя в систему рекомендаций - получать от него так больше откликов и данных. Сегодня мы поговорим о том, как может выглядеть архитектура, которая может максимизировать пользу от собираемых данных и поддерживает возможность быстрого внедрения нововведений.