Статьи / Профиль alexwortega / Хабр

Alex wortega @alexwortega

Roleplay молодого DS

Профиль Публикации 8Комментарии 60Закладки 4

alexwortega 23 янв в 08:43

Вихрь — семейство переведенных русскоязычных LLM

Средний

5 мин

19K

Natural Language Processing*

Кейс

Мы русифицировали Mistral и он работает лучше(по бенчмаркам) чем закрытые русскоязычные LLM. Как мы это сделали, ссылки на модели и бенчмарки - в статье.

+36

alexwortega 5 ноя 2023 в 16:52

Hidden Gem — LLava 1.5

Средний

1 мин

5.3K

Python*Искусственный интеллект

Обзор

Вероятно лучшая опенсурс модель для Captioning, VQA, QA и прочих задач требующих ответить на вопросы опираясь на изображения. От читателя ожидается что он знает чем отличается alpaca от vicuna и почему VIT это круто.

alexwortega 21 фев 2022 в 09:03

Учим гипермодальный трансформер предсказывать калорийность борща

7 мин

3.8K

Python*Машинное обучение*

Туториал

Сегодня мы обучим мультимодальный трансформер предсказывать калорийность блюд

alexwortega 30 авг 2021 в 18:00

Видеосказки от ИИ: разбор бейзлайна трека Creative AI в рамках AIIJC

9 мин

2.9K

Блог компании СберМашинное обучение*Искусственный интеллектNatural Language Processing*

Привет, Хабр!

Сегодня мы, команда Sber AI, расскажем про бейзлайн генерации сказок с озвучкой и картинками, который мы предложили в рамках трека по Creative AI международного соревнования для школьников Artificial Intelligence International Junior Contest (AIIJC): рассмотрим аспекты обучения conditional ruGPT-3, генерацию музыки, генерацию изображения по текстовой строке, а также обсудим некоторые проблемы, с которыми пришлось столкнуться во время обучения и дообучения моделей.

В этом посте мы хотим разобрать (и разобраться сами), как можно использовать и объединять генеративные (и не только) модели для решения одной большой задачи — генерации контента. Мы подобрали большое количество материалов про каждую конкретную модель, чтобы ими можно было пользоваться сразу.

alexwortega 7 авг 2021 в 13:04

Краткий пересказ Towards Pretrained Transformers As universal Computation Engines

4 мин

1.6K

Natural Language Processing*

Recovery Mode

Данная статья представляет собой вольный пересказ https://arxiv.org/abs/2103.05247

Аннотация

Данная статья является разбором свежей статьи от исследователей из университета Беркли "Pretrained Transformers As Universal Computation Engines". В статье решается задача дообучения трансформеров на новые виды информации, такие как: изображения, битовые операции, математические выражения и последовательности белков.

Архитектура трансформер стала основой существующих успехов глубокого обучения, породив череду моделей обработки естественного языка таких как GPT, BERT или T5, которые сейчас представлены в зоопарке русскоязычных моделей сбера. Впоследствии архитектура трансформера стала применяться и в задачах задачах компьютерного зрения (CLIP, ImageGPT, Dall·E).

Идея данной статьи происходит из того, что гигантские языковые модели обучаются на больших массивах данных, в том числе, Википедии, Reddit и т. д. Поэтому модели обладают широкими фактологическим знаниями, например, о годах рождения известных личностей.

alexwortega 23 апр 2020 в 21:13

Задачи компьютерного зрения — поиск объектов нужного цвета

3 мин

6.1K

Python*

Туториал

Введение

Сегодня я расскажу о том как распознать контур нужного цвета с помощью python/ opencv такая задача часто встречается в робототехнике, и всяких автоматизациях.

С помощью предложенного решения можно например различать контур линии за которую не должен выезжать робот, или обьект для коптера. Такая задача может возникнуть если нужно например ~~увидеть что в корзину положили апельсин~~.

Читать дальше →

alexwortega 12 апр 2020 в 00:58

Unigine Engine — новый уникальный

4 мин

22K

C++*C#*CGI (графика)*

Пролог

Не так давно я увидел showreel движка, который выглядит более чем конкурентно

showreel

В этой статье я максимально кратко расскажу об этом движке и косвенно сравню с прямыми конкурентами.

зарегестрироваться и скачать тут

unigine.com

Немного про историю

Все началось в 2004(!) году с Александра Запрягаева и его opensource проекта.

В 2010 году вышел Heaven Benchmark на основе Unigine.

В 2012 вышла спорная с точки зрения геймплея, но симпатичная OilRush.

OilRush

В 2017 вышла забавная индюшка

Sumoan

Текущее состояние

10 апреля 2020 вышла Community версия, которую можно, использовать если у вашей компании доход меньше 100к$ или для некоммерческого проекта.

+25

alexwortega 8 мар 2020 в 17:15

Генерируем тексты песен цепями Маркова

2 мин

15K

Python*Машинное обучение*

Туториал

Из песочницы

Сегодня я хочу рассказать про свой опыт генерации текста песен с помощью python и библиотеки Markovify

Дисклеймер: автор хотел повеселить себя вечером и не придумал ничего лучше, как:

В качестве корпуса для "~~обучения~~" цепи я буду использовать текст песен группы Кис Кис.

Пикча выше иллюстрирует то как работает цепь Маркова. А вот неплохая статья.

Читать дальше →

+17