Статьи / Профиль AlanRobotics / Хабр

@AlanRobotics

Пользователь

Профиль Статьи 6Посты Новости Комментарии 23

AlanRobotics 26 ноя 2024 в 11:24

Как мы создали LLM-модель Cotype Nano

7 мин

8.5K

Блог компании MTS AIБлог компании МТСNatural Language Processing*Искусственный интеллектМашинное обучение*

На связи группа фундаментальных исследований MTS AI. В этой статье мы расскажем про дроп трех маленьких моделей Cotype-Nano, Cotype-Nano-4bit и Cotype-Nano-CPU. Расскажем, как нам удалось достичь 1 места на RuGeneralArena в своей весовой категории.

+35

AlanRobotics 31 июл 2024 в 15:32

Вызов функций с помощью LLM

14 мин

6.4K

Блог компании MTS AIБлог компании МТСNatural Language Processing*Искусственный интеллектМашинное обучение*

Всем привет, меня зовут Алан, я разработчик-исследователь из команды фундаментальных исследований MTS AI. Мы изучаем возможности генеративного ИИ, и видим, что большие языковые модели отлично справляются с различными текстовыми задачами, но мы можем расширить их функционал. Например, пока что LLM не может правильно посчитать логарифм, узнать погоду или какую-то другую информацию. Как решить эту задачу? Нужно научить модель пользоваться внешними инструментами/функциями. В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.

+15

AlanRobotics 5 фев 2024 в 20:34

Как ускорить LLM-генерацию текста в 20 раз на больших наборах данных

7 мин

12K

Блог компании MTS AIМашинное обучение*Искусственный интеллектNatural Language Processing*

Всем привет, я Алан, разработчик-исследователь в MTS AI. В команде фундаментальных исследований мы занимаемся исследованием LLM, реализацией DPO и валидацией наших собственных языковых моделей. В рамках этих задач у нас возникла потребность в генерации большого количества данных с помощью LLM. Такая генерация обычно занимает много времени. Однако за последний год, с ростом популярности LLM, стали появляться различные инструменты для развертывания таких моделей. Одной из самых эффективных библиотек для инференса языковых моделей является библиотека vLLM. В статье показывается, как с помощью асинхронных запросов и встроенных особенностей vLLM можно увеличить скорость генерации примерно в 20 раз. Приятного чтения!

+17

AlanRobotics 13 дек 2023 в 16:10

LLMClone: как клонировать себя в Telegram

8 мин

18K

Блог компании MTS AIМашинное обучение*Искусственный интеллектNatural Language Processing*

✏️ Технотекст 2023

У меня, как и у многих, довольно много чатов в телеграмме. Иногда просто нет времени (а иногда и не хочется) отвечать на некоторые сообщения. Именно так возникла идея создания виртуального клона. В статье рассматривается простая идея, состоящая в том, чтобы зафайнтюнить языковую модель на личных сообщениях, выгруженных из Telegram-чатов. Возможно, в дальнейшем такой клон сможет общаться за вас

+31

AlanRobotics 7 сен 2023 в 11:49

LLaMa vs GigaChat: может ли опенсорсная модель работать лучше LLM с 13 млрд параметрами?

9 мин

12K

Блог компании МТСБлог компании MTS AIМашинное обучение*Искусственный интеллектNatural Language Processing*

Всем привет, меня зовут Алан, я разработчик-исследователь в MTS AI, мы сейчас активно изучаем LLM, тестируя их возможности. В настоящее время в России вышло несколько коммерческих языковых моделей, в том числе GigaChat и YandexGPT, которые хорошо выполняют текстовые задачи. В этой статье показывается, что языковая модель меньшего размера, обученная на открытых данных за несколько часов, показывает сравнительно неплохую, а в некоторых случаях и лучшую производительность относительно больших коммерческих решений. На небольшом количестве примеров мы проверим способность моделей решать простые математические задачи, отвечать на вопрос по заданному контексту, в котором содержатся числа и выполнять простые текстовые инструкции. Затем мы кратко рассмотрим, как и на чем обучалась наша модель.

+11

AlanRobotics 9 июн 2023 в 12:25

AIsaacChat: ИИ чатбот на основе ruT5

5 мин

2.6K

Natural Language Processing*Машинное обучение*Искусственный интеллектРазработка под iOS*Flask*

Из песочницы

AIsaacChat — это мобильное приложение, которое может общаться, выполнять простые текстовые инструкции и генерировать картинки.

2023 год стал годом нового бума обработки естественного языка. В магазинах мобильных приложений можно найти огромное количество продуктов с ИИ. В основном под капотом подобные приложения обращаются к API компании OpenAI (chatGPT), и с технической точки зрения реализовать это довольно несложно. Идея создания AIsaacChat была в том, чтобы оно обращалось с языковой модели, которую мы дообучим с помощью своих ресурсов.

Второй причиной создания стала идея объединить в одном приложении генерацию картинок и текста. Очевидно, что таких приложений много, разница состоит в том, что AIsaac может понимать ваши намерения. Что это означает для пользователя? Вы можете задавать Айзеку команды в произвольной форме (“можешь резко нарисовать дом в стиле Ван Гога”), и он поймет, что именно вы от него хотите: сгенерировать текст или картинку.

Как мы создали LLM-модель Cotype Nano

Вызов функций с помощью LLM

Как ускорить LLM-генерацию текста в 20 раз на больших наборах данных

LLMClone: как клонировать себя в Telegram

LLaMa vs GigaChat: может ли опенсорсная модель работать лучше LLM с 13 млрд параметрами?

AIsaacChat: ИИ чатбот на основе ruT5

Информация

Специализация