Как стать автором
Обновить
0
0
Анна Родина @Ann_Rodina

Контент-менеджер

Отправить сообщение

Сравнение работы MTS AI Chat с другими русскоязычными LLM

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров3.3K

Всем привет!

Мы в MTS AI занимаемся созданием технологий и продуктов на базе искусственного интеллекта. Непосредственно наша группа фундаментальных исследований разрабатывает LLM и модели для генерации кода.

В этой статье мы представим нашу первую фундаментальную модель MTS AI Chat-7B. Также сравним результаты ее работы с другими русскими языковыми моделями, такими как YandexGPT, GigaChat и GigaChat‑Pro.

Читать далее
Всего голосов 25: ↑23 и ↓2+21
Комментарии3

Обзор Llemma: новая математическая open-source модель

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров6.9K

Привет! Меня зовут Дарина, и я занимаюсь фундаментальными исследованиями в MTS AI. Основной фокус нашей работы сейчас — обучение больших языковых моделей, их тестирование и оптимизация.

Сегодня хочу сделать обзор на недавно вышедшую статью LLEMMA: an open language model for mathematics. Расскажу про обучение модели, новый датасет Proof-Pile-2 и в конце сравню ее с ChatGPT и GPT-4 на ЕГЭ заданиях по профильной математике.

Читать далее
Всего голосов 14: ↑13 и ↓1+12
Комментарии6

Собираем русскоязычный лонгформер шаг за шагом

Время на прочтение8 мин
Количество просмотров7.2K

Привет, меня зовут Андрей Казначеев, я NLP engineer в компании MTS AI. В этой статье я расскажу, как создал лонгформер для русского языка. Все началось с того, что мне подкинули задачу по классификации длинных диалогов. Тексты длинные, а большинство популярных моделей имеют строгое ограничение по длине входной последовательности. Хотелось сделать решение умнее, чем просто побить текст на куски, однако ничего готового для русского языка не нашел. Тогда я задумался, а так ли сложно сделать свою собственную версию лонгформера под русский язык? Оказалось, совсем не сложно.

Читать далее
Всего голосов 38: ↑38 и ↓0+38
Комментарии21

LLaMa vs GigaChat: может ли опенсорсная модель работать лучше LLM с 13 млрд параметрами?

Время на прочтение9 мин
Количество просмотров9.9K

Всем привет, меня зовут Алан, я разработчик-исследователь в MTS AI, мы сейчас активно изучаем LLM, тестируя их возможности. В настоящее время в России вышло несколько коммерческих языковых моделей, в том числе GigaChat и YandexGPT, которые хорошо выполняют текстовые задачи. В этой статье показывается, что языковая модель меньшего размера, обученная на открытых данных за несколько часов, показывает сравнительно неплохую, а в некоторых случаях и лучшую производительность относительно больших коммерческих решений. На небольшом количестве примеров мы проверим способность моделей решать простые математические задачи, отвечать на вопрос по заданному контексту, в котором содержатся числа и выполнять простые текстовые инструкции. Затем мы кратко рассмотрим, как и на чем обучалась наша модель.

Читать далее
Всего голосов 15: ↑13 и ↓2+11
Комментарии7

Пять книг про NLP, с которых можно начать

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров13K

Всем привет! Меня зовут Валентин Малых, я — руководитель направления NLP-исследований в MTS AI, вот уже 6 лет я читаю курс по NLP. Он проходит на платформе ODS, а также в нескольких университетах. Каждый раз при запуске курса студенты спрашивают меня про книги, которые можно почитать на тему обработки естественного языка. Поскольку я все время отвечаю одно и то же, появилась идея сделать пост про мой список книг, заодно описав их. 

Читать далее
Всего голосов 13: ↑13 и ↓0+13
Комментарии7

«За три года я победил в семи международных соревнованиях по ИИ». Лайфхаки и стратегии финалиста конкурсов NASA и Google

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.4K

Аммар Али вместе со своим другом  Жаафаром Махмудом взяли золото каггла по созданию 3D-реконструкции. Их команда вошла в топ-10 победителей конкурса Google Image Matching Challenge 2023. Аммар Али работает старшим инженером-исследователем MTS AI и учится в аспирантуре ИТМО на факультете информационных технологий и программирования, его друг Жаафар тоже аспирант ИТМО, но учится на факультете систем управления и робототехники. В Image Matching от Google они принимают участие второй год подряд. В 2022-м вошли в топ-30. Для Аммара это далеко не первая победа в международном конкурсе. Мы решили узнать у него подробности - какое решение принесло им золото Image Matching Challenge 2023, и как вообще победить на международных соревнованиях по ИИ.

— Аммар, поздравляем тебя с победой. Расскажи немного о конкурсе.

— Google Image Matching Challenge проходит ежегодно, начиная с 2019-го. В этом году конкурс длился два месяца с 11 апреля по 12 июня. Целью было создать 3D-реконструкцию объекта по датасету из фотографий. Честно говоря, для меня это было немного сложнее, чем в прошлом году, потому что требовались не только знания в области машинного обучения. Нам было нужно применить дополнительные алгоритмы, математическую оптимизацию структуры для построения 3D-реконструкции, где до сих пор специализировались на Slam в целом в робототехнике. В конкурсе я отвечал за часть задач, связанную с искусственным интеллектом, а Жаафар занимался  оптимизацией и настройкой алгоритмов. 

— Какое решение вы предложили? 

Читать далее
Всего голосов 22: ↑19 и ↓3+16
Комментарии5

Как использовать метод Дэвида-Скина для агрегации разметки. Разбираем по шагам

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.9K

Всем привет. Открываю серию статей, посвященную агрегации разметки. Этим вопросом я активно занимался, пока работал в нашем центре компетенций по работе с данными: нам нужен был механизм агрегации разметки из разных задач. По пути накопил материалов и, причесав, делюсь с вами. 

В этой части я расскажу про модель Дэвида-Скина, которая заложила основы для многих методов агрегации разметки и является второй по значимости после голосования большинством. Многие создатели проектов следуют этому методу для повышения качества данных. Изначально он был разработан в 1970-х для вероятностного моделирования медицинских обследований. Именно поэтому разберем этот метод на примере с докторами. 

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

Переходим на личности: как создать не просто бота, а виртуального персонажа с характером и историей

Время на прочтение18 мин
Количество просмотров6.6K

Надоели стандартные боты с типовыми запросами? Да, мы вас очень понимаем.

Именно поэтому в этой статье мы решили поделиться своим исследованием по созданию не просто ботов, а виртуальных личностей с проработанным характером.

Эти наработки появились немного раньше, чем к нам пришел заказчик с запросом на виртуального персонажа, так что на наших глазах теория становилась практикой.

Читать далее
Всего голосов 11: ↑9 и ↓2+7
Комментарии3

Bag of tricks для разметки текстовых данных: Часть 2. Удаление дубликатов

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.9K

Привет! Меня зовут Ирина Кротова, я NLP-исследователь из компании MTS AI. В этой статье из цикла про разметку данных я расскажу об ещё одном способе собирать данные более качественно и экономить на разметке — фильтрации похожих друг на друга текстов.

В предыдущей статье я рассказывала о том, что такое аннотация данных, как это связано с работой инженера машинного обучения и о способах сократить количество ручной разметки в проекте.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии1

AI-focused digest: ИИ для удаления шумов с космических фото, генерация изображений на основе фМРТ мозга

Время на прочтение4 мин
Количество просмотров1K

Всем привет! 

В апрельском выпуске AI-focused digest мы расскажем, как можно сократить затраты на обучение больших ML-моделей, как японские ученые научили нейросеть генерировать изображения по фМРТ мозга. Также поговорим о новом CV-алгоритме для улучшения астрономических фото. В заключении порекомендуем исследовательскую статью, которая поможет лучше понять, чего ждать от стремительного развития языковых моделей. 

Читать далее
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

Bag of tricks для разметки текстовых данных: Часть 1. Четыре способа размечать меньше

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров3K

Привет! Меня зовут Ирина Кротова, я NLP-исследователь из компании MTS AI. Мы не понаслышке знаем, что сбор и разметка данных часто становятся “бутылочным горлышком" в проектах, связанных с машинным обучением. У нас в компании есть постоянная необходимость в разных видах разметки аудио, текста и изображений.

В этой статье я хочу поделиться лайфхаками по подготовке и разметке текстовых датасетов и возможными "граблями", на которые можно наступить, если вы создаете датасет впервые. Многие из этих советов универсальны, но основной фокус сделан на обработке естественного языка, поскольку я опираюсь в первую очередь на собственный опыт: в разное время я работала с юридическими документами, доменными чат-ботами и участвовала в подготовке и проведении соревнования по автоматической детоксификации текстов.

Читать далее
Всего голосов 10: ↑10 и ↓0+10
Комментарии2

Автоматическое исправление ошибок ASR с помощью sequence-to-sequence моделей

Время на прочтение11 мин
Количество просмотров2.7K

Всем привет, я Алсу Вахитова — NLP-разработчица в MTS AI. Вместе с коллегами мы создаем различные алгоритмы обработки текста и извлечения информации из него. Большое количество проектов включает в себя взаимодействие с командами из “соседних” доменов, например, automatic speech recognition (ASR). Одна из таких задач - исправление ошибок в результате работы ASR методов (ASR error correction). В этой статье я приведу теоретический обзор некоторых статей, решающих данную проблему.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии3

Как мотивировать команду нефинансовыми методами, поддержать сотрудников в трудные времена и завоевать их доверие

Время на прочтение9 мин
Количество просмотров5.5K

Привет, меня зовут Павел Дубков, я - директор департамента интеграции MTS AI. 

Я достаточно давно руковожу различными подразделениями, но еще лет 15 назад, когда был обычным разработчиком, стал присматриваться к своим руководителям и задаваться вопросом: что заставляет людей работать много, эффективно, искать новые подходы к решению различных задач и в целом ходить на работу с удовольствием?

В этой статье я расскажу о способах нефинансовой мотивации, которые я использую в своей команде. Немного похвалюсь. Так сложилось, что мне всегда было интереснее прочитать какой-нибудь мануал, который можно использовать в работе, чем литературу по управлению персоналом. Поэтому все, о чем вы прочитаете далее, - мои собственные лайфхаки и выводы, а также приемы других руководителей, а не прочитанные где-то умные мысли. Они будут полезными всем, кто сейчас хочет сплотить команду и помочь сотрудникам работать эффективнее.

Читать далее
Всего голосов 19: ↑13 и ↓6+7
Комментарии21

Как навести порядок в AI-продукте: опыт внедрения методологии Event Modeling

Время на прочтение11 мин
Количество просмотров1.7K

Всем привет, я Алексей Некрасов @letitshine (@znbiz) —  Lead направления Python в МТС и старший архитектор в MTS AI. Вместе с коллегой Галиной Прохоровой (@letitshine — product manager в MTS AI — решили поделиться историей внедрения методологии Event Modeling в существующий продукт. Мы расскажем, с какими трудностями наша команда столкнулась и как их преодолела.

Читать далее
Всего голосов 3: ↑2 и ↓1+1
Комментарии10

Edge AI чипы от Kneron. Собираем оригинальный девайс

Время на прочтение12 мин
Количество просмотров2.3K

Custom Device

Привет, я Антон Маслов, ведущий разработчик в MTS AI.


В предыдущих статьях я рассказывал о том, как работает распознавание изображений на чипе KL520 с помощью нейросети Tiny YOLOv3, а так же о том, как устроена, из чего состоит и как собирается прошивка чипов KL520. И вот теперь, когда мы познакомились с технологией Edge AI в общих чертах, мы можем отправиться в самое увлекательное путешествие и создать на базе KL520 собственный оригинальный девайс!


Читать дальше →
Всего голосов 5: ↑5 и ↓0+5
Комментарии2

Edge AI чипы от Kneron. Ныряем в прошивку

Время на прочтение17 мин
Количество просмотров1.5K

Dive

Привет, я Антон Маслов, ведущий разработчик в MTS AI.


В предыдущей своей статье я рассказывал в общих чертах о том, что это за чипы такие от Kneron (микроконтроллеры со встроенными нейроускорителями), что такое нейроускоритель, чем так интересна технология периферийного искусственного интеллекта Edge AI, и как вообще с этим работать. А еще о том, как на чипе KL520 запустить систему распознавания изображений с помощью нейросети Tiny YOLOv3.


Теперь я расскажу о самой важной части, о прошивке чипов. О том, из чего она состоит, как собирается, как вообще устроен софт такой навороченной многоядерной системы на кристалле, как KL520. Поделюсь историей и опытом миграции из одного компилятора в другой.


Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Как установить лицензионную защиту кода на Python и обезопасить данные с помощью HASP?

Время на прочтение6 мин
Количество просмотров11K

Всем привет, я Вячеслав Жуйко – Lead команды разработки Audiogram в MTS AI.

При переходе от On-Cloud размещений ПО на On-Premises в большинстве случае перед вами неизбежно встанет задача защиты интеллектуальной собственности – и она особенно критична для рынка AI, где задействуются модели, обладающие высокой ценностью для компании. К тому же, в этой сфере широко используется интерпретируемый язык Python, ПО на котором содержит алгоритмы, являющиеся интеллектуальной собственностью компании, но фактически распространяется в виде исходных кодов. Это не является проблемой для On-Cloud решений, но в случае с On-Premises требует особой защиты как от утечек кода, так и самих данных.

Рассказываю реальную историю решения этой, казалось бы, не самой тривиальной задачи. Итак, обо всем по порядку.

Читать далее
Всего голосов 16: ↑15 и ↓1+14
Комментарии17

[В закладки] Аналоги Canva: 12 сервисов для работы с изображениями

Время на прочтение5 мин
Количество просмотров7.7K

Когда сервис Canva объявил о прекращении работы в России, многие SMM-специалисты, маркетологи, дизайнеры, таргетологи остались без одного из главных инструментов для работы с креативами. Рассказываем о подборке сервисов, имеющих схожий функционал, которые могут применяться для решения рабочих задач.

Читать далее
Всего голосов 3: ↑2 и ↓1+1
Комментарии3

Как мы столкнулись с версионированием и осознали, что вариант «просто проставить цифры» не работает

Время на прочтение7 мин
Количество просмотров12K

Всем привет, я Алексей Некрасов - Lead направления Python в МТС и старший архитектор в MTS AI.

Хочу поделиться своим опытом внедрения версионирования и рассказать, как сделать первый шаг в реализации стратегии blue/green или канареечного развертывания, что для этого нужно и какие есть инструменты.

Если вы используете в docker-образах тег latest, или у вас недоступна система во время деплоя нового релиза, то эта статья — отправная точка для улучшения вашего продукта.

Читать далее
Всего голосов 12: ↑11 и ↓1+10
Комментарии32

Edge AI чипы от Kneron. Что это такое и как оно работает

Время на прочтение10 мин
Количество просмотров6.5K

Kneron

Привет, я Антон Маслов, ведущий разработчик в MTS AI.


Некоторое время назад мне довелось глубоко погрузиться в очень необычные чипы на базе технологии Edge AI. Микроконтроллеры со встроенными нейроускорителями. И позапускать на них самые разные кейсы. Оказалось, что это очень классная штука. И стоит недорого, и работает быстро. А, главное, мелкая. Так что можно встроить в любой девайс.


Я расскажу об опыте погружения в технологию Edge AI, про то, как устроен чип с нейроускорителем, а также про то, с какими трудностями пришлось столкнуться, чтоб заставить все это работать.


Читать дальше →
Всего голосов 26: ↑24 и ↓2+22
Комментарии3
1

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Работает в
Дата рождения
Зарегистрирована
Активность