Articles / Bookmarks / Profile of Rai220 / Habr

Rai220 @Rai220

User

ProfileArticles7PostsNewsComments279

mashkka_t Jul 24 2024 at 14:16

ruMTEB: новый бенчмарк для русскоязычных эмбеддеров

Medium

11 min

9.2K

SberDevices corporate blogMachine learning*Artificial Intelligence

Салют, Хабр! На связи команды AGI NLP и нейронных сетей Виртуального ассистента Салют. В SberDevices наши команды занимаются созданием бенчмарков, а также обучением моделей для векторных представлений текстов или эмбеддеров. В этой статье расскажем про наш новый русскоязычный бенчмарк для эмбеддеров текста — ruMTEB.

+35

mials Jul 2 2024 at 09:36

Live SymFormer Show. Музыкальное шоу с использованием AI-технологий

Medium

5 min

814

SberDevices corporate blogSoundArtificial IntelligenceMachine learning*

Case

Салют, Хабр! На связи Алексей Минин. В SberDevices наша команда занимается созданием и развитием решений в области генеративной музыки. В этой статье хочу рассказать о том, как мы реализовали музыкальное шоу с применением технологий AI на прошедшей в апреле конференции GIGA RnD Day. В тот день на сцене вживую импровизировали музыканты и вместе с ними наша нейросетевая модель для генерации музыкальных произведений — SymFormer. В результате симбиоза живого исполнения и технологий на сцене создавалась уникальная музыкальная композиция в режиме реального времени.

+19

GVRQ Apr 27 2024 at 09:07

GIGA R&D DAY: материалы конференции

Easy

6 min

SberDevices corporate blogMachine learning*Artificial Intelligence

На недавней конференции GIGA R&D DAY, организованной командой R&D SberDevices, участники обсудили последние достижения в разработке GigaChat, NLP, Vision и Audio.

Событие собрало ведущих специалистов и экспертов в области искусственного интеллекта, которые поделились своими идеями и разработками. В день рождения GigaChat'a делимся с вами видеозаписями выступлений и презентациями докладов, которые охватывают широкий спектр тем от мультимодальности и мультиэкспертности до проблем alignment и задач генерации речи.

+24

Rai220 Feb 20 2024 at 08:03

Какой плащ был у Понтия Пилата? Отвечает GigaChat

Medium

10 min

12K

SberDevices corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Review

Всем привет! На связи лид разработки SDK GigaChat’a — Константин Крестников. В этой статье я расскажу о том, что такое GigaChain и как в целом SDK позволяет упростить жизнь разработчика LLM, например, научить LLM давать ответы на вопросы по вашим документам или работать в режиме автономного агента. Также поговорим про решения, которые практически невозможно сделать без использования SDK.

GigaСhain — это ответвление (fork) открытой библиотеки LangСhain на Python. Её главная цель — облегчить жизнь разработчику. Библиотека состоит из большого количества различных компонентов, которые позволяют работать с промптами, объединять вызовы к большим языковым моделям в цепочки, загружать данные из разных источников и сохранять обработанные ответы языковой модели.

+27

RunFMe Dec 13 2023 at 10:09

GigaChat Pro. Технические детали, сдача ЕГЭ и сравнение с конкурентами

Medium

18 min

23K

SberDevices corporate blogNatural Language Processing*Artificial IntelligenceMachine learning*

Review

С момента запуска GigaChat прошло около полугода, и за это время у нас появилось более полутора миллионов пользователей. Они активно используют нейросетевые технологии как в работе, так и для развлечения. От пользователей поступают разнообразные запросы: от просьбы сделать краткую выжимку из текста письма до срочного написания поэмы на день рождения коллеги-тестировщика. Мы всегда учитываем обратную связь, которая помогает нам развиваться и внедрять новые идеи.

За последнее время нами были выпущены новые модели и добавлены новые функциональные возможности в сервис. А теперь мы представляем новую нейросетевую модель, у которой более 29 миллиардов параметров. Она успешно прошла тест на ЕГЭ и показала отличные результаты в сравнении с другими системами. Если вы только начинаете интересоваться новыми технологиями в области искусственного интеллекта, то имейте в виду, именно они в ближайшие годы будут формировать наше с вами будущее и давать преимущество тем, кто ими владеет. Давайте познакомимся с ними поближе.

+46

prohor33 Nov 10 2023 at 14:24

GigaSearch или Поисковая система на GigaChat

Medium

4 min

8.1K

Сбер corporate blogSberDevices corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Галлюцинации — это явление, которое до недавнего времени было привилегией человеческого сознания. Однако, с развитием текстовых генеративных моделей, таких как GigaChat и ChatGPT, возникла возможность наблюдать подобные "иллюзии" и в мире искусственного интеллекта.

Есть случаи, когда галлюцинации генеративной модели вполне уместны. Например, если вы попросите модель сгенерировать детскую сказку, то наличие в ней выдуманных персонажей и событий будет весьма кстати и понравится малышу.

Но мы точно не хотим получать выдуманную информацию про реальных людей или события. Кому интересно почитать о том, как мы боремся с галлюцинациями в GigaChat — добро пожаловать под кат.

+16

averkij Oct 19 2023 at 08:01

GigaChat расправляет плечи. Новая версия нейросетевой модели от Сбера

Medium

8 min

26K

Сбер corporate blogSberDevices corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Обращаясь к мастерам научной фантастики, всё чаще удивляешься их проницательности. В рассказе Артура Кларка «Девять миллиардов имён Бога» компьютер воплотил пророчество тибетских монахов о наступлении конца света, а в повести Ника Горькавого «Астровитянка» ИИ был единственным другом маленькой девочки в течение десятка лет и помог ей выжить на чужой планете. Многие люди, включая специалистов, верят как в позитивный, так и в негативный путь развития искусственного интеллекта. К счастью, подобные системы являются лишь инструментом, который можно использовать себе во благо, или оставаться в стороне от этого. Уверен, что в течение нескольких лет ажиотаж вокруг нейросетей постепенно спадёт до такой степени, что мы будем относиться к ним как к ещё одному подарку технического прогресса.

А пока мы с вами находимся в настоящем и предвкушаем наступление новой технологической эры, предлагаю разобраться в основах машинного обучения и познакомиться с новой версией GigaChat'а. В ней нам удалось добиться качественного прорыва, обойти аналогичные по размеру языковые модели, а также расширить максимальную длину входного запроса модели и проделать множество других улучшений. Но обо всём по порядку.

Сначала освежим в памяти, что такое языковые модели и как они развивались до сегодняшних дней.

+56

103

Rai220 Mar 22 2023 at 11:31

Приделываем руки к ChatGPT: бот, который исполняет код в рантайме

Easy

5 min

37K

Machine learning*Artificial Intelligence

Tutorial

Machine learning season

В предыдущей статье я рассказывал, как можно доучить GPT на собственных взглядах и вкусах. Сегодня попробуем дать GPT возможность поработать программистом по‑настоящему — с запуском кода и отладкой без участия человека. Весь код опубликован в репозитарии.

Как многие уже убедились, ChatGPT хорош, но есть некоторые типы задач, с которыми у него возникают трудности:

1. Он не может получать новые актуальные знания из сети.
2. Он не может выполнить какие‑либо действия.
3. У него сложности с алгоритмическими задачами (перевернуть строку, решить уравнение, произвести вычисления с применением численных методов).

И если задача 1 решается с помощью BingChat, то 2 и 3 мы сегодня будем решать в рамках данного туториала.

Основная идея такая: пусть ChatGPT сам решает, может ли он справиться с задачей «в уме» или же это лучше сделать с помощью написания кода на python, а наш сервер сразу же выполняет этот код и снова отдает результат работы ChatGPT, чтобы он мог его интерпретировать и или выдать пользователю окончательный ответ или исправить ошибку в своей программе и попытаться ещё раз.

Дальше много примеров и немного кода...

+61

Rai220 Jan 24 2023 at 13:59

Переносим свою картину мира в чат-бота на базе GPT-3

4 min

48K

Machine learning*Artificial Intelligence

Tutorial

Думаю, все уже наслышаны о потрясающих возможностях ChatGPT и GPT-3, многие уже вдоволь наигрались с ними, а новые стартапы на их основе льются на нас каждый проливным дождём! Возможности ChatGPT в решении некоторых текстовых задач потрясают, порой кажется, что имеешь дело с настоящим разумом.

У меня возникла идея - что если попробовать доучить сеть так, чтобы она имитировала картину мира определенного человека? (Да, снова Черное Зеркало). Классический подход с pre-prompt для этого не подходит, так как хочется заложить в сеть побольше знаний (а также реально поменять веса связей), поэтому будем использовать fine-tune (дообучение на небольшом датасете и небольшом числе итераций). Такая опция доступна пользователям openAI за небольшую плату ($0.5-1 в моих примерах).

В этой статье я покажу как можно обучить GPT-3 (в версии davinchi-003) на своей картине мира и засунуть её внутрь телеграм-бота, потратив на всё всего несколько долларов.

Код бота доступен в репозитарии.

+42

Rai220 May 24 2019 at 13:17

Черное Зеркало своими руками — обучаем бота на базе своей истории чатов

4 min

17K

Machine learning*

В "Черном Зеркале" была серия (S2E1), в которой создавали роботов, похожих на умерших людей, используя для обучения историю переписок в социальных сетях. Я хочу рассказать, как я попробовал сделать что-то подобное и что из этого получилось. Теории не будет, только практика.

Идея была простая — взять историю своих чатов из Telegram и на их основе обучить seq2seq сеть, способную по началу диалога предсказывать его завершение. Такая сеть может работать в трех режимах:

Предсказывать завершение фразы пользователя с учетом истории разговора
Работать в режиме чат-бота
Синтезировать логи разговоров целиком

Вот что получилось у меня

Бот предлагает завершение фразы

Бот предлагает завершение диалога

Бот общается с живым человеком

User: привет
Bot: привет
User: как ты?
Bot: собираюсь
User: баг пофиксил?
Bot: нет
User: почему?
Bot: да не получается
User: ты сегодня когда дома будешь?
Bot: не знаю пока
User: ты занят?
Bot: в магазин еду

Дальше я расскажу, как подготовить данные и обучить такого бота самому.

Читать дальше →

+34

PatientZero Feb 20 2018 at 08:32

3D-движок, написанный на формулах MS Excel

9 min

118K

Visual Basic for Applications*Abnormal programming*Game development*

Translation

Скриншот экрана игры

Эта статья посвящена тому, как я смог написать 3D-движок только на формулах Excel. Я реализовал следующий функционал:

бесконечная процедурно генерируемая карта лабиринта
рендеринг трассировкой лучей в реальном времени
вычисление окклюзии
рендеринг простейшего освещения
шейдер освещения и вычислений
движок естественного движения
в 3D-движке не используются макросы

* чтобы управлять игрой нажатием клавиш, нужны макросы, управляющие движением с помощью одной простой инструкции копирования.

Можете скачать файл и протестировать его самостоятельно!

+223

101

Rai220 Aug 13 2014 at 05:53

Cubic Robotics: почему мы решили идти на мировой краудфайндинг

4 min

28K

CubicRobotics corporate blog

Весной этого года наш стартап, который занимается разработкой и производством домашнего робота-помощника Cubic получил инвестиции в $500 000, мы показали работающие прототипы устройства, продали 10 тестовых экземпляров. Мы планировали продать первый серийный Cubic летом этого года. Однако, в самый последний момент мы решили пойти на краудфайндинг. Почему – мы попробуем объяснить в этой статье

Читать дальше →

+30

Rai220 May 13 2014 at 12:44

Домашний робот: от идеи к продукту

3 min

21K

CubicRobotics corporate blog

С древних времен человек хотел разговаривать с окружающим миром. Говорящие вещи окружали его в сказках и легендах. Злая королева общается с говорящим зеркалом, Горлум жалуется на тяготы и невзгоды бытия Кольцу Всевластья, Тамерлан разговаривал с камнями и давал им имена.

Все это потому, что голос — самый естественный способ общения для человека, вербальные коммуникации заложены в наших генах. И вот сегодня мы вплотную приблизились к воплощению древнейшей мечты человечества при помощи высоких технологий.

В Cubic Robotics мы верим, что скорейший путь к “говорящему миру” лежит через создание универсальной голосовой операционной системы, которую с одной стороны можно было бы установить на любое устройство. С другой стороны такую систему могли бы развивать независимые разработчики по всему миру. Именно такой является разработанная и запатентованная нами голосовая операционная система V.O.I.S. (Voice Operation Intellectual System).

V.O.I.S. — универсальная голосовая операционная система, при помощи которой можно сделать говорящим почти любой предмет. Разговаривать значит, не просто принимать голосовые приказы, но действительно понимать человека, поддерживать и даже инициировать разговор. Это тот самый искусственный интеллект, находящийся внутри нашей разработки — роботе-ассистенте Cubic (о нем мы рассказывали подробно в прошлой статье).

Также на базе V.O.I.S. уже создаются и проектируются разговаривающие автомобили, интеллектуальные помощники для смартфонов и носимых гаджетов.

Читать дальше →

+45

Rai220 Mar 12 2014 at 14:03

Как мы делали домашнего робота

4 min

55K

CubicRobotics corporate blog

Человечество давно мечтает о домашних роботах. За последние сто лет образ домашнего робота сформирован в фантастических фильмах и книгах: чаще всего это антропоморфное устройство с головой, руками и ногами. Такой робот всегда готов приготовить и принести хозяину чашечку кофе, подмести пол, протереть окно и выполнить другую домашнюю работу. А еще домашние роботы из фантастики всегда могут поговорить с хозяином. Не просто выполнять команды, а быть секретарем, помощником, партнером или даже другом!

Когда мы с друзьями решили сделать своего домашнего робота, то тоже сначала смотрели на андроидов. Хотелось построить этакого дворецкого, чтобы и завтрак мог приготовить, и ковер пропылесосить, и гостей встретить. К сожалению, изучив рынок, мы поняли, что сегодня такого робота сделать нельзя. Вернее сделать-то можно, но он будет стоить как новая иномарка и требовать регулярного сервисного обслуживания, при этом адаптация такого робота под каждую конкретную кухню будет не проще, чем пересобрать Ubuntu на Z80. Понятно, что желающих купить такого робота будет не очень много.

И тогда пришло понимание, что домашнему роботу на первых порах совсем не обязательно ходить по дому. Вдохновением для нас стал Jarvis (Джарвис) — герой фильма «Железный человек». Это дворецкий, искусственный интеллект, не имеющий тела, но способный управлять различными устройствами в доме главного героя. В результате у нас получился Cubic — домашний робот, который живет дома и может полноценно (более или менее) разговаривать с его обитателями, а также управлять различными системами типа «умный дом».

Читать дальше →

+89

123