Articles / Profile of janvarev / Habr

Январев Владислав @janvarev

VseGPT.ru 120+ нейросетей по OpenAI API

ProfileArticles21Posts2News4Comments1.3K

janvarev Jul 29 at 12:40

Вышла 12 версия русского опенсорс голосового помощника Ирина (900+ звезд Гитхаб)

8 min

23K

Open source * Python * Smart HouseVoice user interfaces *

Всем привет! Я уже писал про своего голосового помощника Ирину статьи на Хабре: раз, два и три; первый раз был аж 3.5 года назад.

Самое главное — опенсорс проект жив. А если опенсорс жив в течение 3.5 лет — значит, он дошел до какой‑то точки зрелости. А если у него 900 звезд на Гитхабе — значит, им кто‑то пользуется, и даже успешно :)

TL;DR> Python с простой архитектурой. Работает оффлайн, полностью локально и приватно. Можно дописывать свои скиллы через плагины. Плагинов много, есть от комьюнити. Поддержка Home Assistant. Поддержка кучи TTS. Поддержка LLM по OpenAI‑совместимому API, можно сделать онлайн или оффлайн. Есть клиент‑сервер.

+101

janvarev May 10 at 19:18

Проводим слепой тест переводов прямо на Хабре

Easy

6 min

3.6K

Artificial IntelligenceNatural Language Processing *

Хорошие переводчики переводят хорошо. А как насчет нейросетей?

Пользователь @antptr86 сделал в комментариях классную вещь - для чистоты эксперимента он выложил несколько вариантов перевода одного абзаца из "Дюны", и предложил их оценить вслепую, без знания источников.

Мне показалось это крайне занимательным, и поэтому я решил сделать из этого небольшую статью и голосование для хабраюзеров в конце.

Итак, на выбор 11 переводов абзаца из Дюны. Пожалуйста, прочитайте их, и ответьте на опрос внизу, выбрав "Лучший вариант" и "Варианты, которые в целом можно нормально читать". Чуть позже в комментариях будет выложена информация о том, откуда они были взяты.

+27

111

janvarev Mar 31 at 15:34

Сравниваем скорость генерации LLM локально и по API

4 min

5.5K

Natural Language Processing * Artificial Intelligence

По ощущениям, на Хабре одна группа пользователей пользуется LLM локально, а другая - через внешние API.

А третья еще не определилась, и у неё периодически возникают следующие вопросы:

- Что будет, если запускать LLM на CPU вместо GPU? Сильно упадет скорость?
- А как это от размера модели зависит?
- А DeepSeek оригинальный очень большой - а можно его с диска подкачивать, если он в RAM не влезает?

В общем, я пару раз отвечал на данные вопросы в комментариях - но поскольку я периодически натыкаюсь на них вновь и вновь, то решил сделать эту небольшую статью.

TLDR: Я сделал небольшое HTML-приложение, которое наглядно дает ощущение скорости генерации в разных инсталляциях. Если непонятно, что там к чему - то лучше прочитать статью.

janvarev Nov 2 2024 at 09:39

Пол Грэм: «Пишущие и не умеющие писать»

2 min

2.7K

Artificial IntelligenceThe future is here

Opinion

Translation

Обычно я неохотно делаю прогнозы о технологиях, но в этом случае я достаточно уверен: через пару десятилетий будет очень мало людей, умеющих писать.

Если вы писатель, то одна из самых странных вещей, которую вы узнаете, — это то, сколько людей испытывают трудности с письмом. Врачи знают, у скольких людей есть родинка, которая их беспокоит; люди, которые разбираются в компьютерах, знают, сколько людей в них не разбираются; писатели знают, скольким людям нужна помощь в написании текстов.

Причина, по которой у стольких людей возникают проблемы с письмом, заключается в том, что это принципиально сложно. Чтобы хорошо писать, нужно ясно мыслить, а ясно мыслить трудно.

И всё же письмо пронизывает многие профессии, и чем престижнее работа, тем больше, как правило, требуется писать.

janvarev Jul 18 2024 at 16:29

Новая модель GPT-4o mini от OpenAI будет заменой GPT-3.5 и уже доступна

2 min

5.7K

Self Promo

По‑видимому, случайно произошел ранний выход запланированной новости на CNBC. Новость также появилась на Reuters.

OpenAI назвала новый релиз «самой умной и экономически эффективной малой моделью, доступной на сегодняшний день». Согласно утечке, она будет в 2.5 раза дешевле и так недорогой последней модели ChatGPT-3.5, и, вероятно, будет её основной заменой. В модель также планируется интегрировать обработку изображений, видео и аудио.

UPD: Уже есть подтверждение в блоге OpenAI, модель вышла. Также уже есть доступ к API в России и результаты моих тестов по переводу с помощью модели с английского на русский (бенчмарк COMET).

janvarev May 15 2024 at 14:01

Да, это не OpenAI — на Google I/O показали LLM Gemini Flash 1.5 с дешевым контекстом на 1 миллион токенов

Easy

5 min

6.9K

Timeweb Cloud corporate blogMachine learning * Artificial IntelligenceNatural Language Processing *

Google I/O, на удивление, не повезло. Крупнейшие анонсы от Google в сфере ИИ остались в тени конференции OpenAI, которая прошла 13 мая — на Хабре было сразу несколько постов о бьющей рекорды GPT-4o, в то время как о конференции Гугла была достаточно небольшая новость.

В общем, давайте вкратце расскажу, на что (предположительно) делает ставку Google, а также как я, как ~~упоротый~~ большой фанат LLM уже подключил Gemini Flash и GPT-4o в свой сервис VseGPT (доступ к нейросетям из России по API), и про то, как они ощущаются на русском языке.

Читать дальше →

+15

janvarev Apr 8 2024 at 08:01

GPT-4, Claude 3, Gemini Pro или опенсорс — как выбрать LLM под свою задачу?

Medium

10 min

32K

Timeweb Cloud corporate blogNatural Language Processing * Artificial Intelligence

Tutorial

Несмотря на то, что сейчас ~~из каждого утюга~~ рекламируется доступ к ChatGPT и GPT-4, вообще говоря, в мире существует несколько больше разных поставщиков LLM (больших языковых моделей), и некоторые из которых могут гораааздо более эффективнее решать какие-то конкретные задачи.

Я уже полгода веду проект VseGPT.ru с доступом к разным LLM из России по OpenAI API (ну, и через вебчат). Львиная доля работы — подключение новых нейросетей. Сейчас их уже свыше 60, и каждую я попробовал хотя бы раз, ну, когда подключал.

Правда, сайт LLMExplorer, собирающий данные об опенсорс нейросетях с портала Hugging Face, говорит, что их там уже более 33 000 штук. М-да.

В общем, вероятно, я не знаю о текстовых сетках всё, но определенно знаю кое-что — хотя бы в пределах своего скромного опыта в 60 сеток. Так что кому интересно — прошу под кат.

Читать дальше →

+29

janvarev Oct 18 2023 at 11:19

Сайга-Мистраль — третья русская нейросеть после YaGPT и GigaChat, публично доступная по API

5 min

30K

Self Promo

Я уже недавно писал на Хабре, что понемногу пилю свой сервис VseGPT с доступом по OpenAI API и чатом к различным нейросетям - ChatGPT, Claude, LLama и пр. (Коротко: потому что вендорлок - зло, разнообразие и опенсорс - добро)

Большая часть работы - это, конечно, роутинг запросов на разные сервера, которые осуществляют обработку нейросетевых моделей; свой у меня скорее общий универсальный интерфейс, который сглаживает разницу между моделями, ну и некоторые прикольные фишечки.

Но я давно задумывался развернуть что-то уникальное, собственное, чего нет у других - в особенности опенсорсную Сайгу.

TLDR: Сайга-Мистраль 7B сравнима с 70B моделью. Доступна на сайте, её можно использовать по API или через интерфейс чата.

+18

janvarev Sep 20 2023 at 10:30

VseGPT — сервис для доступа к ChatGPT, Claude, Palm, LLama2 с вебчатом и OpenAI API

Easy

5 min

30K

Self Promo

Review

Вообще, я люблю опенсорс - мой голосовой помощник Ирина тому подтверждение.

Тем не менее, в текстовых нейросетях пока опенсорс решений уровня GPT-4 нет - а пользоваться им при написании кода, честно говоря, правда полезно.

Если честно, меня несколько утомило решать вопросы доступа и оплаты OpenAI аккаунта, необходимого для доступа к GPT-4 и API (да, я провожу эксперименты, и API мне нужен).

Я бы с удовольствием поэкспериментировал и с другими сетями - например, Claude, о которой говорят гораздо меньше, но которая, по-видимому, не намного хуже (спойлер: я пробовал - по моему мнению, Claude 2 вполне на уровне GPT-4).

Постепенно реализовывая свои "хотелки", я создал сервис VseGPT.ru, который решает мои основные проблемы - предоставляет общий интерфейс в виде чата и OpenAI API к разным топовым нейросетям - ChatGPT, Claude, Google Palm и опенсорсным Llama 70b, 34b Code и пр.

Конечно, сервис я делал в основном под свои профессиональные потребности, так что давайте посмотрим, чего хотел я, и насколько это подойдёт вам:

janvarev Apr 13 2023 at 09:45

Как перестать беспокоиться и установить Python-проект другу под Windows

Medium

4 min

10K

Open source * Python *

Tutorial

Итак, вы закончили свою первую версию опенсорс проекта на Питоне, выложили её на Гитхаб, и даже написали честный ридми: "Требуется Python 3.10, поставьте зависимости через pip install -r requirements.txt"

И... через какое-то время вам звонит ~~пользователь~~ друг с вопросом: "Слушай, интересный проект, а как его под Windows поставить?"

Собственно, с этого момента у вас есть 3 варианта:

1. Попытаться сэкономить всем время и попробовать упаковать ваш проект в EXE-файл через утилиты типа pyinstaller или Auto PY to EXE. Минус: при сколь-нибудь сложных зависимостях нужно будет ковыряться довольно долго, чтобы заставить EXE заработать. Второй минус: как вы думаете, на кого ляжет почетная обязанность собирать EXE-шники после каждого апдейта кода?

2. Попытаться объяснить другу, что такое python, GIT и как всё это поставить. Минус: возможны проблемы в отношениях с другом :))) (Вариант: поставить всё самому через дистанционный доступ, но он требует слишком много времени если ~~пользователей~~ друзей больше 5)

3. Дописать под себя набор BAT-файлов, о которых пойдет речь в статье, и которые:

• ставят сами Python и GIT в локальную папку проекта (в стиле conda);

• выкачивают свежую версию вашего проекта с Гитхаба (а также апдейтят её при необходимости);

• ставят нужные зависимости;

• можно прописать несколько сценариев запуска приложения;

• установленный проект можно перемещать в другие папки и между компами.

+10

janvarev Mar 27 2023 at 13:44

Ирина, голосовой помощник — теперь и со вкусом GPT-3

Medium

5 min

24K

Voice user interfaces * Smart HousePython * Open source *

«Лама... Альпака...Чатгпт...» — раздавалась в уютненьком чатике по Ирине.

Хабр был не лучше — статьи по работе с GPT множились как грибы, а в комментах раздавались возгласы в духе «Дайте мне голосового помощника, с которым можно болтать!»

Если честно, еще в первой статье про Ирину я говорил, что небольшой фанат именно общения с виртуальным помощником. Помощник должен выполнять команды, казалось мне.

Тем не менее, и меня заинтересовало, насколько весело будет именно болтать с GPT, но самому в коде и платном API‑доступе разбираться не хотелось. Но сегодня утром меня снабдили и примером, и ключиком...

‑-

Это продолжение моих статей о разработке голосового помощника Ирины, не зависящего от крупных корпораций. У нас есть ~~печеньки~~:

— Полностью оффлайн SpeechToText и TextToSpeech
— Поддержка плагинов
— Готовые команды «таймер», «погода» и ряд прочих. Поддержка HomeAssistant.
— Поддержка работы в клиент‑серверном режиме — сервер + куча микрофонов + Телеграм‑клиент, например.

Расскажу, что улучшилось за прошедший год с момента прошлой статьи.

TL;DR> Добавлен плагин для общения с GPT-3 нейросетью. Сделан пакет упрощенной установки под Windows — «скачай и запусти». Сделано два веб‑клиента — один распознает слова прям в браузере (тяжелый), другой отправляет весь звуковой поток на сервер (легкий) — так что можно запускать клиенты, например, на смартфоне. Добавлен TTS Silero v3 — имхо, лучшее озвучивание доступное в открытом доступе. Сделан докер‑образ для быстрого запуска Ирины без установки зависимостей. Добавлено нечеткое распознавание фраз. Обновлена VOSK‑модель распознавания голоса на специально натренированную для Ирины.

+38

janvarev Apr 13 2022 at 12:55

Ирина, голосовой помощник. Продолжение

7 min

21K

Voice user interfaces * Python * Open source * Smart House

— Слушай, она меня на кухне не слышит.
— Ну да, далековато. Давай дополнительный микрофон протянем.
<покупается 5 метров кабеля>
— О, классно!
— ...
— Теперь в комнате не работает.

Это продолжение статьи Ирина — опенсорс русский голосовой помощник. Offline-ready - про голосового помощника, не зависящего от крупных корпораций. Расскажу, что улучшилось за два месяца с момента прошлой статьи.

TL;DR> Отлажен клиент-сервер с несколькими микрофонами/машинами; можно командовать по всему дому. Сделан Телеграм-клиент. Несколько новых голосов (TTS). Обработка голоса в контексте (можно делать голосовые игры). Интеграция с Home Assistant. И ЕЩЁ больше плагинов и документации.

Ладно, рассказывай, что нового

+39

janvarev Feb 7 2022 at 11:58

Ирина — опенсорс русский голосовой помощник. Offline-ready

9 min

64K

Open source * Python * Voice user interfaces *

- Ирина, таймер...
- Ставлю таймер на пять минут.

Вполне себе обыденная история из моего быта. Я таки сделал собственного автономного голосового помощника.

TL;DR> Ирина вполне неплохо работает дома 24x7.

Потребуется установить Python 3.5+ и зависимости через pip (немного знаний Python).

Скиллы "из коробки": таймер, погода, контроль медиа (громче/тише/дальше), контроль плеера MPC-HC, запуск медиа из папки, расписание ближайших электричек, "подбрось кубик/монетку".

Плагинами добавляются: другие скиллы, Text-to-Speech и Speech-to-Text движки.

Интересно? Поехали >

+106

janvarev Oct 30 2020 at 17:19

Когнитивистика и футурология: как наши фантазии могут повлиять на наше будущее

28 min

6.2K

Reading roomScience fictionThe future is here

Можно управлять тем, что можно представить.
Нельзя управлять тем, что нельзя представить.
Это относится и к нашему будущему.

Так не стоит ли обратить внимание не только на моделирование будущего, но и на наши возможности интерпретации полученных результатов?

Где простираются границы нашей возможности фантазировать и представлять? И – самое главное – можем ли мы предложить какой-нибудь осмысленный инструмент для их измерения?..

Читать дальше →

+11

janvarev Jul 20 2020 at 13:34

Как я, специалист по ИИ, на ИИ-текст купился

6 min

15K

The future is hereArtificial Intelligence

Захожу я сегодня на Хабр, и, под чашку чая, пролистываю статью «GPT-3 от OpenAI может стать величайшей вещью со времён Bitcoin».

Если не читали – почитайте. Конец вызывает прямо-таки сильные эмоции. У меня они усугубились тем, что я относительно профессионально занимаюсь ИИ, генерацией текстов и проблемой смыслов – так что я небезосновательно считал, что легко распознаю текст, сгенерированный машиной…

Читать дальше →

+26

janvarev May 24 2020 at 18:02

Сергей и «программирование лучше секса»

2 min

11K

Reading room

Небольшая зарисовка-комментарий к статье «Программирование лучше секса»
Самодостаточная, можно читать без ознакомления с оригиналом.

— Сергей, можно вопрос?

Сергей, не отвлекаясь от экрана…

— Ну, задавайте.
— Объясните, почему вы ТАКОЙ? Почему вам важнее написать эту вашу «программу», и ради этого вы готовы портить отношения с менеджерами, доставкой… да вообще со всеми! Неужели вам не хочется просто жить со всеми в мире и согласии? Ну вот, простите, нах… вам всё это?

Читать дальше →

janvarev May 8 2020 at 08:41

Как я за 4 часа решатель японских кроссвордов написал

9 min

6.4K

Abnormal programming * Algorithms *

Лениво просматриваю выложенный недавно коллегами из «Сириуса» список курсов, проведенных у школьников… Так, а это что такое? «Поиск комбинаторных объектов с помощью SAT-солверов»? «Мы сделали решатель судоку, японских кроссвордов и прочего»?

В памяти всплывает мысль о том, что переборные NP-задачи сводимы одна к другой, и в частности, сводимы к поиску выполнимости булевой формулы. Эту мысль один из авторов Хабра высказывал здесь, и честно говоря, для меня она подобна магии.

Конечно, как человек, прошедший курс дискретной математики и сложности алгоритмов теоретически я знаю, что задачи сводимы одна к другой. Но обычно заниматься этим сложно, и лучше я поверю на слово профессорам и другим умным людям.

Но тут же это предлагается… ШКОЛЬНИКАМ! Внутри зашевелилось ~~шило в п...~~ творческое начало и заявило: «Ну это, наверное, несложно прикрутить, раз ученикам предлагают. Неужели я не разберусь?? Вон, обещают, что питоновскую библиотеку используют, а питон я в целом знаю...»

А времени было около 9 вечера, что несколько притупило мой критический взгляд на сложность проблемы… (собственно, далее хроники 4-часового программирования)

Читать дальше →

janvarev Jan 4 2019 at 14:35

Сергей и научный метод

7 min

19K

System Analysis and Design * Reading room

Все совпадения случайны.
Кто не спрятался, я не виноват.

— Проходи, что стоишь как не родной?

Сергей огляделся — в квартире своего учителя-профессора он еще не бывал. Обыкновенная московская, в старом доме — видимо, еще с тех времен, когда их выдавали… или не выдавали, черт его знает, он-то эти времена уже не застал. Бардак конечно, но рабочий — повсюду книги и распечатки каких-то статей. Похоже, профессор продолжает вести активную научную работу, несмотря на свой возраст…

Читать дальше →

+38

janvarev Sep 11 2009 at 07:01

Fuzzle CMS 2.6 — создание Flash-сайтов без Flash

2 min

791

Self Promo

Хотелось бы познакомить хабрапользователей с развитием нашего проекта Fuzzle CMS по созданию управляемых Flash-сайтов о котором я уже писал около 4 месяцев назад.

1. Мы постарались развить SEO-направление — имена и адреса страниц стали компактнее, добавилась возможность устанавливать TITLE, KEYWORDS и DESСRIРTION для каждой страницы. Разработано подключение Google Analytics и других счетчиков.

2. Мы добавили возможность расставлять редактируемые блоки не только на каждой странице сайта, но и на уровне дизайна сайта в целом. Дизайн можно загружать не только из SWF, но и из PNG и JPG-файлов, а создавать меню путем расстановки блоков. В конечном счете, получилось, что можно создавать Flash-сайт, вообще не используя Adobe Flash.

3. Мы запустили каталог расширений и полностью зарелизили API для разработчиков.

Четвертое и желающим попробовать...

janvarev Jun 21 2009 at 11:12

Liveanime.ru — подключаем к видео внешние субтитры

3 min

Self Promo

Liveanime.ru — большая вики-система, ориентированная на сбор каталога аниме и серий, доступных онлайн. Проект сугубо некоммерческий, а поскольку он основан на вики, каждый может улучшить уже известную информацию.

В центре находится Flash-видеоплейер, который умеет брать видео из одного источника, а субтитры — из другого.

Как это работает?
1. Пользователь находит на одном из забугорных хостингов (Youtube, Veoh, 6.cn) аниме с оригинальной озвучкой (ибо его там много);
2. Пользователь находит русские субтитры и заливает их на сайт;
3. Пользователь специальной директивой на вики-странице пишет: «создать ссылку, которая бы показывала во флеш-плейере данное видео и данные субтитры».

Что мы получаем?
Получаем бо-ольшой каталог аниме с оригинальным звуком, которое можно смотреть онлайн (в идеале). Сейчас в базе заполнено порядка 40 сериалов.

Правда, поскольку видео берется с внешних видеохостингов, почему-то IE часто не показывает видео, поэтому рекомендуется использовать другие браузеры (я использую FF).

Читать всякие технические подробности...