Search
Write a publication
Pull to refresh
157
102.6
Январев Владислав @janvarev

VseGPT.ru 120+ нейросетей по OpenAI API

Send message

Вышла 12 версия русского опенсорс голосового помощника Ирина (900+ звезд Гитхаб)

Reading time8 min
Views23K

Всем привет! Я уже писал про своего голосового помощника Ирину статьи на Хабре: раз, два и три; первый раз был аж 3.5 года назад.

Самое главное — опенсорс проект жив. А если опенсорс жив в течение 3.5 лет — значит, он дошел до какой‑то точки зрелости. А если у него 900 звезд на Гитхабе — значит, им кто‑то пользуется, и даже успешно :)

TL;DR> Python с простой архитектурой. Работает оффлайн, полностью локально и приватно. Можно дописывать свои скиллы через плагины. Плагинов много, есть от комьюнити. Поддержка Home Assistant. Поддержка кучи TTS. Поддержка LLM по OpenAI‑совместимому API, можно сделать онлайн или оффлайн. Есть клиент‑сервер.

Читать далее

Проводим слепой тест переводов прямо на Хабре

Level of difficultyEasy
Reading time6 min
Views3.6K

Хорошие переводчики переводят хорошо. А как насчет нейросетей?

Пользователь @antptr86 сделал в комментариях классную вещь - для чистоты эксперимента он выложил несколько вариантов перевода одного абзаца из "Дюны", и предложил их оценить вслепую, без знания источников.

Мне показалось это крайне занимательным, и поэтому я решил сделать из этого небольшую статью и голосование для хабраюзеров в конце.

Итак, на выбор 11 переводов абзаца из Дюны. Пожалуйста, прочитайте их, и ответьте на опрос внизу, выбрав "Лучший вариант" и "Варианты, которые в целом можно нормально читать". Чуть позже в комментариях будет выложена информация о том, откуда они были взяты.

Читать далее

Сравниваем скорость генерации LLM локально и по API

Reading time4 min
Views5.5K

По ощущениям, на Хабре одна группа пользователей пользуется LLM локально, а другая - через внешние API.

А третья еще не определилась, и у неё периодически возникают следующие вопросы:

- Что будет, если запускать LLM на CPU вместо GPU? Сильно упадет скорость?
- А как это от размера модели зависит?
- А DeepSeek оригинальный очень большой - а можно его с диска подкачивать, если он в RAM не влезает?

В общем, я пару раз отвечал на данные вопросы в комментариях - но поскольку я периодически натыкаюсь на них вновь и вновь, то решил сделать эту небольшую статью.

TLDR: Я сделал небольшое HTML-приложение, которое наглядно дает ощущение скорости генерации в разных инсталляциях. Если непонятно, что там к чему - то лучше прочитать статью.

Читать далее

Пол Грэм: «Пишущие и не умеющие писать»

Reading time2 min
Views2.7K

Обычно я неохотно делаю прогнозы о технологиях, но в этом случае я достаточно уверен: через пару десятилетий будет очень мало людей, умеющих писать.

Если вы писатель, то одна из самых странных вещей, которую вы узнаете, — это то, сколько людей испытывают трудности с письмом. Врачи знают, у скольких людей есть родинка, которая их беспокоит; люди, которые разбираются в компьютерах, знают, сколько людей в них не разбираются; писатели знают, скольким людям нужна помощь в написании текстов.

Причина, по которой у стольких людей возникают проблемы с письмом, заключается в том, что это принципиально сложно. Чтобы хорошо писать, нужно ясно мыслить, а ясно мыслить трудно.

И всё же письмо пронизывает многие профессии, и чем престижнее работа, тем больше, как правило, требуется писать.

Читать далее

Новая модель GPT-4o mini от OpenAI будет заменой GPT-3.5 и уже доступна

Reading time2 min
Views5.7K

По‑видимому, случайно произошел ранний выход запланированной новости на CNBC. Новость также появилась на Reuters.

OpenAI назвала новый релиз «самой умной и экономически эффективной малой моделью, доступной на сегодняшний день». Согласно утечке, она будет в 2.5 раза дешевле и так недорогой последней модели ChatGPT-3.5, и, вероятно, будет её основной заменой. В модель также планируется интегрировать обработку изображений, видео и аудио.

UPD: Уже есть подтверждение в блоге OpenAI, модель вышла. Также уже есть доступ к API в России и результаты моих тестов по переводу с помощью модели с английского на русский (бенчмарк COMET).

Читать далее

Да, это не OpenAI — на Google I/O показали LLM Gemini Flash 1.5 с дешевым контекстом на 1 миллион токенов

Level of difficultyEasy
Reading time5 min
Views6.9K
Google I/O, на удивление, не повезло. Крупнейшие анонсы от Google в сфере ИИ остались в тени конференции OpenAI, которая прошла 13 мая — на Хабре было сразу несколько постов о бьющей рекорды GPT-4o, в то время как о конференции Гугла была достаточно небольшая новость.

В общем, давайте вкратце расскажу, на что (предположительно) делает ставку Google, а также как я, как упоротый большой фанат LLM уже подключил Gemini Flash и GPT-4o в свой сервис VseGPT (доступ к нейросетям из России по API), и про то, как они ощущаются на русском языке.

Читать дальше →

GPT-4, Claude 3, Gemini Pro или опенсорс — как выбрать LLM под свою задачу?

Level of difficultyMedium
Reading time10 min
Views32K
image

Несмотря на то, что сейчас из каждого утюга рекламируется доступ к ChatGPT и GPT-4, вообще говоря, в мире существует несколько больше разных поставщиков LLM (больших языковых моделей), и некоторые из которых могут гораааздо более эффективнее решать какие-то конкретные задачи.

Я уже полгода веду проект VseGPT.ru с доступом к разным LLM из России по OpenAI API (ну, и через вебчат). Львиная доля работы — подключение новых нейросетей. Сейчас их уже свыше 60, и каждую я попробовал хотя бы раз, ну, когда подключал.

Правда, сайт LLMExplorer, собирающий данные об опенсорс нейросетях с портала Hugging Face, говорит, что их там уже более 33 000 штук. М-да.

В общем, вероятно, я не знаю о текстовых сетках всё, но определенно знаю кое-что — хотя бы в пределах своего скромного опыта в 60 сеток. Так что кому интересно — прошу под кат.
Читать дальше →

Сайга-Мистраль — третья русская нейросеть после YaGPT и GigaChat, публично доступная по API

Reading time5 min
Views30K

Я уже недавно писал на Хабре, что понемногу пилю свой сервис VseGPT с доступом по OpenAI API и чатом к различным нейросетям - ChatGPT, Claude, LLama и пр. (Коротко: потому что вендорлок - зло, разнообразие и опенсорс - добро)

Большая часть работы - это, конечно, роутинг запросов на разные сервера, которые осуществляют обработку нейросетевых моделей; свой у меня скорее общий универсальный интерфейс, который сглаживает разницу между моделями, ну и некоторые прикольные фишечки.

Но я давно задумывался развернуть что-то уникальное, собственное, чего нет у других - в особенности опенсорсную Сайгу.

TLDR: Сайга-Мистраль 7B сравнима с 70B моделью. Доступна на сайте, её можно использовать по API или через интерфейс чата.

Читать далее

VseGPT — сервис для доступа к ChatGPT, Claude, Palm, LLama2 с вебчатом и OpenAI API

Level of difficultyEasy
Reading time5 min
Views30K

Вообще, я люблю опенсорс - мой голосовой помощник Ирина тому подтверждение.

Тем не менее, в текстовых нейросетях пока опенсорс решений уровня GPT-4 нет - а пользоваться им при написании кода, честно говоря, правда полезно.

Если честно, меня несколько утомило решать вопросы доступа и оплаты OpenAI аккаунта, необходимого для доступа к GPT-4 и API (да, я провожу эксперименты, и API мне нужен).

Я бы с удовольствием поэкспериментировал и с другими сетями - например, Claude, о которой говорят гораздо меньше, но которая, по-видимому, не намного хуже (спойлер: я пробовал - по моему мнению, Claude 2 вполне на уровне GPT-4).

Постепенно реализовывая свои "хотелки", я создал сервис VseGPT.ru, который решает мои основные проблемы - предоставляет общий интерфейс в виде чата и OpenAI API к разным топовым нейросетям - ChatGPT, Claude, Google Palm и опенсорсным Llama 70b, 34b Code и пр.

Конечно, сервис я делал в основном под свои профессиональные потребности, так что давайте посмотрим, чего хотел я, и насколько это подойдёт вам:

Читать далее

Как перестать беспокоиться и установить Python-проект другу под Windows

Level of difficultyMedium
Reading time4 min
Views10K

Итак, вы закончили свою первую версию опенсорс проекта на Питоне, выложили её на Гитхаб, и даже написали честный ридми: "Требуется Python 3.10, поставьте зависимости через pip install -r requirements.txt"

И... через какое-то время вам звонит пользователь друг с вопросом: "Слушай, интересный проект, а как его под Windows поставить?"

Собственно, с этого момента у вас есть 3 варианта:

1. Попытаться сэкономить всем время и попробовать упаковать ваш проект в EXE-файл через утилиты типа pyinstaller или Auto PY to EXE. Минус: при сколь-нибудь сложных зависимостях нужно будет ковыряться довольно долго, чтобы заставить EXE заработать. Второй минус: как вы думаете, на кого ляжет почетная обязанность собирать EXE-шники после каждого апдейта кода?

2. Попытаться объяснить другу, что такое python, GIT и как всё это поставить. Минус: возможны проблемы в отношениях с другом :))) (Вариант: поставить всё самому через дистанционный доступ, но он требует слишком много времени если пользователей друзей больше 5)

3. Дописать под себя набор BAT-файлов, о которых пойдет речь в статье, и которые:

ставят сами Python и GIT в локальную папку проекта (в стиле conda);

выкачивают свежую версию вашего проекта с Гитхаба (а также апдейтят её при необходимости);

ставят нужные зависимости;

можно прописать несколько сценариев запуска приложения;

установленный проект можно перемещать в другие папки и между компами.

Читать далее

Ирина, голосовой помощник — теперь и со вкусом GPT-3

Level of difficultyMedium
Reading time5 min
Views24K

«Лама... Альпака...Чатгпт...» — раздавалась в уютненьком чатике по Ирине.

Хабр был не лучше — статьи по работе с GPT множились как грибы, а в комментах раздавались возгласы в духе «Дайте мне голосового помощника, с которым можно болтать!»

Если честно, еще в первой статье про Ирину я говорил, что небольшой фанат именно общения с виртуальным помощником. Помощник должен выполнять команды, казалось мне.

Тем не менее, и меня заинтересовало, насколько весело будет именно болтать с GPT, но самому в коде и платном API‑доступе разбираться не хотелось. Но сегодня утром меня снабдили и примером, и ключиком...

‑-

Это продолжение моих статей о разработке голосового помощника Ирины, не зависящего от крупных корпораций. У нас есть печеньки:

— Полностью оффлайн SpeechToText и TextToSpeech
— Поддержка плагинов
— Готовые команды «таймер», «погода» и ряд прочих. Поддержка HomeAssistant.
— Поддержка работы в клиент‑серверном режиме — сервер + куча микрофонов + Телеграм‑клиент, например.

Расскажу, что улучшилось за прошедший год с момента прошлой статьи.

TL;DR> Добавлен плагин для общения с GPT-3 нейросетью. Сделан пакет упрощенной установки под Windows — «скачай и запусти». Сделано два веб‑клиента — один распознает слова прям в браузере (тяжелый), другой отправляет весь звуковой поток на сервер (легкий) — так что можно запускать клиенты, например, на смартфоне. Добавлен TTS Silero v3 — имхо, лучшее озвучивание доступное в открытом доступе. Сделан докер‑образ для быстрого запуска Ирины без установки зависимостей. Добавлено нечеткое распознавание фраз. Обновлена VOSK‑модель распознавания голоса на специально натренированную для Ирины.

Читать далее

Ирина, голосовой помощник. Продолжение

Reading time7 min
Views21K

— Слушай, она меня на кухне не слышит.
— Ну да, далековато. Давай дополнительный микрофон протянем.
<покупается 5 метров кабеля>
— О, классно!
— ...
— Теперь в комнате не работает.

Это продолжение статьи Ирина — опенсорс русский голосовой помощник. Offline-ready - про голосового помощника, не зависящего от крупных корпораций. Расскажу, что улучшилось за два месяца с момента прошлой статьи.

TL;DR> Отлажен клиент-сервер с несколькими микрофонами/машинами; можно командовать по всему дому. Сделан Телеграм-клиент. Несколько новых голосов (TTS). Обработка голоса в контексте (можно делать голосовые игры). Интеграция с Home Assistant. И ЕЩЁ больше плагинов и документации.

Ладно, рассказывай, что нового

Ирина — опенсорс русский голосовой помощник. Offline-ready

Reading time9 min
Views64K

- Ирина, таймер...
- Ставлю таймер на пять минут.

Вполне себе обыденная история из моего быта. Я таки сделал собственного автономного голосового помощника.

TL;DR> Ирина вполне неплохо работает дома 24x7.

Потребуется установить Python 3.5+ и зависимости через pip (немного знаний Python).

Скиллы "из коробки": таймер, погода, контроль медиа (громче/тише/дальше), контроль плеера MPC-HC, запуск медиа из папки, расписание ближайших электричек, "подбрось кубик/монетку".

Плагинами добавляются: другие скиллы, Text-to-Speech и Speech-to-Text движки.

Интересно? Поехали >

Когнитивистика и футурология: как наши фантазии могут повлиять на наше будущее

Reading time28 min
Views6.2K
Можно управлять тем, что можно представить.
Нельзя управлять тем, что нельзя представить.
Это относится и к нашему будущему.


Так не стоит ли обратить внимание не только на моделирование будущего, но и на наши возможности интерпретации полученных результатов?

Где простираются границы нашей возможности фантазировать и представлять? И – самое главное – можем ли мы предложить какой-нибудь осмысленный инструмент для их измерения?..
Читать дальше →

Как я, специалист по ИИ, на ИИ-текст купился

Reading time6 min
Views15K
Захожу я сегодня на Хабр, и, под чашку чая, пролистываю статью «GPT-3 от OpenAI может стать величайшей вещью со времён Bitcoin».

Если не читали – почитайте. Конец вызывает прямо-таки сильные эмоции. У меня они усугубились тем, что я относительно профессионально занимаюсь ИИ, генерацией текстов и проблемой смыслов – так что я небезосновательно считал, что легко распознаю текст, сгенерированный машиной…
Читать дальше →

Сергей и «программирование лучше секса»

Reading time2 min
Views11K
Небольшая зарисовка-комментарий к статье «Программирование лучше секса»
Самодостаточная, можно читать без ознакомления с оригиналом.

— Сергей, можно вопрос?

Сергей, не отвлекаясь от экрана…

— Ну, задавайте.
— Объясните, почему вы ТАКОЙ? Почему вам важнее написать эту вашу «программу», и ради этого вы готовы портить отношения с менеджерами, доставкой… да вообще со всеми! Неужели вам не хочется просто жить со всеми в мире и согласии? Ну вот, простите, нах… вам всё это?
Читать дальше →

Как я за 4 часа решатель японских кроссвордов написал

Reading time9 min
Views6.4K
Лениво просматриваю выложенный недавно коллегами из «Сириуса» список курсов, проведенных у школьников… Так, а это что такое? «Поиск комбинаторных объектов с помощью SAT-солверов»? «Мы сделали решатель судоку, японских кроссвордов и прочего»?

В памяти всплывает мысль о том, что переборные NP-задачи сводимы одна к другой, и в частности, сводимы к поиску выполнимости булевой формулы. Эту мысль один из авторов Хабра высказывал здесь, и честно говоря, для меня она подобна магии.

Конечно, как человек, прошедший курс дискретной математики и сложности алгоритмов теоретически я знаю, что задачи сводимы одна к другой. Но обычно заниматься этим сложно, и лучше я поверю на слово профессорам и другим умным людям.

Но тут же это предлагается… ШКОЛЬНИКАМ! Внутри зашевелилось шило в п... творческое начало и заявило: «Ну это, наверное, несложно прикрутить, раз ученикам предлагают. Неужели я не разберусь?? Вон, обещают, что питоновскую библиотеку используют, а питон я в целом знаю...»

А времени было около 9 вечера, что несколько притупило мой критический взгляд на сложность проблемы… (собственно, далее хроники 4-часового программирования)
Читать дальше →

Сергей и научный метод

Reading time7 min
Views19K
Все совпадения случайны.
Кто не спрятался, я не виноват.
— Проходи, что стоишь как не родной?

Сергей огляделся — в квартире своего учителя-профессора он еще не бывал. Обыкновенная московская, в старом доме — видимо, еще с тех времен, когда их выдавали… или не выдавали, черт его знает, он-то эти времена уже не застал. Бардак конечно, но рабочий — повсюду книги и распечатки каких-то статей. Похоже, профессор продолжает вести активную научную работу, несмотря на свой возраст…
Читать дальше →

Fuzzle CMS 2.6 — создание Flash-сайтов без Flash

Reading time2 min
Views791
Логотип Fuzzle CMSХотелось бы познакомить хабрапользователей с развитием нашего проекта Fuzzle CMS по созданию управляемых Flash-сайтов о котором я уже писал около 4 месяцев назад.

1. Мы постарались развить SEO-направление — имена и адреса страниц стали компактнее, добавилась возможность устанавливать TITLE, KEYWORDS и DESСRIРTION для каждой страницы. Разработано подключение Google Analytics и других счетчиков.

2. Мы добавили возможность расставлять редактируемые блоки не только на каждой странице сайта, но и на уровне дизайна сайта в целом. Дизайн можно загружать не только из SWF, но и из PNG и JPG-файлов, а создавать меню путем расстановки блоков. В конечном счете, получилось, что можно создавать Flash-сайт, вообще не используя Adobe Flash.

3. Мы запустили каталог расширений и полностью зарелизили API для разработчиков.
Четвертое и желающим попробовать...

Liveanime.ru — подключаем к видео внешние субтитры

Reading time3 min
Views2K
Liveanime.ru — большая вики-система, ориентированная на сбор каталога аниме и серий, доступных онлайн. Проект сугубо некоммерческий, а поскольку он основан на вики, каждый может улучшить уже известную информацию.

В центре находится Flash-видеоплейер, который умеет брать видео из одного источника, а субтитры — из другого.

Как это работает?
1. Пользователь находит на одном из забугорных хостингов (Youtube, Veoh, 6.cn) аниме с оригинальной озвучкой (ибо его там много);
2. Пользователь находит русские субтитры и заливает их на сайт;
3. Пользователь специальной директивой на вики-странице пишет: «создать ссылку, которая бы показывала во флеш-плейере данное видео и данные субтитры».

Что мы получаем?
Получаем бо-ольшой каталог аниме с оригинальным звуком, которое можно смотреть онлайн (в идеале). Сейчас в базе заполнено порядка 40 сериалов.

Правда, поскольку видео берется с внешних видеохостингов, почему-то IE часто не показывает видео, поэтому рекомендуется использовать другие браузеры (я использую FF).

Читать всякие технические подробности...
1

Information

Rating
164-th
Location
Королев, Москва и Московская обл., Россия
Registered
Activity