Search
Write a publication
Pull to refresh
2
Arseniy Lebedev @arse00nread⁠-⁠only

User

Send message

Chatgpt и gemini без проблем читают русский текст повернутый любым боком, раскрашенный в радужные цвета в очень низком разрешении.

Для одиночных картинок бесплатный gemini лучше подходит. А для больших пдф оно почти не пригодно Ж( Отсканированные пачки документов часто содержат кривой и вообще набок положенный текст, мистраль ocr его как картинки обрабатывает, вставляет в текст надпись <тут картинко>.

Главную причину кто то потёр. Сначала марсианские колонисты выйдут из под контроля ООН, а потом и вовсе нападут на нас.

Сжатие в 1 поток идет. Если надо много пожать то медленно, да. Но кому это на самом деле надо? Нужна только распаковка того что упаковали особо одаренные пользователи винрара.

Тем временем архиватор в винде научился сам сжимать в 7zip и tar + разные компрессоры (zstd итп). Так что теперь и 7zip не надо устанавливать. (На самом деле всё ещё надо, виндовый не может распаковать 7zip с паролем).

Чуть больше чем у одного из телеграм ботов который просто перепродает гпт тем кого в интернете забанили.

модель 2.5 Про уверенно встала в один ряд с MJ

MJ и некоторые другие успешно продаются за чудовищные деньги, дерут по 5 центов за каждую картинку. Продать что то через API яндекс может только обманом, заманив на бесплатные генерации и внезапно включив оплату.

Бизнесу нужны кредиты. Так что он их возьмет под любой процент или прогорит сразу. А дальше обязательно прогорит, если героином не торгует, и банки потеряют деньги. После чего центробанку придется их печатать. Конечно же никакой связи нет...

ИИ стартап(гпт+поиск) про который знает 2.5 гика хочет купить тикток?

Зрение еще надо было проверить, те же задачи по математике, и вообще все школьные, прилетают в гопоту в виде фотографий коленок школьниц.

И тут в лужу садится еще и дипсик, у него со зрением не очень. Нормальное зрение (русские буквы под любым углом и с низким качеством) есть у чатгпт и джемини, и возможно еще у клода.

Почему лучше запустить «сырой», но рабочий сервис, чем доводить его до идеала

Потому что большинство вообще не способно сделать хорошо?

Это другой сервис и другая модель...

То о чем идёт речь находится по адресу aistudio.google.com модель gemini 2.0 flash experimental и она рисует самостоятельно без помощи imagen3

Системный промпт там отключен, но можно воткнуть инструкцию прямо в чат после чего текстовая версия продавливается, а вот рисовать запрещенку он все равно не может, какой то другой фильтр его рубит.

Для ясности, функция генерации изображений Gemini 2.0 Flash на данный момент помечена как «экспериментальная» и «не для общего использования» и доступна только в инструментах Google для разработчиков, таких как AI Studio.

Она доступна через API так что есть уже во всех злачных местах, в телеграм ботах например.

Ковёр убрать может, это могу-немогу-хочу-нихачу у нее унаследовано от ллм, можно наверное исправить системным промптом.

Качество картинки обычно падает, но иногда происходит наоборот, что то типа апскейла, картинка с низким разрешением становится нормальной.

Исправлять раскладку с помощью запроса в гпт?

Это делается гораздо проще без гпт.

И гугл и мистраль дают нахаляву столько сколько мало кто вынести может. К гуглу например можно сделать 1500 запросов размером 300т символов в сутки, либо 1500 запросов на перевод картинок или звуков в текст.

У мистраля немного иначе но тоже очень много.

Качество у гугла одно из лучших если верить рейтингу с lmarena. У мистраля похуже но есть уникальные фишки, например может очень быстро и много переводить сканы пдф в текст.

Это упрощение вызова БЯМ, хоткей. Без этого тебе пришлось бы руками копипастить в БЯМ клиента и обратно.

Можно не светить если у тебя есть видеокарта за 2-3т баксов.

Я кажется видел реализацию пунто свитчера, или чего то похожего, на AutoHotkey. Там встроенный скриптовый язык позволяет писать полноценные программы. Возможно тебе стоит использовать его вместо питона.

Information

Rating
Does not participate
Registered
Activity

Specialization

Site Administrator
Middle
JavaScript
HTML
CSS