Для одиночных картинок бесплатный gemini лучше подходит. А для больших пдф оно почти не пригодно Ж( Отсканированные пачки документов часто содержат кривой и вообще набок положенный текст, мистраль ocr его как картинки обрабатывает, вставляет в текст надпись <тут картинко>.
Сжатие в 1 поток идет. Если надо много пожать то медленно, да. Но кому это на самом деле надо? Нужна только распаковка того что упаковали особо одаренные пользователи винрара.
Тем временем архиватор в винде научился сам сжимать в 7zip и tar + разные компрессоры (zstd итп). Так что теперь и 7zip не надо устанавливать. (На самом деле всё ещё надо, виндовый не может распаковать 7zip с паролем).
MJ и некоторые другие успешно продаются за чудовищные деньги, дерут по 5 центов за каждую картинку. Продать что то через API яндекс может только обманом, заманив на бесплатные генерации и внезапно включив оплату.
Бизнесу нужны кредиты. Так что он их возьмет под любой процент или прогорит сразу. А дальше обязательно прогорит, если героином не торгует, и банки потеряют деньги. После чего центробанку придется их печатать. Конечно же никакой связи нет...
Зрение еще надо было проверить, те же задачи по математике, и вообще все школьные, прилетают в гопоту в виде фотографий коленок школьниц.
И тут в лужу садится еще и дипсик, у него со зрением не очень. Нормальное зрение (русские буквы под любым углом и с низким качеством) есть у чатгпт и джемини, и возможно еще у клода.
Системный промпт там отключен, но можно воткнуть инструкцию прямо в чат после чего текстовая версия продавливается, а вот рисовать запрещенку он все равно не может, какой то другой фильтр его рубит.
Для ясности, функция генерации изображений Gemini 2.0 Flash на данный момент помечена как «экспериментальная» и «не для общего использования» и доступна только в инструментах Google для разработчиков, таких как AI Studio.
Она доступна через API так что есть уже во всех злачных местах, в телеграм ботах например.
Ковёр убрать может, это могу-немогу-хочу-нихачу у нее унаследовано от ллм, можно наверное исправить системным промптом.
Качество картинки обычно падает, но иногда происходит наоборот, что то типа апскейла, картинка с низким разрешением становится нормальной.
И гугл и мистраль дают нахаляву столько сколько мало кто вынести может. К гуглу например можно сделать 1500 запросов размером 300т символов в сутки, либо 1500 запросов на перевод картинок или звуков в текст.
У мистраля немного иначе но тоже очень много.
Качество у гугла одно из лучших если верить рейтингу с lmarena. У мистраля похуже но есть уникальные фишки, например может очень быстро и много переводить сканы пдф в текст.
Я кажется видел реализацию пунто свитчера, или чего то похожего, на AutoHotkey. Там встроенный скриптовый язык позволяет писать полноценные программы. Возможно тебе стоит использовать его вместо питона.
Chatgpt и gemini без проблем читают русский текст повернутый любым боком, раскрашенный в радужные цвета в очень низком разрешении.
Для одиночных картинок бесплатный gemini лучше подходит. А для больших пдф оно почти не пригодно Ж( Отсканированные пачки документов часто содержат кривой и вообще набок положенный текст, мистраль ocr его как картинки обрабатывает, вставляет в текст надпись <тут картинко>.
Главную причину кто то потёр. Сначала марсианские колонисты выйдут из под контроля ООН, а потом и вовсе нападут на нас.
Сжатие в 1 поток идет. Если надо много пожать то медленно, да. Но кому это на самом деле надо? Нужна только распаковка того что упаковали особо одаренные пользователи винрара.
Тем временем архиватор в винде научился сам сжимать в 7zip и tar + разные компрессоры (zstd итп). Так что теперь и 7zip не надо устанавливать. (На самом деле всё ещё надо, виндовый не может распаковать 7zip с паролем).
Чуть больше чем у одного из телеграм ботов который просто перепродает гпт тем кого в интернете забанили.
MJ и некоторые другие успешно продаются за чудовищные деньги, дерут по 5 центов за каждую картинку. Продать что то через API яндекс может только обманом, заманив на бесплатные генерации и внезапно включив оплату.
Бизнесу нужны кредиты. Так что он их возьмет под любой процент или прогорит сразу. А дальше обязательно прогорит, если героином не торгует, и банки потеряют деньги. После чего центробанку придется их печатать. Конечно же никакой связи нет...
ИИ стартап(гпт+поиск) про который знает 2.5 гика хочет купить тикток?
Зрение еще надо было проверить, те же задачи по математике, и вообще все школьные, прилетают в гопоту в виде фотографий коленок школьниц.
И тут в лужу садится еще и дипсик, у него со зрением не очень. Нормальное зрение (русские буквы под любым углом и с низким качеством) есть у чатгпт и джемини, и возможно еще у клода.
Потому что большинство вообще не способно сделать хорошо?
Это другой сервис и другая модель...
То о чем идёт речь находится по адресу aistudio.google.com модель gemini 2.0 flash experimental и она рисует самостоятельно без помощи imagen3
Системный промпт там отключен, но можно воткнуть инструкцию прямо в чат после чего текстовая версия продавливается, а вот рисовать запрещенку он все равно не может, какой то другой фильтр его рубит.
Можно больше чем 1 картинку закинуть
Она доступна через API так что есть уже во всех злачных местах, в телеграм ботах например.
Ковёр убрать может, это могу-немогу-хочу-нихачу у нее унаследовано от ллм, можно наверное исправить системным промптом.
Качество картинки обычно падает, но иногда происходит наоборот, что то типа апскейла, картинка с низким разрешением становится нормальной.
Исправлять раскладку с помощью запроса в гпт?
Это делается гораздо проще без гпт.
И гугл и мистраль дают нахаляву столько сколько мало кто вынести может. К гуглу например можно сделать 1500 запросов размером 300т символов в сутки, либо 1500 запросов на перевод картинок или звуков в текст.
У мистраля немного иначе но тоже очень много.
Качество у гугла одно из лучших если верить рейтингу с lmarena. У мистраля похуже но есть уникальные фишки, например может очень быстро и много переводить сканы пдф в текст.
Это упрощение вызова БЯМ, хоткей. Без этого тебе пришлось бы руками копипастить в БЯМ клиента и обратно.
Можно не светить если у тебя есть видеокарта за 2-3т баксов.
Я кажется видел реализацию пунто свитчера, или чего то похожего, на AutoHotkey. Там встроенный скриптовый язык позволяет писать полноценные программы. Возможно тебе стоит использовать его вместо питона.