Pull to refresh
-11
0.5
Send message

>кто-то ещё пользуется гпт

да никто почти )))

>в первом же сообщении дала рабочие команды но совершенно неверные

расшарь чаты, пока что веет прохладой.

нужно признать, что в админских делишках GPT ХУЖЕ чем хорошая штатная дока. а у многих проектов оно есть. но чтобы "не могу пользоваться" - это какой-то баг в консерватории

>Gemini 3 Flash Preview обходится в четыре раза дешевле Opus при отставании лишь в 3 процентных пункта

Если "полное говно" и "около-лидер" отличаются на 3% возникает много вопросов к качеству теста.

Внимательно не читал, вроде вся статья одно да потому в очень спорном ключе "у gpt галюны - значит оно бесполезный мусор". У кожмешков тоже глюков полно, но это некоторым из них не мешает быть ноблевскими лауреатами и всем таким подобным.

Глюками называю например когнитивные искажения описанные у Юдковского.


Да и математики бывают... Перельман тот же. У него что-то кроме гениальности и глюков есть?

"перспективыные искажения" - понятие очень растяжимое, странно ждать ответ по существу без конкретных вопросов.

Лично у меня в проде такие доки не требуется распознавать.

Вот на этой картинке tess распознал всё начиная с "как розовые яблоки".

paddleVL распознал печатный текст полностью, рукописный - облажался.

Разница в скорости в 10 раз (0.2сек на 1 ядро cpu vs 2сек на gpu)


Насколько помню тесс воспринимает только четко горизонтальный текст. Так что при желании можно подобрать примеры с вопиющим обсёром tess-а.

Так же добавлю, что разница у tess 5.5 и то что было в 2022м очень большая, несмотря на то что сами модели (tessdata) уже лет как 6-8 не менялись. Что-то в бинарнике улучшают.

ты даже не потрудился понять коммент на который ответил.

1 gpt-им - "кто лучше paddleocr vs tesseract" - ответ: "paddleocr намного лучше и быстрее tesseract. скорость 50-200мс на страницу"

2 пердолимся 2-3 дня, по скорости одинаково, по качеству одинаково. скорость страницы 1-2 сек на A4000.

3 gpt-им "ты что собака обещала скорость и качество, как конкретно тюнить на скорость и качество" - ответ: "хрю-му, сила paddleocr не в скорости и качестве, а в том что таблички понимает"

лять... а мне не нужны твои таблички. у меня ХХ ТБ просто плохих сканов. и нормально это жуёт хотя бы gemma 12b, а не падлы всякие.


Ну и возвращаясь к исходному вопросу "зачем платить больше" - вот именно, что во многих задачах незачем, т.к. всё через gemma 12b прогонять слишком дорого.

>Tesseract давно отстал от нейронок

кококо... в Tesseract "нейронки" появились в 2018 году. Если тебе не нужны таблицы, то тессеракт всех рвёт по скорости как тузик грелку. По качеству текста никакой разницы у tess 5.5 vs paddle 3.3 не вижу (в 2026м году)

>У Replit сейчас 150 000 платящих клиентов и $240 млн годовой выручки

типа, каждый платит в среднем $1600 (сказочные 3.14здаболы)

Хорошая тема, но вообще нет технических подробностей.

4-6 модели, как понимаю, запускались через что-то в духе ollama?

а PaddleOCR VL 0.9B  ? через штатную питоновую обвязку?

Сам два дня мучаю PaddleOCR VL 0.9B  - вообще не вижу никакого превосходства над tesseract по качеству. И на порядок медленнее (т.к. PaddleOCR VL надо GPU - у меня одна A4000, а за те же деньги можно взять 32ядерный ryzen где каждое ядро по скорости как падла на А4000). Скармливаю сложные картинки - навроде плохих сканов с рукописными кусками и товарных чеков. Непонятно зачем у PaddleOCR столько самовосхваления на сайте.

а смысл? фсспшные базы всё равно у всех желающих уже есть, стабильно каждый год сливают начиная с 2020.

>Бьюрри также сообщил, что владеет «медвежьими» пут-опционами на Oracle и напрямую шортил компанию-разработчика СУБД в течение последних шести месяцев.

как истинный инфоцыганин, он об этом пишет сейчас, а не в виде плана на будущее с четкими точками входа и выхода. что например позволяет ему шортить 10 тикеров на все сценарии жизни, а потом называть только те где фартануло.


p.s. пузырь ИИ то конечно лопнет, но перед этим хомяков традиционно шортсквизнут. Поэтому лучше сидеть на ж ровно и не лезть в это казино )

>что платформа начала массово блокировать каналы за публикацию личных данных и вымогательство

паша дуров - честнейший человек. значит так оно и есть (издевательский ржач)

только в 2026м уже раздали Кордон 106М и ФССП 2024. А в прошлом году госуслуги 2023 210М, госуслуги 2025, пфр 100м.

странная формулировка "а почему вы не пробовали", очевидно что пробовал, раз говорю и gemini ничем не выделяется в балабольстве и СЛИВАЕТ в коде. оратор ниже полностью прав "чат-боты уже плюс-минус одинаковые"

Зато в каждой новости кукареку-гемини-ко-ко-ко-ко-коооооооо!!!


p.s. вот банально "how to setup paddleocr for fastest execution and tune for best quality russian and english language ?"

chatgpt:
paddleocr ocr
-i doc-1.jpg
--lang ru
--use_gpu True
--precision fp16
--det_algorithm DB
--rec_algorithm SVTR_LCNet
--rec_batch_num 8
--det_db_box_thresh 0.5
--det_db_unclip_ratio 1.6
--use_doc_orientation_classify False
--use_doc_unwarping False
--use_textline_orientation False

gemini:
(deprecated ключи, никакого тюнинга)
paddleocr --image_dir doc-1.jpg \ --lang="cyrillic" \ --ocr_version="PP-OCRv4" \ --use_gpu=True \ --ir_optim=True \ --use_angle_cls=True \ --enable_mkldnn=True

>почему у Эпл так плохо идут дела с так-называемым "ИИ"

потому что это сложно. у гугла тоже дела идут хреново, бабла хватает только на говнопиар gemini 3 (как оно всех порвало в вымышленных тестах). Сделать реального лидера не могут.

Ну, прогресс на самом деле есть. Я недавно поручал chatgpt задачу: "compile latest 7zip .so and make java app to use it to extract files". И за 3 бакса и 20 минут получил что-то запускающееся и навскидку работающее.

А ещё полгода назад у тогдашнего chatgpt был обсёр и хождение по кругу на этой задаче. Прогресс, впрочем, больше в обвязке (все эти cli и ide, которые позволяют не пердолиться часами с копипастой туда-сюда)

Кто б такую статистику для божественного вантуза сделал )


Из соседней новости про лохматую пропиетарщину UNIXv4:

Один из исследователей безопасности обратил внимание на утилиту "su", поставлявшуюся в UNIXv4. Данная утилита включала менее 50 строк кода, устанавливалась с флагом setuid-root и позволяла запустить /bin/sh с правами root при вводе правильного пароля. Код содержал уязвимость, приводящую к переполнению буфера из-за копирования вводимого пользователем пароля в фиксированный 100-символьный массив без проверки размера вводимых данных.

Выявленную проблему прокомментировал 93-летний Дуглас Макилрой (Douglas McIlroy), входивший в команду изначальных разработчиков Unix в Bell Labs, предложивший концепцию неименованных каналов и создавший такие утилиты, как echo, spell, diff, sort, join и tr. По словам Дугласа, до появления червя Морриса в 1988 году мало кто обращал внимание на переполнения буферов.

>99% не изображают

хахаха

>А что значит вот это "делает-ровно-минимум по ТК РФ" ?

приходит на работу вовремя. закрывает тикеты со скоростью черепахи. почитывает в "свободное время" ТК РФ. ну давай, удачи уволить такого по СЖ

все эти крутые индусы инженегры из бигтеха они точно не плод вашей фантазии? ))))

>на замене "детей"

и какова же процедура смены ленивого-долбоёба-который-делает-ровно-минимум по ТК РФ?

wget-нул файл, нормальный скрипт. Если у тебя не лапки, что мешало в set -e x добавить и конкретно сказать что сломано. По всем признакам сломан танцор.

вот он истинный уровень потребителя чудо-технологии:

1. curl | bash

2 логи не нашёл

Information

Rating
1,809-th
Registered
Activity