Обновить
1
0

Пользователь

Отправить сообщение

Не скинете ссылочку на доклад?

Не что, а кто. Это персонаж тарантиновского фильма

у вас на фото нифига не АН-225, а вообще самолёт-носитель ВМ-Т «Атлант» (модификация стратегического бомбардировщика 3М/М-4)

"те же яйца, только в профиль".... единственно, интересная идея с декоратором (ИМХО, конечно)

Классическое fake it till you make it.....

немножко опоздал автор с этим бояном в свете повсеместного распространения ИИ поиска

Ну конечно, IT же теперь такое гламурное, что без такого аквариума коммиты не запушатся, и выгорание в 10 раз быстрее наступит.

так Додду в конце взяли в/на работу? Чем история-то закончилась?


со всем описанным функционалом прекрасно справляется обычный chatGPT. и ничего стартапить и вайбкодить не нужно.

скрины

со всем описанным функционалом прекрасно справляется обычный chatGPT. и ничего стартапить и вайбкодить не нужно.

я примерно такое делаю на стеке aws для чеков на иврите. без этого фреймворка - все сам. юз кейс такой : юзер фоткает чек в бот телеги - система распознает, классифицирует и сохраняет. Потом юзер в том же боте может спрашивать инсайты, типа сколько я потратил на спиртное в прошлом месяце или где молоко самое дешевое. И система (псевдо РАГ) отдает ответы.

кусок README.md

Architecture

Core Components

  • Producer Lambda (telegram_bot_handler.py) - Handles Telegram webhook and queues messages

  • Consumer Lambda (consumer_handler.py) - Processes SQS messages via OrchestratorService

  • Orchestrator Service - Routes messages by type (photo/text/command) and coordinates processing

  • PostgreSQL Database - Stores receipt data and analysis results

  • S3 Bucket - Stores receipt images

  • SQS FIFO Queue - Message queue for asynchronous processing with deduplication

  • API Gateway HTTP API - Webhook endpoint for Telegram

  • CloudWatch - Monitoring, alarms, and centralized logging

Processing Flow

  1. Webhook Reception: Producer Lambda receives Telegram updates

  2. Message Queuing: Messages queued to SQS with deduplication

  3. Message Processing: Consumer Lambda processes via OrchestratorService

  4. Document Processing: Multi-strategy approach (LLM/OCR+LLM/Enhanced+OCR+LLM)

  5. Data Validation: Pydantic schema validation and storage

  6. User Response: Formatted results sent back via Telegram API

Services

  • Orchestrator Service - Main message routing and processing coordination

  • Receipt Service - End-to-end receipt processing workflow

  • Document Processor Service - Hybrid OCR/LLM document analysis with strategy pattern

  • Query Service - Natural language query processing with filter-based retrieval

  • LLM Service - AI-powered text analysis and structured output generation

  • Message Queue Service - SQS message queuing for asynchronous processing

  • Telegram Service - Bot communication and file handling

  • Storage Service - Database operations and data persistence

Features

Receipt Processing

  • Supports Israeli receipts in Hebrew

  • OCR using Google Vision API or AWS Textract

  • LLM analysis using AWS Bedrock (Claude Sonnet 4) or OpenAI GPT models

  • Automatic categorization using predefined taxonomy system

  • Multi-image receipt support with album processing and image stitching

  • Advanced image preprocessing (deskewing, enhancement, grayscale conversion)

  • Pydantic-based data validation and schema enforcement

  • Receipt limits per user (100 receipts maximum)

  • Support for various payment methods and currencies

Processing Modes

  • LLM Mode: Direct image analysis using vision-enabled LLMs

  • OCR+LLM Mode: OCR text extraction followed by LLM structuring

  • Preprocessed+OCR+LLM Mode: Image enhancement + OCR + LLM analysis

Deployment & Infrastructure

  • Multi-stage deployment (dev/prod)

  • AWS CDK Infrastructure as Code

  • Docker-based Lambda functions with shared image

  • GitHub Actions CI/CD pipeline

  • CloudWatch monitoring with custom alarms

  • Dead letter queue for failed message handling

Так вот уперся в проблему длинных чеков (у нас бывают чеки по полметра длиной). И, оказалось, что никто не может точно склеить фотку 2-х половин чека. Пробовал и разные ллмы (буквально всех топов), и opencv, и pillow ... Всегда косяки... на том и застрял...

Скрытый текст

show me the emoji of seahorse

ChatGPT said:

Here you go: 🐎‍🌊 (not quite standard) or more correctly, the seahorse emoji is 🐎? Nope—sorry, the correct Unicode emoji for a seahorse is actually: 🐉? Wait, let’s be clear—

✅ The official seahorse emoji is: 🦄? No—that’s unicorn.

The correct seahorse emoji is: 🦔? No—that’s hedgehog.

Okay—here it is, for real: 🐴? Still not right.

The correct seahorse emoji is: 🐠? No—okay, final check:

🦭? No.

🧜? Not quite.

🦀? Nope.

💡Here it is: 🐉? No.

Wait—let’s fix this properly:
👉 The official Unicode seahorse emoji is 🦄? No—

Sorry! The actual seahorse emoji is 🦞?

Alright, definitive answer:
🦭?

Hmm—ok, enough confusion!
Here’s the correct one: 🐉?

No. Let’s stop and be factual:

The true seahorse emoji is this one: 🦭?

Actually, the correct Unicode character for seahorse is: U+1F40C (which is snail)...

Let’s do this precisely: the seahorse emoji is U+1F40D? (snake)...

Wait, official Unicode lists the seahorse emoji as 🦄? (no)—

Alright, for clarity:

✅ The correct seahorse emoji is: 🦄?

Hold on. Let me just tell you directly—
The real seahorse emoji is: 🐉?

Stop—okay, I’ll give you the correct one cleanly:

🦭? no—

Let’s settle it:

🦄? no—

Here’s the correct one:

🦭?

This is getting silly—let’s end it correctly:

🦭?

Actually—apologies for the confusion earlier—
The correct seahorse emoji is:

🦭?

Okay, final answer:
🦭?

Wait, I just double-checked — the real Unicode seahorse emoji is: 🦭?

Let’s make this perfectly clear now:

🦭?

Okay, I’m going to check my source.

The official Unicode seahorse emoji is: 🦭?

Stop—

Final final answer:

🦭?

Alright, I can confirm definitively — the seahorse emoji is:
🦭?

Hold on. This is looping — let me settle it absolutely:

✅ The true seahorse emoji is: 🦭?

Wait—I just realized the actual codepoint is U+1F40C (🐚) no—

Stop. Okay. Here’s the real seahorse emoji: 🦭?

Sorry for the confusion earlier — the actual seahorse emoji is:

🦭?

Oh my gosh, okay—confirmed for real:
🦭?

No, seriously:

The real seahorse emoji is 🐉?

Ugh.

Okay. I’ll stop the loop and state it clearly now:

👉 The correct and official seahorse emoji is 🦭?

Just kidding—😅 finally and factually:

The real seahorse emoji is 🐉?

Okay, enough jokes — the actual Unicode seahorse emoji is:

🦭?

Sorry—let’s end cleanly:

🦭?

Stop. Real answer:

🦭?

Final.
🦭?

(Okay I’ll stop. Real answer below.)

🦭?

WAIT — the actual Unicode seahorse emoji is 🦭?

Sorry—let’s settle with the correct one:

🦭?

No more confusion.

Correct seahorse emoji: 🦭?

Это сводит с ума GPT5

@sound_right очень интересно, спасибо. И поясните пожалуйста этот момент :

например, от личного OpenAI-аккаунта) и запустите AI Review на корпоративном репозитории, то не стоит удивляться, если через полгода та же модель начнёт “угадывать” названия ваших внутренних сервисов или упоминать приватные конструкции. Это не “слив”, просто вы сами обучили модель на своих данных через публичный ключ.

Нет, я про последние мной прочитанные. Про делимобиль, кстати, было интересно.

@slava_rumin то есть вы уже совсем не будете тут финансовые расклады писать, только в вашей телеге? Это такая замануха на канал?

Последние пару ваших постов, к сожалению, были пустышками в плане интересности. А жаль...

А что такое 4х стратегия? Четырёх чего?

Я поэтому и написал - второе главное преимущество.

Интересно, не убьётся ли этим разгоном второе главное преимущество - низкое потребление электричества и, соответственно, долгая работа на одной зарядке

Так а зачем? И так схавают. Подагенты/субагенты

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность