Comments / Profile of dimonier / Habr

Дмитрий @dimonier

Архитектор в Т1

ProfileArticles2PostsNewsComments116

Идеализация IT-сферы: что скрывается за красивой обложкой

dimonier Apr 6 at 17:19

Фу под руководством такого начальника работать

Look

DeepSeek работа с API и оплата доступа из РФ

dimonier Mar 30 at 18:56

Можно использовать российского аггрегатора ИИ-API с оплатой за рубли и доступом к любым ИИ без вот этих вот приключений

Look

Телеграм бот для быстрого распознавания текста на фото с помощью Mistral OCR

dimonier Mar 26 at 11:11

По-быстрому провел сравнительное тестирование Google Tesseract и Mistral OCR путем отправки одной картинки моему упомянутому выше боту и боту, описанному в этой статье.

Tesseract распознал больше половины текста, Mistral OCR - нисколько 🤷‍♂️

Look

Телеграм бот для быстрого распознавания текста на фото с помощью Mistral OCR

dimonier Mar 26 at 06:41

Спасибо, интересно!
Жаль, что Mistral OCR оправдал не все ожидания ;-)

Я уже давненько добавил в своего Телега-Обсидиан бота функцию OCR на базе бесплатного Google Tesseract, и она оказалась неожиданно удобна как в пути (для сохранения в заметочнике текстом чего-то ценного), так и за компом (как интерфейс для быстрого OCR).
Качество распознавания не супер-супер, но в большинстве случаев годится.

Исходник бота: https://github.com/dimonier/tg2obsidian

Look

AFFiNE — Obsidian здорового человека

dimonier Mar 11 at 05:24

нет, серьезно, как можно удобно использовать математику и не потратить неделю только на её изучение?

Obsidian не очень заходит тем, кто слез с Notion, потому что их ожидания почти гарантированно не будут оправданы. А также тем, кто любит всё настраивать «под себя», потому что в этом можно банально утонуть (попутно обвинив в этом инструмент).

Зато он подходит тем, кому от заметок нужно быстро и стабильно «ехать», а не «шашечки». И для этого не надо быть программистом и вообще айтишником.

Look

Mistral AI запускает новую функцию AI OCR с впечатляющими результатами

dimonier Mar 8 at 07:46

Сравнения с Google Tesserаct есть?

А то непонятно, «зачем платить больше» ©

Look

Как умирают техногиганты: от самого популярного сайта в Мире до закрытия — история Skype

dimonier Mar 4 at 17:20

Скайп был норм, но после покупки MS и переделки UI стал сильно тормозить и скатываться в 💩
Результат вполне ожидаемый - отток пользователей и забвение

+10

Look

DeepSeek — очередной квантовый скачок в развитии AI

dimonier Jan 26 at 19:04

У вас DeepSeek бракованный 😃

Мне так ответил (R1):

У Анны 3 сестры и 1 брат. Это означает, что в семье всего **5 детей**: Анна, её 3 сестры (всего 4 девочки) и 1 брат (мальчик).

Теперь рассмотрим вопрос: **сколько сестер у брата Анны?**

С точки зрения брата, его сестры — это все девочки в семье. Поскольку их **4** (Анна + 3 сестры), у брата **4 сестры**.

**Ответ:** 4.

Look

Пишем небольшое приложение на Python для повышения продуктивности с помощью ИИ и BotHub API

dimonier Jan 24 at 20:21

Данное решение как раз покрывает активность "ведется протокол встречи". Зачем тратить на это время живого человека, если можно это сделать автоматически, а руками только подрихтовать косяки? Если случается по несколько совещаний в день, то на протоколы уходит уйма времени.

Практикую подобное локальное решение на Whisper (модель turbo) и Llama 3.3 80B, получается норм. Пробую локальный DeepSeek R1 Qwen 32B - кажется, получается ещё лучше.

Look

Команда Obsidian подвела итоги ежегодной премии лучших расширений, инструментов и тем

dimonier Jan 24 at 16:52

В Обсе таблицы отображались вроде всегда нормально, а в прошлом году появился прекрасный визуальный редактор таблиц. По-моему, все, что можно было выжать из Markdown-таблиц, Обсидиан выжал.

Look

Размышляющая модель DeepSeek R1 уже доступна в Ollama

dimonier Jan 24 at 16:45

70B работает на 64 ГБ ОЗУ под виндой (Xeon e5), но медленно - 0.5-1 слово в секунду. Поэтому кажется, что в большом объеме ОЗУ смысла нет, т.к. большая модель запустится, но работать будет настолько медленно, что ею будет невозможно пользоваться.

Look

Обвиваем YouTube змеем, или как смотреть и скачивать видео с YouTube без VPN на чистом Python-е. Часть 1

dimonier Dec 27 2024 at 06:25

Такое имя не найдено, а если "мосты" написать правильно, то находится

Look

Поднимаем в облаке расшифровку речи в текст с помощью нейросетей. VPS на пределе возможностей

dimonier Dec 19 2024 at 13:20

Спасибо!
Выглядит дороговато.
Для рядового пользователя есть варианты проще/дешевле:

- Через Yandex Cloud можно за 5 т.р. в месяц распознать 138 часов звука (по копейке за секунду) с довольно высокой скоростью, это 6 часов аудио каждый рабочий день.

- По цене трёх месяцев такого VPS можно купить б/у GTX 1080 Ti с 11 ГБ RAM и (при наличии остального десктопного компа) транскрибировать аудиозаписи со скоростью 10x (для модели Whisper medium).

Look

Поднимаем в облаке расшифровку речи в текст с помощью нейросетей. VPS на пределе возможностей

dimonier Dec 19 2024 at 13:04

Tesseract: https://github.com/tesseract-ocr/tesseract

Look

Поднимаем в облаке расшифровку речи в текст с помощью нейросетей. VPS на пределе возможностей

dimonier Dec 19 2024 at 13:03

Для меня он самописный, для других - готовое решение: https://github.com/dimonier/tg2obsidian

Look

Поднимаем в облаке расшифровку речи в текст с помощью нейросетей. VPS на пределе возможностей

dimonier Dec 18 2024 at 10:16

У меня на домашнем вечновключённом компе крутится телеграм-бот с функциями транскрибации и ocr. Иногда думаю вынести его на хостинг, но не могу найти достаточно аргументов 😁

Look

Поднимаем в облаке расшифровку речи в текст с помощью нейросетей. VPS на пределе возможностей

dimonier Dec 18 2024 at 10:11

Сколько памяти и CPU должно быть у vps, чтобы это решение взлетело? Без этого непонятно, насколько оно рентабельно и, соответственно, жизнеспособно.

Look

T-Lite и T-Pro – открытые русскоязычные опенсорс-модели на 7 и на 32 млрд параметров

dimonier Dec 12 2024 at 06:01

Чем такой документ должен отличаться от транскрибации?

Look

От Trello к Obsidian: шаблон для управления проектами в стиле scrum

dimonier Dec 12 2024 at 04:13

Интересненько, спасибо!

Пробовал Kanban в Обсе когда-то, он показался корявым и бесполезным. Присмотрюсь ещё раз.

Dataview - ❤️❤️❤️

Look

Релиз открытой системы распознавания текста Tesseract 5.5.0

dimonier Nov 12 2024 at 16:54

Прочитал комменты выше. Люди, вы хоть пробовали использовать этот продукт, прежде чем ругать его?

За один вечер встроил предыдущую версию Tesseract в личного бота-секретаря, теперь отправляемые боту картинки сохраняются вместе с рассказанным текстом - красота.

Look

1 2

4 5 6

Information

Specialization