<?xml version="1.0" encoding="UTF-8"?>

<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" >

  <channel>
    <title><![CDATA[Комментарии к публикации «Добавление OCR-слоя и другие преобразования PDF»]]></title>
    <link>https://habr.com/ru/companies/globalsign/articles/940286/</link>
    <description><![CDATA[Комментарии к публикации «Добавление OCR-слоя и другие преобразования PDF»]]></description>
    <language>ru</language>
    <managingEditor>editor@habr.com</managingEditor>
    <generator>habr.com</generator>
    <pubDate>Tue, 05 May 2026 22:50:04 GMT</pubDate>
    
    
      <image>
        <link>https://habr.com/ru/</link>
        <url>https://habrastorage.org/webt/ym/el/wk/ymelwk3zy1gawz4nkejl_-ammtc.png</url>
        <title>Хабр</title>
      </image>
    

    
      

      
        
  
    <item>
      <title>31.08.2025 08:04:00 saege5b</title>
      <guid isPermaLink="true">https://habr.com/ru/companies/globalsign/articles/940286/#comment_28777208</guid>
      <link>https://habr.com/ru/companies/globalsign/articles/940286/#comment_28777208</link>
      <description><![CDATA[<p>Потому, что пдф - костыльный костыль.</p><p>А тянуть войну форматов для универсального документа - бюджетами не вышли.</p><p>А дежавю - всё таки - архивный формат.</p>]]></description>
      <pubDate>Sun, 31 Aug 2025 08:04:00 GMT</pubDate>
      <dc:creator><![CDATA[saege5b]]></dc:creator>
    </item>
  

  
    <item>
      <title>25.08.2025 09:23:56 muhamuha</title>
      <guid isPermaLink="true">https://habr.com/ru/companies/globalsign/articles/940286/#comment_28750512</guid>
      <link>https://habr.com/ru/companies/globalsign/articles/940286/#comment_28750512</link>
      <description><![CDATA[<p>в ocrmypdf очень важно язык вручную задавать. И иметь  файл rus.traineddata в соответствующей папке. "Без этого не полетит" (с)</p>]]></description>
      <pubDate>Mon, 25 Aug 2025 09:23:56 GMT</pubDate>
      <dc:creator><![CDATA[muhamuha]]></dc:creator>
    </item>
  

  
    <item>
      <title>25.08.2025 07:49:18 Zara6502</title>
      <guid isPermaLink="true">https://habr.com/ru/companies/globalsign/articles/940286/#comment_28749958</guid>
      <link>https://habr.com/ru/companies/globalsign/articles/940286/#comment_28749958</link>
      <description><![CDATA[<p>вообще не ясно почему опенсорсные сообщества не развивают djvu как основной открытый формат вместо pdf</p>]]></description>
      <pubDate>Mon, 25 Aug 2025 07:49:18 GMT</pubDate>
      <dc:creator><![CDATA[Zara6502]]></dc:creator>
    </item>
  

  
    <item>
      <title>25.08.2025 07:48:29 Zara6502</title>
      <guid isPermaLink="true">https://habr.com/ru/companies/globalsign/articles/940286/#comment_28749946</guid>
      <link>https://habr.com/ru/companies/globalsign/articles/940286/#comment_28749946</link>
      <description><![CDATA[<p>только от этого толк есть лишь в возможности текст скопировать, у вас не будет форматированного распознанного документа с возможностью его редактировать</p>]]></description>
      <pubDate>Mon, 25 Aug 2025 07:48:29 GMT</pubDate>
      <dc:creator><![CDATA[Zara6502]]></dc:creator>
    </item>
  

  
    <item>
      <title>25.08.2025 03:06:14 susbox</title>
      <guid isPermaLink="true">https://habr.com/ru/companies/globalsign/articles/940286/#comment_28748914</guid>
      <link>https://habr.com/ru/companies/globalsign/articles/940286/#comment_28748914</link>
      <description><![CDATA[<p>Попробуйте просто открыть PDF в Chrome - он автоматом распознаёт текст в PDF.</p>]]></description>
      <pubDate>Mon, 25 Aug 2025 03:06:14 GMT</pubDate>
      <dc:creator><![CDATA[susbox]]></dc:creator>
    </item>
  

  
    <item>
      <title>24.08.2025 23:40:22 PereslavlFoto</title>
      <guid isPermaLink="true">https://habr.com/ru/companies/globalsign/articles/940286/#comment_28748740</guid>
      <link>https://habr.com/ru/companies/globalsign/articles/940286/#comment_28748740</link>
      <description><![CDATA[<p>При этом текст распознаётся очень плохо. Много ошибок с точками и запятыми, не всегда объединяется перенесённое слово. Чем надо исправлять и редактировать распознанный текст в файле PDF ?</p><p>Спасибо.</p>]]></description>
      <pubDate>Sun, 24 Aug 2025 23:40:22 GMT</pubDate>
      <dc:creator><![CDATA[PereslavlFoto]]></dc:creator>
    </item>
  

      

      

    
  </channel>
</rss>
