<?xml version="1.0" encoding="UTF-8"?>

<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" >

  <channel>
    <title><![CDATA[Комментарии / Профиль nsforth]]></title>
    <link>https://habr.com/ru/users/nsforth/comments/</link>
    <description><![CDATA[Хабр: комментарии пользователя nsforth]]></description>
    <language>ru</language>
    <managingEditor>editor@habr.com</managingEditor>
    <generator>habr.com</generator>
    <pubDate>Sun, 03 May 2026 22:27:39 GMT</pubDate>
    
    
      <image>
        <link>https://habr.com/ru/</link>
        <url>https://habrastorage.org/webt/ym/el/wk/ymelwk3zy1gawz4nkejl_-ammtc.png</url>
        <title>Хабр</title>
      </image>
    

    
      

      
        
  
    <item>
      <title>17.11.2025 12:10:14 </title>
      <guid isPermaLink="true">https://habr.com/ru/companies/selectel/articles/966356/#comment_29124832</guid>
      <link>https://habr.com/ru/companies/selectel/articles/966356/#comment_29124832</link>
      <description><![CDATA[<p>На доступной мне машине есть еще 3 Tesla T4, в которых полностью умещается Coder-30B. Интересный возникает четвертый сценарий в дополнение к Вашему, толстая MoE только на CPU и драфтовая полегче на GPU.</p>]]></description>
      <pubDate>Mon, 17 Nov 2025 12:10:14 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>16.11.2025 10:47:28 </title>
      <guid isPermaLink="true">https://habr.com/ru/companies/selectel/articles/966356/#comment_29119018</guid>
      <link>https://habr.com/ru/companies/selectel/articles/966356/#comment_29119018</link>
      <description><![CDATA[<p>Сервера в аренду с двумя процессорами AMD epyc и большим объемом памяти, чтобы запускать такие LLM. Точная конфигурация и ее стоимость приведены в статье в разделе "Как собрать Inference-сервер на CPU"-&gt;"Как собрать конфигурацию"</p>]]></description>
      <pubDate>Sun, 16 Nov 2025 10:47:28 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>16.11.2025 10:34:08 </title>
      <guid isPermaLink="true">https://habr.com/ru/companies/selectel/articles/966356/#comment_29118980</guid>
      <link>https://habr.com/ru/companies/selectel/articles/966356/#comment_29118980</link>
      <description><![CDATA[<p>Резонно. Вот результаты из которых сделаны графики <a href="https://gist.github.com/nsforth/e4457bd4749c98eb28f980c67a870618" rel="noopener noreferrer nofollow">https://gist.github.com/nsforth/e4457bd4749c98eb28f980c67a870618</a></p><p>model-draft не проверял, ранее в других тестах не получал заметную разницу, поэтому не включал в тесты в этот раз.</p><p>Машину я вернул с тестов, есть под рукой односокетная с AMD EPYC 9754 128-Core Processor, могу на ней попробовать с draft и без.</p>]]></description>
      <pubDate>Sun, 16 Nov 2025 10:34:08 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>16.11.2025 10:23:31 </title>
      <guid isPermaLink="true">https://habr.com/ru/companies/selectel/articles/966356/#comment_29118940</guid>
      <link>https://habr.com/ru/companies/selectel/articles/966356/#comment_29118940</link>
      <description><![CDATA[<p>Каждый xGMI это 16 линий pcie 5.0, только с другим протоколом, но скорость та же.</p><p>Получается 64 линии по 32 гигабита, при стандартной конфигурации 4 линка xGMI.</p><p>Это теоретически до 2048 гигабит в каждую сторону (256 гигабайт/с), двусторонний линк 512 гигабайт/с. Об этом написано в вашей же ссылке ниже в разделе Theoretical value analysis <a href="https://lenovopress.lenovo.com/lp1852-configuring-amd-xgmi-links-on-thinksystem-sr665-v3#theoretical-value-analysis" rel="noopener noreferrer nofollow">https://lenovopress.lenovo.com/lp1852-configuring-amd-xgmi-links-on-thinksystem-sr665-v3#theoretical-value-analysis</a></p><p>Также рекомендую прочитать <a href="https://www.amd.com/content/dam/amd/en/documents/products/epyc/4th-gen-epyc-processor-architecture-white-paper.pdf" rel="noopener noreferrer nofollow">https://www.amd.com/content/dam/amd/en/documents/products/epyc/4th-gen-epyc-processor-architecture-white-paper.pdf</a><br>там архитектура Infinity Fabric более-менее понятно расписана и тоже приводятся теоретические показатели пропускной способности.</p><p>Выше также комментировали (не Вы, а SlavikF) некие 200 гигабайт и 30 гигабайт, не понимаю откуда числа. Но давайте просто проверим теоретические расчеты тестами, какая пропускная способность будет на Epyc 4 поколения:</p><p><a href="https://gist.github.com/nsforth/50e87a9769dba93f897e194459857e24" rel="noopener noreferrer nofollow">https://gist.github.com/nsforth/50e87a9769dba93f897e194459857e24</a></p><p>Что получили - 700 гигабайт в секунду на оба сокета, 340 на один, 147 в одну сторону между numa 0-1 и 147 в другую между numa 1-0.</p><p>Итого: каждый процессор в numa interleaving может получать до 340 гигабайт в секунду в сумме (своя память + память соседа по numa), а оба примерно 700 гигабайт.</p>]]></description>
      <pubDate>Sun, 16 Nov 2025 10:23:31 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

      

      

    
  </channel>
</rss>
