<?xml version="1.0" encoding="UTF-8"?>

<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" >

  <channel>
    <title><![CDATA[Статьи]]></title>
    <link>https://habr.com/ru/users/datactive/publications/articles/</link>
    <description><![CDATA[Хабр: статьи пользователя datactive]]></description>
    <language>ru</language>
    <managingEditor>editor@habr.com</managingEditor>
    <generator>habr.com</generator>
    <pubDate>Mon, 04 May 2026 19:16:03 GMT</pubDate>
    
    
      <image>
        <link>https://habr.com/ru/</link>
        <url>https://habrastorage.org/webt/ym/el/wk/ymelwk3zy1gawz4nkejl_-ammtc.png</url>
        <title>Хабр</title>
      </image>
    

    
      
        
    
    <item>
      <title><![CDATA[Анализ новостей с помощью сегментации и кластеризации временных рядов]]></title>
      <guid isPermaLink="true">https://habr.com/ru/companies/otus/articles/805801/</guid>
      <link>https://habr.com/ru/companies/otus/articles/805801/?utm_campaign=805801&amp;utm_source=habrahabr&amp;utm_medium=rss</link>
      <description><![CDATA[<img src="https://habrastorage.org/getpro/habr/upload_files/d9b/6ac/750/d9b6ac750ce9f5029b8f9fe68541ca4a.png" /><p>В <strong>Отусе</strong> я прошла курс <a href="https://otus.ru/lessons/advanced-ml/">ML Advanced</a> и открыла для себя интересные темы, связанные с анализом временных рядов, а именно, их сегментацию и кластеризацию. Я решила позаимствовать полученные знания для своей дипломной университетской работы по <u>ивент-анализу социальных явлений и событий</u> и описать часть этого исследования в данной статье.</p><p><strong>Шаг 1. Сбор данных</strong></p><p>В качестве источника данных я взяла информационно-новостной ресурс <a href="https://lenta.ru/">Лента.ру</a>, так как с него легко парсить данные, новости разнообразны и пополняются в большом объеме ежедневно. Для теста я спарсила новости за последний год (март 2023 – март 2024) с помощью питоновских <em>BeautifulSoup</em> и <em>requests</em>.</p><p>В коде происходит процедура сбора заголовка, даты и тематики новостей:</p> <a href="https://habr.com/ru/articles/805801/?utm_campaign=805801&amp;utm_source=habrahabr&amp;utm_medium=rss#habracut">Читать далее</a>]]></description>
      
      <pubDate>Sat, 06 Apr 2024 08:30:49 GMT</pubDate>
      <dc:creator><![CDATA[Datactive (OTUS)]]></dc:creator>
      <category><![CDATA[Блог компании OTUS]]></category><category><![CDATA[Python]]></category><category><![CDATA[Визуализация данных]]></category><category><![CDATA[Машинное обучение]]></category>
      <category><![CDATA[сегментация]]></category><category><![CDATA[анализ временных рядов]]></category><category><![CDATA[кластеризация данных]]></category><category><![CDATA[новостные ресурсы]]></category><category><![CDATA[тематическое моделирование]]></category><category><![CDATA[k-means]]></category><category><![CDATA[python]]></category><category><![CDATA[машинное обучение]]></category><category><![CDATA[otus]]></category>
    </item>
  

  

  

	
  

  

  

      

      

      

    
  </channel>
</rss>
