<?xml version="1.0" encoding="UTF-8"?>

<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" >

  <channel>
    <title><![CDATA[Статьи]]></title>
    <link>https://habr.com/ru/users/dkey/publications/articles/</link>
    <description><![CDATA[Хабр: статьи пользователя dkey]]></description>
    <language>ru</language>
    <managingEditor>editor@habr.com</managingEditor>
    <generator>habr.com</generator>
    <pubDate>Tue, 05 May 2026 19:04:24 GMT</pubDate>
    
    
      <image>
        <link>https://habr.com/ru/</link>
        <url>https://habrastorage.org/webt/ym/el/wk/ymelwk3zy1gawz4nkejl_-ammtc.png</url>
        <title>Хабр</title>
      </image>
    

    
      
        
    
    <item>
      <title><![CDATA[Insider API: поиск трендов и быстрая навигация в текстах соц. и традиционных медиа]]></title>
      <guid isPermaLink="true">https://habr.com/ru/articles/270607/</guid>
      <link>https://habr.com/ru/articles/270607/?utm_campaign=270607&amp;utm_source=habrahabr&amp;utm_medium=rss</link>
      <description><![CDATA[Как часто, имея массив текстов (любой тематики) мы хотим увидеть тематическую выжимку? Какие темы обсуждаются? Какие наиболее популярные? Как было бы здорово ввести поисковые слова и получить тренды вокруг них! <br/>
<img src="https://habrastorage.org/getpro/habr/post_images/9fa/1a2/490/9fa1a2490a21b54ffec3a369e52ea6b6.png" alt="image"/><br/>
 <a href="https://habr.com/ru/articles/270607/?utm_campaign=270607&amp;utm_source=habrahabr&amp;utm_medium=rss#habracut">Читать дальше &rarr;</a>]]></description>
      
      <pubDate>Wed, 18 May 2016 08:05:32 GMT</pubDate>
      <dc:creator><![CDATA[DKey]]></dc:creator>
      <category><![CDATA[Проектирование API]]></category><category><![CDATA[Data Mining]]></category><category><![CDATA[Поисковые технологии]]></category><category><![CDATA[Семантические сети]]></category>
      <category><![CDATA[я пиарюсь]]></category>
    </item>
  

  

  

	
  

  

  

    
    <item>
      <title><![CDATA[Анализ тональности в социальных медиа на русском языке при помощи RussianSentimentAnalyzer API]]></title>
      <guid isPermaLink="true">https://habr.com/ru/articles/262213/</guid>
      <link>https://habr.com/ru/articles/262213/?utm_campaign=262213&amp;utm_source=habrahabr&amp;utm_medium=rss</link>
      <description><![CDATA[В этом посте я покажу, как воспользоваться <a href="https://www.mashape.com/dmitrykey/russiansentimentanalyzer">API</a> анализа тональности в социальных медиа на русском языке. Одной из отличительных фич системы является возможность определять тональность по отношению к заданному объекту мониторинга. Проиллюстрирую на примере:<br/>
<br/>
<pre><code class="python">Мне нравится телефон X, но телефон Y ужасен.
</code></pre><br/>
 <a href="https://habr.com/ru/articles/262213/?utm_campaign=262213&amp;utm_source=habrahabr&amp;utm_medium=rss#habracut">Читать дальше &rarr;</a>]]></description>
      
      <pubDate>Fri, 10 Jul 2015 13:20:58 GMT</pubDate>
      <dc:creator><![CDATA[DKey]]></dc:creator>
      <category><![CDATA[Проектирование API]]></category><category><![CDATA[Java]]></category><category><![CDATA[Семантические сети]]></category>
      <category><![CDATA[анализ тональности]]></category><category><![CDATA[объекты текста]]></category><category><![CDATA[социальные медиа]]></category><category><![CDATA[api semanticanalyzer]]></category>
    </item>
  

  

  

	
  

  

  

    
    <item>
      <title><![CDATA[Weka проект для задачи распознавания тональности (сентимента)]]></title>
      <guid isPermaLink="true">https://habr.com/ru/articles/229779/</guid>
      <link>https://habr.com/ru/articles/229779/?utm_campaign=229779&amp;utm_source=habrahabr&amp;utm_medium=rss</link>
      <description><![CDATA[Это перевод моей <a href="http://dmitrykan.blogspot.fi/2014/04/weka-template-project-for-sentiment.html">публикации на английском языке</a>.<br/>
 <br/>
Интернет полон статьями, заметками, блогами и успешными историями применения машинного обучения (machine learning, ML) для решения практических задач. Кто-то использует его для пользы и просто поднять настроение, как эта картинка:<br/>
<br/>
<img src="https://habrastorage.org/getpro/habr/post_images/171/65a/730/17165a730ce59e47fa1020b4e11e4aaf.jpg" alt="image"/><br/>
<br/>
Правда, человеку, не являющемуся экспертом в этих областях, подчас не так просто подобраться к существующему инструментарию. Есть, безусловно, хорошие и относительно быстрые пути к практическому машинному обучению, например, Python-библиотека <a href="http://scikit-learn.org/stable/">scikit</a>. Кстати, <a href="https://github.com/DmitryKey/kaggle_stackexchange_prediction">этот проект</a> содержит код, написанный в команде SkyNet (автору довелось быть её лидирующим участником) и иллюстрирующий простоту взаимодействия с библиотекой. Если вы Java разработчик, есть пара хороших инструментов: <a href="http://www.cs.waikato.ac.nz/ml/weka/">Weka</a> и <a href="https://mahout.apache.org/">Apache Mahout</a>. Обе библиотеки универсальны с точки зрения применимости к конкретной задаче: от рекомендательных систем до классификации текстов. Существует инструментарий и более заточенный под текстовое машинное обучение: <a href="http://mallet.cs.umass.edu/">Mallet</a> и набор библиотек <a href="http://www-nlp.stanford.edu/software/index.shtml">Stanford</a>. Есть и менее известные библиотеки, как <a href="http://java-ml.sourceforge.net/">Java-ML</a>.<br/>
<br/>
В этом посте мы сфокусируемся на библиотеке Weka и сделаем проект-заготовку или проект-шаблон для текстового машинного обучения на конкретном примере: задача распознавания тональности или сентимента (sentiment analysis, sentiment detection). Несмотря на всё это, проект полностью рабочий и даже под commercial-friendly лицензией (сама Weka под GPL 3.0), т.е. при большом желании вы можете даже применить код в своих проектах. <a href="https://habr.com/ru/articles/229779/?utm_campaign=229779&amp;utm_source=habrahabr&amp;utm_medium=rss#habracut">Читать дальше &rarr;</a>]]></description>
      
      <pubDate>Mon, 14 Jul 2014 10:10:54 GMT</pubDate>
      <dc:creator><![CDATA[DKey]]></dc:creator>
      <category><![CDATA[Open source]]></category><category><![CDATA[Алгоритмы]]></category>
      <category><![CDATA[nlproc]]></category><category><![CDATA[машинное обучение]]></category><category><![CDATA[weka]]></category><category><![CDATA[анализ тональности]]></category>
    </item>
  

  

  

	
  

  

  

      

      

      

    
  </channel>
</rss>
