<?xml version="1.0" encoding="UTF-8"?>

<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" >

  <channel>
    <title><![CDATA[Комментарии / Профиль dkey]]></title>
    <link>https://habr.com/ru/users/dkey/comments/</link>
    <description><![CDATA[Хабр: комментарии пользователя dkey]]></description>
    <language>ru</language>
    <managingEditor>editor@habr.com</managingEditor>
    <generator>habr.com</generator>
    <pubDate>Sat, 02 May 2026 11:08:18 GMT</pubDate>
    
    
      <image>
        <link>https://habr.com/ru/</link>
        <url>https://habrastorage.org/webt/ym/el/wk/ymelwk3zy1gawz4nkejl_-ammtc.png</url>
        <title>Хабр</title>
      </image>
    

    
      

      
        
  
    <item>
      <title>04.09.2017 12:12:54 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/406431/#comment_18354981</guid>
      <link>https://habr.com/ru/articles/406431/#comment_18354981</link>
      <description><![CDATA[Бывают, что знания необходимы не постоянно, а периодически. Например, вы готовитесь выступить с речью и хотите запомнить яркую фразу.<br>
<br>
Другой use case: у вас появляются мысли, которые можно записать в блокнот и… забыть, а можно поместить в приложение, которое напомнит вам для последующего развития идеи.]]></description>
      <pubDate>Mon, 04 Sep 2017 12:12:54 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>19.05.2016 07:29:15 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/270607/#comment_9616294</guid>
      <link>https://habr.com/ru/articles/270607/#comment_9616294</link>
      <description><![CDATA[Спасибо за доверие. В следующий раз — обязательно.]]></description>
      <pubDate>Thu, 19 May 2016 07:29:15 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>18.05.2016 17:17:44 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/270607/#comment_9615642</guid>
      <link>https://habr.com/ru/articles/270607/#comment_9615642</link>
      <description><![CDATA[Это правда. Остался открытым Graph API, при помощи которого можно загрузить странички-хабы по брендам / политике / спорту и тд с комментариями, лайками и тд. Помимо этого есть scrappers (например: http://scrapy.org/).]]></description>
      <pubDate>Wed, 18 May 2016 17:17:44 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>18.05.2016 17:00:36 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/270607/#comment_9615612</guid>
      <link>https://habr.com/ru/articles/270607/#comment_9615612</link>
      <description><![CDATA[Дело в том, что данная публикация преследует ознакомительную цель с данным продуктом. А относится ли это к разработке — имхо, да. Ведь продукты на основе данного API вполне себе разработка.]]></description>
      <pubDate>Wed, 18 May 2016 17:00:36 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>18.05.2016 12:25:24 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/270607/#comment_9614926</guid>
      <link>https://habr.com/ru/articles/270607/#comment_9614926</link>
      <description><![CDATA[Добавлено описание взаимодействия с end-point'ами.]]></description>
      <pubDate>Wed, 18 May 2016 12:25:24 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>18.05.2016 12:08:03 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/270607/#comment_9614888</guid>
      <link>https://habr.com/ru/articles/270607/#comment_9614888</link>
      <description><![CDATA[мне действительно не доступен хаб «Я пиарюсь». Поэтому на посте есть тэг.]]></description>
      <pubDate>Wed, 18 May 2016 12:08:03 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>18.05.2016 11:09:40 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/270607/#comment_9614734</guid>
      <link>https://habr.com/ru/articles/270607/#comment_9614734</link>
      <description><![CDATA[спасибо за рекомендации. Data mining — например, извлечение адресов из текстов. Какой хаб вы бы порекомендовали?]]></description>
      <pubDate>Wed, 18 May 2016 11:09:40 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>18.05.2016 11:08:25 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/270607/#comment_9614730</guid>
      <link>https://habr.com/ru/articles/270607/#comment_9614730</link>
      <description><![CDATA[Чем старше данные, тем меньше вопросов от соответствующих организаций. Для новых данных система тоже работает.]]></description>
      <pubDate>Wed, 18 May 2016 11:08:25 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>18.05.2016 11:07:26 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/270607/#comment_9614728</guid>
      <link>https://habr.com/ru/articles/270607/#comment_9614728</link>
      <description><![CDATA[Кредитка не нужна для теста: скиньте свой mashape id и я сделаю личный план.]]></description>
      <pubDate>Wed, 18 May 2016 11:07:26 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>17.09.2015 19:52:52 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/266821/#comment_8577769</guid>
      <link>https://habr.com/ru/articles/266821/#comment_8577769</link>
      <description><![CDATA[Привет, спасибо за классный сборник. Хочется порекламировать популярный тулбокс для удобного анализа и работы с индексами lucene / solr / elasticsearch: luke. <a href="https://github.com/DmitryKey/luke">github.com/DmitryKey/luke</a> Проект уже используется в таких проектах, как Hibernate, Jackrabbit Oak.]]></description>
      <pubDate>Thu, 17 Sep 2015 19:52:52 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>14.07.2015 21:09:52 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/262213/#comment_8499103</guid>
      <link>https://habr.com/ru/articles/262213/#comment_8499103</link>
      <description><![CDATA[Т.е. Вы, вероятно, имеете ввиду градацию меток тональности больше, чем на три класса: 5 или 7 и так далее. Силу тональности мы ещё не подключали, но принципиально в системе эта информация присутствует. Если Вам интересно потестировать такой алгоритм, будем рады обсудить в личном порядке.]]></description>
      <pubDate>Tue, 14 Jul 2015 21:09:52 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>14.07.2015 13:43:07 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/262213/#comment_8498395</guid>
      <link>https://habr.com/ru/articles/262213/#comment_8498395</link>
      <description><![CDATA[мой ответ в ветке выше — нажал не на ту ссылку.]]></description>
      <pubDate>Tue, 14 Jul 2015 13:43:07 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>13.07.2015 14:08:39 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/262213/#comment_8496641</guid>
      <link>https://habr.com/ru/articles/262213/#comment_8496641</link>
      <description><![CDATA[<blockquote>у вас в системе возможны только два ответа: позитивный и негативный?</blockquote><br/>
<br/>
три: позитивный, негативный, нейтральный<br/>
<br/>
<blockquote>при анализе примера ниже оба объекта окажутся на одном уровне?<br/>
а) Пепси-кола очень вкусная, а кока-кола — самый лучший напиток на свете.<br/>
будет ли между ними какая-то разница?</blockquote><br/>
<br/>
для обоих объектов выдаётся позитивная тональность. А какая ожидается разница?<br/>
<br/>
Если пример переделать в: Пепси-кола очень вкусная, а кока-кола самый ужасный напиток на свете.<br/>
<br/>
то для пепси-кола получаем позитивную, а для кока-кола негативную тональности.<br/>
<br/>
<blockquote>если при анализе примера из моего прошлого комментария оценка у ВТБ оказывается нейтральная, это значит, что анализотор работает ошибочно. Есть ли у вас синтаксис? понимает ли парсер, что ветхое здание — это одна именная группа, не имеющая общего антецедента с ВТБ? </blockquote><br/>
<br/>
ошибочная для кого? Читайте комментарий выше: это пограничный случай, можно и так и эдак. Для одного клиента банка его ветхое здание не имеет роли, а для другого имеет. Поэтому здесь лучше даже выдавать MIXED (смешанную) метку тональности.<br/>
<br/>
Синтаксис есть. Антецеденты у «ветхого здания» и «ВТБ» разные, но это ведь не меняет ситуативной связи между ними: банк находится в ветхом здании, что в свою очередь влияет на тональность.]]></description>
      <pubDate>Mon, 13 Jul 2015 14:08:39 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>13.07.2015 13:22:15 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/262213/#comment_8496513</guid>
      <link>https://habr.com/ru/articles/262213/#comment_8496513</link>
      <description><![CDATA[<blockquote>не могу протестировать ваше API на примерах (платформа требует денег, регистрации, потом опять регистрации, потом опять денег).</blockquote><br/>
<br/>
денег совсем платить не нужно, чтобы потестировать. Нужно зарегистрироваться, выбрать BASIC план, указать кредитку (таковы требования mashape для Fremium API) и начать тестирование.<br/>
<br/>
<blockquote>участвовали ли вы в конкурсе сентимент-анализаторов на «Диалоге» в этом году?</blockquote><br/>
нет, в этом году, к сожалению не удалось, т.к. мы участвовали в другой дорожке и по другой теме.<br/>
<br/>
<blockquote>а) Был недавно в ВТБ. Он расположен в ветхом здании на улице 1 мая. Но сам банк очень хороший. </blockquote><br/>
<br/>
Сейчас система выдаёт нейтральный класс, потому что этот случай можно в некотором смысле считать пограничным: вроде бы и позитив («банк хороший»), но вроде бы и негатив («в ветхом здании»). В этом случае анафора никак не поможет разрешить данный конфликт. Что можно сделать в таком случае — это усилить вес последнего предложения текста. Есть такой подход при вычислении тональности, когда первому (первым) и последнему (последним) предложениям текста придаётся бОльший вес, т.к. как делается предположение, что основная информация содержится именно в них.]]></description>
      <pubDate>Mon, 13 Jul 2015 13:22:15 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>12.07.2015 09:21:08 </title>
      <guid isPermaLink="true">https://habr.com/ru/companies/meanotek/articles/262271/#comment_8495179</guid>
      <link>https://habr.com/ru/companies/meanotek/articles/262271/#comment_8495179</link>
      <description><![CDATA[Ссылка ведёт на наш сервис, видимо, не всегда что-то срабатывает. Скопировал на внешний ресурс:<br/>
<a href="http://pasteboard.co/1TPnkJqt.png">http://pasteboard.co/1TPnkJqt.png</a>]]></description>
      <pubDate>Sun, 12 Jul 2015 09:21:08 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>12.07.2015 07:56:14 </title>
      <guid isPermaLink="true">https://habr.com/ru/companies/meanotek/articles/262271/#comment_8495065</guid>
      <link>https://habr.com/ru/companies/meanotek/articles/262271/#comment_8495065</link>
      <description><![CDATA[Стало интересно посмотреть, как наш синтаксический анализатор разбирает предложения. Получилось, например:<br/>
<br/>
В комплекте помимо обычного ножа есть для пунктирной насечки.<br/>
<br/>
<img src="http://semanticanalyzer.info/SemanticGraphViz/dotgraph.php?text=%D0%92+%D0%BA%D0%BE%D0%BC%D0%BF%D0%BB%D0%B5%D0%BA%D1%82%D0%B5+%D0%BF%D0%BE%D0%BC%D0%B8%D0%BC%D0%BE+%D0%BE%D0%B1%D1%8B%D1%87%D0%BD%D0%BE%D0%B3%D0%BE+%D0%BD%D0%BE%D0%B6%D0%B0+%D0%B5%D1%81%D1%82%D1%8C+%D0%B4%D0%BB%D1%8F+%D0%BF%D1%83%D0%BD%D0%BA%D1%82%D0%B8%D1%80%D0%BD%D0%BE%D0%B9+%D0%BD%D0%B0%D1%81%D0%B5%D1%87%D0%BA%D0%B8.&amp;SubmitAnalise=Do+Syntactic%2FSemantic+Analysis" alt="image"/><br/>
<br/>
По идее, Ваш метод будет точнее, если скрестить его с анализатором, натренировав CRF на авто-разметке.]]></description>
      <pubDate>Sun, 12 Jul 2015 07:56:14 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>11.07.2015 06:29:31 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/262213/#comment_8494417</guid>
      <link>https://habr.com/ru/articles/262213/#comment_8494417</link>
      <description><![CDATA[<blockquote>Вы прямо так и конкатенируете JSON в прокадшен-коде (побежал писать твиты с большим количеством апострофов)? Любопытно, что в вашем примере после конкатенации валидный JSON вообще не получится: строки будут без кавычек. Это точно сработает?</blockquote><br/>
<br/>
Изначально текст и объект в примере были в апострофах, но перед публикацией я их зачем-то убрал. Поправил пост, спасибо. Пишите твиты, потестим :)<br/>
<br/>
<blockquote>Это работает на контенте уровня твитов? Что ваш движок скажет про, например, такой отзыв (случайно выбранный на Yandex.Market):</blockquote><br/>
<br/>
Лучше уровня твитов, коротких заметок вконтакте. Т.е. то, где есть явный «message», окрашенный эмоционально. На данный момент для Ваших таргет-объектов все метки выдаются позитивные. Мы работаем над улучшением качества для более длинных, чем твиты, текстов.]]></description>
      <pubDate>Sat, 11 Jul 2015 06:29:31 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>11.07.2015 06:23:43 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/262213/#comment_8494413</guid>
      <link>https://habr.com/ru/articles/262213/#comment_8494413</link>
      <description><![CDATA[У нас была одна собственная публикация на Диалоге 2012:<br/>
Kan D. Rule-based approach to sentiment analysis at ROMIP 2011. Komp’iuternaia Lingvistika i Intellektual’nye Tekhnologii: Trudy Mezhdunarodnoi Konferentsii “Dialog 2012″ // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialog 2012″. Bekasovo, 2012.<br/>
<br/>
где, в частности, показано качество 90% для позитивного класса. С тех пор мы подтянули и негативный класс.<br/>
<br/>
На самом деле, будучи пользователем таких систем, я бы не смотрел на декларируемое качество, а проверял конкретно для своего домена и своих текстов.]]></description>
      <pubDate>Sat, 11 Jul 2015 06:23:43 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>10.07.2015 20:12:46 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/262213/#comment_8494229</guid>
      <link>https://habr.com/ru/articles/262213/#comment_8494229</link>
      <description><![CDATA[Карта требуется для Freemium типов API. Если у вас есть необходимость проверить на бОльшем, чем 100 в день, количестве сообщений мы делаем разовые личные тарифные планы (пишите в личку или по почте dk[@]semanticanalyzer.info).<br/>
<br/>
Метод основан на собственном алгоритме shallow parsing с применением машинного обучения. Более подробно можно посмотреть в видео доклада: <a href="https://www.youtube.com/watch?v=0qfK713BVW4">www.youtube.com/watch?v=0qfK713BVW4</a><br/>
<br/>
Точность варьируется в зависимости от домена — от 60-70% до 90% и выше.<br/>
<br/>
Скорость высокая, среднее время на запрос (размера нескольких предложений) — 30-50 миллисекунд.]]></description>
      <pubDate>Fri, 10 Jul 2015 20:12:46 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

  
    <item>
      <title>10.07.2015 19:53:25 </title>
      <guid isPermaLink="true">https://habr.com/ru/articles/262213/#comment_8494215</guid>
      <link>https://habr.com/ru/articles/262213/#comment_8494215</link>
      <description><![CDATA[Карту требует платформа API mashape: выберите бесплатный тариф (100 сообщений в день = 3000 в месяц) и платить ничего не придётся.<br/>
<br/>
Мы используем mashape, чтобы не прикручивать собственный биллинг + ради инструментов мониторинга API.]]></description>
      <pubDate>Fri, 10 Jul 2015 19:53:25 GMT</pubDate>
      <dc:creator><![CDATA[]]></dc:creator>
    </item>
  

      

      

    
  </channel>
</rss>
