Как стать автором
Обновить
9
0

Ai, Data-science

Отправить сообщение

Улучшаем генеративных чатботов на нейросети ruGPT3: умный ранжировщик ответов

Время на прочтение16 мин
Количество просмотров6.3K

Нейронные сети все прочнее входят в нашу жизнь. В последнее время особую значимость приобретают исследования, связанные с обучением искусственных нейронных сетей в сфере анализа естественного языка (NLP, NLU) для создания реалистичных, человечных разговорных «скиллов». Одним из первых примеров «человечных» диалоговых решений стала Xiaoice от Microsoft, которая обладала навыками дружелюбности. Позже такие компании как Яндекс, Google [1], Mail.ru и другие выпустили на рынок своих голосовых помощников. Однако все они столкнулись с фундаментальной проблемой: их решения хорошо выполняют запросы пользователей, связанные с четкими командами («расскажи новости»), но совершенно не обладают человечными способностями, качествами характера, эмуляцией чувств, эмпатией и поэтому не способны поддерживать человеческий разговор на различные темы. При этом «видимость человечности» часто обеспечивается набором шаблонных фраз и шуток, подходящих практически в любой ситуации (неспецифичных контексту разговора).

В этой статье мы покажем, как устроен и как работает разработанный нами умный Ранжировщик ответов для нейросеток Трансформер и какой эффект он оказывает на качество разговора любых генеративных чатботов.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии11

Анализ Вконтакте на примере книжных предпочтений участников культурных сообществ

Время на прочтение7 мин
Количество просмотров59K

Рис.  3. – Книги каких авторов из рейтинга топ100 читают пользователи Вконтакте

Для всех диаграмм в статье есть интерактивные визуализации: graphgrail.com/gg-client/vk_books.html
К 2014 году потенциал традиционных подходов к развитию аналитики социальных процессов оказался исчерпан в силу нескольких причин, главная из которых – неспособность созданных в рамках данных подходов решений адаптироваться к изменившимся условиям формирования общественных законов. Речь идет об их недостаточной динамичности и неприспособленности для обработки данных, поступающих в больших объемах в режиме времени, близком к реальному. Но самый серьезный удар по классической аналитике нанес взрывной рост объемов неструктурированных данных. [1]
Читать дальше →
Всего голосов 32: ↑23 и ↓9+14
Комментарии71

Обработка естественного языка в задаче мониторинга предвыборной агитации

Время на прочтение13 мин
Количество просмотров9.1K
В данной статье мы рассмотрим процесс разработки методики контроля предвыборной агитации в Ростовском региональном сегменте Интернет-СМИ с использованием обработки естественного языка и машинного обучения.
Также я остановлюсь на особенностях и нюансах, ведь задача стояла довольно специализированная: необходимо было выделять агитацию, и, если она может нарушать закон — оперативно уведомлять Избирком. Забегая вперед скажу, что с задачей я успешно справился.

В задаче разработки методики контроля предвыборной агитации в Ростовском региональном сегменте Интернет-СМИ применяются наработки из нескольких смежных областей знаний:
  • автоматизированная обработка текстов (текстмайнинг),
  • обработка естественного языка,
  • машинное обучение.

Читать дальше →
Всего голосов 16: ↑9 и ↓7+2
Комментарии4

Эксперт ООН призвал мировое сообщество притормозить создание боевых роботов с искусственным интеллектом

Время на прочтение1 мин
Количество просмотров58K
В Совете ООН по правам человека предложили временно запретить производство боевых автономных роботов, способных самостоятельно принимать решение об уничтожении живых мишеней. Эксперты уверены, что если не сдерживать развитие подобных технологий, то через 30 лет стоит ожидать гибели множества людей от рук «немного сбившихся в один момент с программы роботов».

В четверг спецдокладчик ООН по вопросу о внесудебных казнях, казнях без надлежащего судебного разбирательства или произвольных казнях Кристоф Хайнс призвал ввести повсеместный мораторий на производство летальных автономных роботизированных систем (Lethal autonomous robotics – LARS).

«Есть шагающие роботы, в том числе двуногие, очень похожие на человека. Они могут взять обычную винтовку М-16 и убивать. Это уже реальность»
Читать дальше →
Всего голосов 57: ↑44 и ↓13+31
Комментарии85

Google запустил сервис передачи запахов онлайн

Время на прочтение1 мин
Количество просмотров76K

Поиск на новом уровне ощущений

Информация, затрагивающая ваши чувства: то, что раньше можно было выразить лишь словами, теперь доступно на уровне ощущений.
Ваш интернет-сомелье: примеры запахов дополнены искусно подобранными фотографиями и описаниями.
Мир обоняния: в Коллекции запахов Google хранится более 15 млн аромабайт информации.
Безопасный поиск: фильтрация неприятных запахов.

Google Нос Бета – это самые передовые на сегодняшний день технологии передачи обонятельных ощущений.
Специально оборудованные автомобили Google, записывающие Запах улиц в разных уголках мира.
Мобильное приложение Детектор запахов для последней версии операционной системы Android.
Читать дальше →
Всего голосов 70: ↑29 и ↓41-12
Комментарии25

Будущее майнинга биткоин на устройствах ASIC (рассуждение)

Время на прочтение3 мин
Количество просмотров147K
Наверняка вы уже слышали о грядущей революции в майнинге биткоинов: разработаны специальные чипы, способные радикально повысить его скорость: вместо в лучшем случае 700Мх на видеокарте можно получить 40-60 Гх и «зарабатывать» по $3000-4000 в месяц. Кто не слышал, вот один из пруфов bitcoinmagazine.com/working-avalon-asic-confirmed


Читать дальше →
Всего голосов 24: ↑9 и ↓15-6
Комментарии63

Визуализация графа социальной сети: анализ событий блогосферы перед декабрём 2011 года

Время на прочтение6 мин
Количество просмотров35K
Это логическое продолжение статьи "Построение графа социальной сети с помощью Drupal и Feeds"

Я в составе группы занимался собором информации из блогосферы. Задачей было оценить напряженность, активность политических дискуссий в период избирательной кампании выборов в Государственную Думу. Забегая вперед скажу, что исследование позволило выдвинуть гипотезы, которые позже подтвердились. В частности, по результатам, о которых вы прочтете ниже можно понять, кто же будет выходить на площади и выводить за собой людей. И главное, за кем они пойдут.
Читать дальше →
Всего голосов 46: ↑38 и ↓8+30
Комментарии16

Отзыв на книгу «Код Дурова» Н. Кононова

Время на прочтение3 мин
Количество просмотров44K
Disclaimer: может быть немного спойлеров, постараюсь это делать по минимуму.

Я в восхищении. Автору удалось добиться того, для чего пишутся такие книги — показать элитарность нового поколения предпринимателей. Однозначно точно: школьникам и студентам, вдруг оторвавшимся от Вконтакте и прочитавшим книгу захочется стать такими, как Дуров.
Понравился слог, очень похоже на стиль Пелевина. Постараюсь этот краткий обзор написать в таком же витиеватом стиле).
Читать дальше →
Всего голосов 146: ↑51 и ↓95-44
Комментарии60

Построение графа социальной сети с помощью Drupal и Feeds

Время на прочтение3 мин
Количество просмотров15K
В одном крупном университете на Юге России я разрабатываю программную платформу автоматизированного построения графа социальной сети при помощи обработки интернет страниц социальных сетей. В данной статье я расскажу, как мы обрабатывали данные, собранные из Живого журнала (Livejournal.com).
Прошел почти год, я думаю, будет интересно узнать, как система применялась для автоматизированного сбора данных в период избирательной кампании в Государственную думу в 2011 году.
Читать дальше →
Всего голосов 17: ↑10 и ↓7+3
Комментарии13

Информация

В рейтинге
Не участвует
Откуда
Россия
Зарегистрирован
Активность