Pull to refresh

В Москве пройдет хакатон по анализу текстов. Регистрация до 14 декабря

Reading time 2 min
Views 2.1K
Programming *Hackathon Artificial Intelligence Natural Language Processing *
Приглашаем всех 15 декабря принять участие в очном хакатоне по анализу данных «Новый Год hack 2019» в Москве в Научном парке МГУ.

Хакатон проводят компании Лаборатория Наносемантика и Контакт-центр «Гран» вместе с МФТИ и МГУ.

Под катом — описание задач, критериев оценки, условий участия и призы.

image
Читать дальше →
Total votes 7: ↑7 and ↓0 +7
Comments 5

Исследователи выяснили, что системы ИИ не различают предложения с перемешанными словами

Reading time 2 min
Views 3.5K
Machine learning *Artificial Intelligence

Исследователи из Обернского университета пришли к выводу, что многие ИИ, предназначенные для обработки естественного языка (Natural Language Processing, NLP), не замечают, когда слова в предложении перемешиваются, а его значение меняется. Это показывает, что ИИ на самом деле не понимают язык, и создает проблемы в обучении систем NLP.

Читать далее
Total votes 14: ↑13 and ↓1 +12
Comments 20

Авторы проекта GPT-Neo пытаются создать аналог GPT-3 с открытым исходным кодом

Reading time 2 min
Views 6.5K
Open source *Machine learning *Artificial Intelligence

В июне OpenAI презентовала модель машинного обучения GPT-3, обученную на 175 млрд параметров. Эта модель является одной из самых сложных. В отличие от предшественников GPT-2 и GPT-1 ее исходный код или обучающий набор данных решили не открывать. Теперь создатели проекта GPT-Neo от EleutherAI решили воссоздать аналог GPT-3.

Коммерческая лицензия на GPT-3 доступна только для Microsoft, которая инвестировала $1 млрд в OpenAI и построила суперкомпьютер на базе Azure, предназначенный для дальнейших исследований компании.

Было предпринято уже несколько попыток воссоздать GPT-3 с открытым исходным кодом. Однако нынешнюю можно назвать самой серьезной. Создатели GPT-Neo Коннор Лихи, Лео Гао и Сид Блэк собирают рядовых исследователей в области машинного обучения с открытым исходным кодом, чтобы начать проект не позднее августа.

GPT-Neo это кодовое название серии языковых моделей, основанных на преобразователях в стиле архитектуры GPT с открытым исходным кодом. У проекта есть кодовая база, построенная на Tensorflow-mesh (для обучения на TPU) и на Deepspeed (для обучения на GPU). Обе могут масштабироваться до размеров GPT-3, но проекту пока не хватает TPU для полного обучения модели со 175 млрд параметров.

Большую часть модели уже построили и обучили модели размера GPT-2, а также реализовали несколько экспериментальных архитектур. В настоящее время ведется работа над завершением репликации модели размера GPT-2.

Как отметили исследователи, самая большая модель, которую им приходилось тренировать для одного шага, включала 200 млрд параметров.

В октябре команда ученых из Мюнхенского университета Людвига-Максимилиана разработала методику глубокого обучения для моделей обработки естественного языка. Она обучила модель Transformer NLP с 223 млн параметров, которая превзошла GPT-3 более чем на 3% в тесте SuperGLUE.

А на днях в Google представили метод, который, по утверждению компании, позволил обучить языковую модель, содержащую более триллиона параметров. Исследователи заявили, что новая модель с 1,6 трлн параметров, по-видимому, является крупнейшей в своем классе на сегодняшний день.

Читать далее
Total votes 8: ↑8 and ↓0 +8
Comments 4

OpenAI: более 300 сторонних приложений работают на GPT-3

Reading time 2 min
Views 3.3K
Development of mobile applications *Machine learning *Artificial Intelligence Natural Language Processing *

OpenAI сообщила, что спустя девять месяцев после выпуска NLP-алгоритма GPT-3 его используют более 300 приложений. Модель генерирует, в среднем, 4,5 млрд слов в день.

Читать далее
Total votes 6: ↑6 and ↓0 +6
Comments 0

Разработчик натренировал модели OpenAI на интерпретацию человеческого языка в команды терминала

Reading time 1 min
Views 2.2K
Python *Development for Linux *Artificial Intelligence Natural Language Processing *Visual programming *

Разработчик представил базовую оболочку на Python, которая позволяет языковой модели OpenAI интерпретировать команды оболочки Linux bash и запускать задачи. Однако проверять запуск команд перед запуском нужно вручную.

Читать далее
Total votes 12: ↑12 and ↓0 +12
Comments 1

OpenAI и Microsoft организовали фонд на $ 100 млн для инвестиций в стартапы ИИ

Reading time 2 min
Views 1.2K
Venture investment Start-up development Finance in IT

OpenAI запускает стартап-фонд Startup Fund на $ 100 млн, через который компания и ее партнеры будут инвестировать в разработку технологий на ИИ, решающих основные проблемы и способствующие повышению производительности. Первым партнером и инвестором фонда стала Microsoft.

Читать далее
Total votes 12: ↑12 and ↓0 +12
Comments 5

В Китае представили нейросеть Wu Dao с 1,75 трлн параметров

Reading time 2 min
Views 9.6K
Machine learning *Artificial Intelligence

Исследователи из Пекинской академии искусственного интеллекта объявили о выпуске собственной генеративной модели глубокого обучения, Wu Dao, которая способна конкурировать и даже превзойти GPT-3 от OpenAI.

Читать далее
Total votes 23: ↑23 and ↓0 +23
Comments 0

Участники эксперимента не смогли отличить GPT-3 от реального философа

Reading time 3 min
Views 2.8K
Machine learning *Artificial Intelligence Natural Language Processing *

Профессор философии Калифорнийского университета в Риверсайде Эрик Швитцгебель, философы Анна Штрассер и Мэтью Кросби провели эксперимент, в ходе которого испытуемых попросили определить, какие ответы на философские вопросы принадлежали их коллеге Дэниелу Деннету, а какие — генератору речи GPT-3. 

Читать далее
Total votes 3: ↑3 and ↓0 +3
Comments 3

OpenAI открыла код системы распознавания речи Whisper

Reading time 2 min
Views 3.3K
Open source *Machine learning *Artificial Intelligence Sound Natural Language Processing *

OpenAI опубликовала исходный код системы распознавания речи Whisper. Открыты код эталонной реализации на базе фреймворка PyTorch и набор уже обученных моделей для использования под лицензией MIT.

Читать далее
Total votes 4: ↑4 and ↓0 +4
Comments 4

Новый запуск курса Natural Language Processing

Reading time 2 min
Views 728
Open Data Science corporate blog Machine learning *Artificial Intelligence Natural Language Processing *

TL;DR: Этой весной сообщество Open Data Science и компания Huawei делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.

Читать далее
Total votes 11: ↑11 and ↓0 +11
Comments 0

Bloomberg выпустило чат-бота для финансового рынка BloombergGPT

Reading time 2 min
Views 2.1K
Machine learning *Media management *Artificial Intelligence Finance in IT

Агентство Bloomberg представило чат-бота BloombergGPT. Это большая языковая модель с 50 млрд параметров, созданная для финансового рынка. Модель обучена работе с широким спектром данных и поддерживает выполнение разнообразных задач обработки естественного языка в финансовой отрасли.

Читать далее
Total votes 8: ↑8 and ↓0 +8
Comments 1

Учёные описали алгоритм автоматического анализа текстов Толкина на основе ИИ

Reading time 3 min
Views 1.3K
Popular science Artificial Intelligence IT-companies

Старший научный сотрудник института искусственного интеллекта AIRI Илья Макаров и выпускница ВШЭ Анастасия Ященко описали алгоритм автоматического анализа литературных произведений на основе ИИ. Исследователи проанализировали системы персонажей книг Джона Рональда Руэла Толкина.

Читать далее
Total votes 11: ↑10 and ↓1 +9
Comments 0

Музыканты хотят извлечь музыку из мозга

Reading time 2 min
Views 973
Lumber room
Факт воздействия музыки на мозг хорошо известно и давно изучается. Сами музыканты, пожалуй, лучше других знают о необычайной силе такого воздействия. Под влиянием музыкальных ритмов человек может успокоиться или возбудиться, получить вдохновение или впасть в подавленное состояние. Из-за музыки сильно меняется характер мозговых волн, которые улавливает специальная аппаратура.
Читать дальше →
Total votes 15: ↑13 and ↓2 +11
Comments 3

Рефрейминг как методика изменения убеждений

Reading time 2 min
Views 3.3K
Lumber room
Формирование отношения с помощью фреймов

В НЛП есть такое понятие, как фрейм (англ. рамка). С его помощью мы можем формировать нужное нам отношение к любой информации. Незаменимый прием в PRе, рекламе, продажах, да и ввообще в любом убеждении людей.

Фрейм, это рамка (или фон), в которой воспринимается информация. Фреймом является дополнительная информация, дающаяся параллельно или перед основной информацией, и задающая логические или эмоциональные рамки ее восприятия для формирования определенного отношения.

Самый простой — визуальный фрейм. Представьте себе фотографию неизвестного вам лица. А теперь давайте поместим ее в розовую рамочку в форме сердечка. Даже если мы впервые видим эту фото, что мы можем подумать об этом человеке? А теперь представьте эту же фотографию на доске почета… в рубрике «Их разыскивает милиция»… :) Или в большой картинной раме, метр на метр, висящей посреди стены в зале для торжеств… Как мы начинаем воспринимать этого человека теперь?

В зависимости от того, что мы делаем с рамкой, мы заставляем воспринимать эту фотографию в том или ином ключе, и относиться к ней соответствующе. Это были нарочито буквальные примеры, имеющие больше цель иллюстрирующую фреймы. В жизни, кончено, все более завуалированно. Примерно так…

Предвыборная компания. Штаб. Политтехнологи, раскручивающие своего кандидата в народолюбцы. Готовятся к размещению в СМИ фотографии этого кандидата: одна, где кандидат общается с радостными студентами с улыбающимися лицами, другая, где он рядом с хорошо одетыми стариками выражающими почтение в глазах, третья — на фоне шикарного города с чистыми улицами, красивыми женщинами и дорогими машинами под голубым солнечным небом… Пять-десять разных фотографий с одним и тем же человеком, у которых есть что-то общее… что-то неуловимое сознанию, но приятное глазу и милое сердцу :)

Так создаются визуальные фреймы, формирующие нужное нам отношение к субьекту на бессознательном уровне. Но самое интересное начинается, когда мы подходим к вербальным (речевым) фреймам…

Представьте себе рекламную статью, которая начинается так: «Самые теплые куртки делает фирма Х! Такая морозоустойчивость обеспечивается...(далее сама статья)». Насколько вам интересна эта статья, если вы живете в среденей полосе? Скажем, «ну так...». А теперь давайте добавим в начало статьи одно предложение: «В этом году синоптики обещают особенно холодную зиму. Самые теплые куртки делает фирма Х! Такая морозоустойчивость обеспечивается...». Как на этот раз? Тема стала актуальной, а все что мы для этого сделали, это добавили фрейм контекста — «особенно холодную зиму», который на секундочку перенс читателя в те условия, где это важно.

Помимо контекстуальных фреймов, еще бывают эмоциональные фреймы. Самый забавный пример использования эмоционалного фрейма мне вчера прислали по почте. Спасибо большое Сергею, пример такой, что не могу не поделиться! Публикую прямо в исходном виде.


Взято отсюда.
Total votes 22: ↑8 and ↓14 -6
Comments 17

Глазные ключи доступа (eye accessing cues)

Reading time 3 min
Views 3.5K
Lumber room
Каждый из вас хотя бы изредка обращает внимание что собеседник в ходе разговора отводит глаза в сторону. Направление взгляда меняется в зависимости от темы разговора, отношению к вам, состояния, да и самой личности собеседника.

В терминах НЛП это называется глазные ключи доступа (eye accessing cues)

Дабы не ждать ближайшего разговора с человеком чтобы обратить своё внимание на направления взгляда собеседника воспользуемся конкурсной работой Michael Simon Toon «Thought Moments» для BritishFilms. Не могу представить примера, более наглядного, чем этот



Автор ролика использует следующие ключи:
IMAGINATION — воображение MEMORY — память
EXPRESSION — выражение LANGUAGE — язык
EMOTION — эмоции LOGIC — логика
Читать дальше →
Total votes 32: ↑22 and ↓10 +12
Comments 20

Как правильно говорить с «трудным» клиентом

Reading time 3 min
Views 61K
GTD *
Многим из нас время от времени попадаются «привередливые», «неадекватные» и «трудные» заказчики, партнёры, начальники, подчинённые и т.д. В этом посте я расскажу:
  • Как добиться своего в конфликтных ситуациях
  • Как вести разговор, не вызывая негативной реакции собеседника
  • Как держать конфликтную ситуацию под контролем
  • Как не допустить развития конфликта и как его устранить
Читать дальше →
Total votes 96: ↑87 and ↓9 +78
Comments 81

Гибридная реализация русской морфологии

Reading time 3 min
Views 1.7K
Lumber room
При создание поисковых решение одним из первых с чем приходиться сталкивать разработчику это предварительная обработка текста. Разбивка на термины, фильтрация стоп слов. Важной операцией влияющей на качество поиска на данном этапе является приведение слов к нормальной форме. Ниже приведены основные подходы к этой проблеме.
Читать дальше →
Total votes 17: ↑15 and ↓2 +13
Comments 4

Заметки об NLP (часть 1)

Reading time 5 min
Views 15K
Artificial Intelligence Natural Language Processing *
В преддверии Нового года решил начать небольшой цикл статей, посвящённых наиболее интересующему меня лично направлению в обработке текстов на естественном языке. (То есть NLP в заголовке означает natural language processing — ваш К.О.) Синтаксический анализ, семантика, машинный перевод, поиск смысла слова в контексте — в общем, вся радость компьютерного лингвиста :)

Наверно, сразу имеет смысл определиться с уровнем изложения. Я сам пытаюсь заниматься компьютерной лингвистикой (с переменными успехами). Постараюсь рассказать о том, что конкретно волнует, чего уже можно, чего пока нельзя, и над чем как раз сейчас надо работать. Быть может, эти статьи помогут мне самому отструктурировать информацию в голове и опираться на уже готовую структуру в новом году. А если у читателей появятся свои идеи или мысли о сотрудничестве — ещё лучше.
Интересующихся прошу под кат
Total votes 67: ↑57 and ↓10 +47
Comments 54