Как стать автором
Поиск
Написать публикацию
Обновить
1142.46

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Заметки об NLP (часть 10)

Время на прочтение9 мин
Количество просмотров8.4K
(Первые части: 1 2 3 4 5 6 7 8 9). Как говорилось в известной рекламе, «вы не ждали, а мы пришли» :)

За время, прошедшее после публикации девятой части, я прочитал одну хорошую книжку по теме (в to-read списке ещё парочка), множество статей, а также пообщался с несколькими специалистами. Соответственно, накопился новый объём материала, заслуживающий отдельной заметки. Как обычно, знакомлю других, параллельно структурирую знания для себя.

Сразу прошу прощения: эта часть для чтения и понимания достаточно трудна. Ну да, как говорится, не всё коту масленица. Сложным задачам соответствуют сложные тексты :)
Читать дальше →

Синтезируем панацею. Вместе

Время на прочтение2 мин
Количество просмотров735
Внимание! В тексте статьи нет ответов на поставленные вопросы, потому призываю в комментарии Коллективный Разум!

… Получив новое сообщение от своей знакомой, я немного удивился — мы редко общаемся. Открыв его, я удивился еще больше:
Привет! Как у тебя делишки? Я заболела, температура 39, выйти никуда не могу, даже не знаю можно ли к тебе обратиться с такой просьбой. Сходи сейчас пожалуйста, купи карточку пополнения счета на Киевстар на 100 гривен, вернись и сразу напиши мне сюда код пополнения, а то у меня на счету 0 — никакой связи… у меня очень высокая температура, деньги отдам в понедельник, поможешь?
Читать дальше →

Заметки об NLP (часть 9)

Время на прочтение7 мин
Количество просмотров5.6K
(Первые части: 1 2 3 4 5 6 7 8). Да возрадуются минусующие, сегодня представляю вниманию читателей последнюю, по всей видимости, часть «Заметок». Как и предполагалось, мы поговорим о дальнейшем семантическом анализе; также я порассуждаюю немного о том, чем в принципе можно заняться в нашей области и какие есть трудности «научно-политического» характера.
Читать дальше →

Заметки об NLP (часть 8)

Время на прочтение5 мин
Количество просмотров3.5K
(Первые части: 1 2 3 4 5 6 7). В этой части я расскажу о синтактико-семантическом анализаторе — как я его вижу. Обратите, кстати, внимание на часть 7 — она до главной страницы не добралась, так что не уверен, что все интересующиеся её видели.
Читать дальше →

Заметки об NLP (часть 7)

Время на прочтение6 мин
Количество просмотров4.3K
(Первые части: 1 2 3 4 5 6). Как и обещал вчера, продолжаем обсуждать XDG и движемся к следующим темам. Возможно, мы двигаемся слишком быстро, и действительно имело бы смысл публиковать одну статью раз в два-три дня, чтобы оставалось время всё обсудить. Но, наверно, пока «бензин есть», я буду продолжать писать. А потом можно будет вернуться и обговорить ранее освещённые вопросы. Мне кажется, что в компьютерной лингвистике разные темы настолько тесно связаны друг с другом, что разговор об одной из них без связи с другими малопродуктивен. А мы ещё не обо всём беседовали, так что лучше охватить взглядом как можно больше аспектов компьютерного анализа текста, а потом уже рассуждать о конкретике в рамках общей картины происходящего.
Читать дальше →

Заметки об NLP (часть 6)

Время на прочтение6 мин
Количество просмотров3.7K
(Первые части: 1 2 3 4 5). Надеюсь, разговор о естественном языке читателей ещё не утомил! По-моему, тематика действительно интересная (хотя популярность топиков явно идёт на убыль :) ). Что ж, посмотрим, на сколько частей меня ещё хватит. Думаю, экватор мы уже прошли, но три-четыре темы затронуть ещё можно.

На сей раз заметка полностью посвящена проекту XDG/XDK, который я пытаюсь изучать на досуге. Назвать себя специалистом по XDG пока ещё не могу. Но потихоньку двигаюсь.
Читать дальше →

Заметки об NLP (часть 5)

Время на прочтение5 мин
Количество просмотров6.6K
Что ж, продолжим. (Первые части: 1 2 3 4). Долго выбирал, что будет лучше для следующей темы — пофилософствовать о прагматике языка или поговорить конкретно об алгоритмах разбора. Учитывая, что предыдущая часть была неформальной, решил всё-таки переключиться на конкретику, а там посмотрим.

Итак, синтаксический анализ предложения. Давайте сразу определимся, что речь пойдёт о разборе в рамках концепции dependency parsing, причём определяющей методологией разбора будет точный анализ (не статистический). Начнём с небольшого обзора происходящего вокруг.
Читать дальше →

Заметки об NLP (часть 4)

Время на прочтение5 мин
Количество просмотров4.8K
(Начало: 1, 2, 3) На сей раз хочу немного отвлечься и порассуждать (а точнее, похоливарить) на тему статистических алгоритмов и вообще «обходных путей» компьютерной лингвистики.
В первых частях нашего разговора речь шла о «классическом пути» анализа текста — от слов к предложениям, от предложений к связному тексту. Но в наше безумное время появились и соблазны решить проблему «одним махом», найдя, если угодно, баг в системе или «царскую дорогу».
Читать дальше →

Заметки об NLP (часть 3)

Время на прочтение5 мин
Количество просмотров10K
(Начало: 1, 2) Что ж, подходим к самому интересному — разбору предложений. Тема эта многогранна и многоуровнева, так что подступиться к ней не очень просто. Но ведь трудности лишь закаляют :) Да и выходные, текст пишется легко…

Начнём с такого понятия, как синтаксический анализ предложений (по-английски parsing). Суть этого процесса состоит в построении графа, «каким-либо образом» отражающего структуру предложения.
Читать дальше →

Заметки об NLP (часть 2)

Время на прочтение4 мин
Количество просмотров6K
Хотя в первой части я и говорил, что не собираюсь останавливаться на морфологии, видимо, совсем без неё не получится. Всё-таки обработка предложений сильно завязана на предшествующий морфологический анализ.
Читать дальше →

Заметки об NLP (часть 1)

Время на прочтение5 мин
Количество просмотров16K
В преддверии Нового года решил начать небольшой цикл статей, посвящённых наиболее интересующему меня лично направлению в обработке текстов на естественном языке. (То есть NLP в заголовке означает natural language processing — ваш К.О.) Синтаксический анализ, семантика, машинный перевод, поиск смысла слова в контексте — в общем, вся радость компьютерного лингвиста :)

Наверно, сразу имеет смысл определиться с уровнем изложения. Я сам пытаюсь заниматься компьютерной лингвистикой (с переменными успехами). Постараюсь рассказать о том, что конкретно волнует, чего уже можно, чего пока нельзя, и над чем как раз сейчас надо работать. Быть может, эти статьи помогут мне самому отструктурировать информацию в голове и опираться на уже готовую структуру в новом году. А если у читателей появятся свои идеи или мысли о сотрудничестве — ещё лучше.
Интересующихся прошу под кат

О сознании и искуственном интеллекте

Время на прочтение3 мин
Количество просмотров10K
Тема обретения искусственным интеллектом сознания стала фактически общим местом современной фантастической литературы и кинематографа (достаточно упомянуть Азимова, «Терминатора», «Призрак в доспехах» et cetera ad infinitum). Меж тем мало кто из фантастов задумывался над тем, что же такое сознание, как возникло сознание у человека и каким образом ИИ может это самое сознание обрести.
В данном эссе нам хотелось бы обратить внимание на одно очень интересное (и, на наш взгляд, весьма правдоподобное) определение упомянутого феномена, которое дал не фантаст и не философ, а ученый-эволюционист Ричард Докинз в своей книге "Эгоистичный ген".
И что же там?

Алгоритм робота Маришко

Время на прочтение3 мин
Количество просмотров17K
6 лет своей жизни я потратил на изучение искусственного интеллекта. Результат моих исследований выразился в незаконченном проекте marishko.com. Я пытался разработать систему человеческого общения, не требующую специально обученного учителя, а способную обучаться автономно как маленький ребёнок.

В этой статье я хочу поделиться некоторыми используемыми мною алгоритмами и идеями.

Сразу скажу, что в своих исследованиях я больше опирался на природу интуиции как основу интеллекта, поэтому мои мысли далеки от математических алгоритмов.

image

Читать дальше →

Ближайшие события

IBM выпускает кота из мешка

Время на прочтение1 мин
Количество просмотров4.4K
Вчера на конференции Supercomputing 2009 сотрудники компании IBM представили результаты моделирования мозга, состоящего из более чем одного миллиарда нейронов (и 8.8 триллионов (!) синапсов).
Это больше, чем мозг кошки (отсюда и название статьи «The Cat is Out of the Bag: Cortical Simulations with 109 Neurons, 1013 Synapses») и составляет примерно 4% человеческого мозга.
Для моделирования использовался Blue Gene/P DAWN с 147,456 процессорами и 144 TB оперативной памяти, но даже он не позволяет проводить вычисления в реальном времени, поэтому для моделирования одной секунды физического времени требовалось примерно 1.5 минуты расчетов.
Тем мне менее, как прогнозируют авторы этой модели, к 2019 году самый быстрый компьютер на Земле сможет моделировать работу человеческого мозга в реальном времени. Для этого потребуется около 10 Петабайт оперативной памяти и производительность свыше 1 EFLOPS.
Предполагается, что такое моделирование «снизу-вверх» (от простейших элементов к общей системе) позволит разобраться в том, как работает человеческий мозг, что же такое мышление и разум и как они возникают.

Стоит ли говорить, что финансируется проект все той же DARPA, которая, в частности, платит деньги Boston Dynamics.

via

Этика роботов — можно ли убить одного, чтобы спасти пятерых?

Время на прочтение3 мин
Количество просмотров21K
Я хотел рассказать об интересном эксперименте ученых, которые попытались запрограммировать культурные императивы морали человека в память роботов с целью проверить смогут ли они вести себя также как люди при принятии решений. Отмечу, что опыты довольно жестокие, однако, по другому оценить возможности искусственного интеллекта ученым представилось невозможным. Сегодня роботы разрабатываются для того, чтобы существовать автономно, без вмешательства человека. Как сделать так, чтобы полностью автономная машина – могла действовать в соответствии с моралью и этикой человека?
Читать дальше →

Мухи, математика… Роботы?

Время на прочтение3 мин
Количество просмотров4.4K
image

Формализуя активность клеток мозга мухи, задействованных в зрительных процессах, ученые нашли новый способ извлечения траекторий движения из необработанных визуальных данных.
Читать дальше →

Применение нейросетей в распознавании изображений

Время на прочтение10 мин
Количество просмотров244K
Про нейронные сети, как один из инструментов решения трудноформализуемых задач уже было сказано достаточно много. И здесь, на хабре, было показано, как эти сети применять для распознавания изображений, применительно к задаче взлома капчи. Однако, типов нейросетей существует довольно много. И так ли хороша классическая полносвязная нейронная сеть (ПНС) для задачи распознавания (классификации) изображений?
Читать дальше →

Maltego. Нароет все

Время на прочтение2 мин
Количество просмотров57K
image

Вчера, просматривая очередную сборку live-дистрибутива BackTrack, наткнулся на очень интересную и довольно таки, как оказалось потом, полезную софтину. Многие из нас часто сталкивались с проблемой поиска информации касательно определенной организации, а именно конкретный данных: начиная с общего описания деятельности и заканчивая личными телефонами сотрудников. Как инструмент использовали популярные поисковые машины(играясь с языком запросов для более результативного поиска), различные общедоступные базы данных(телефонный базы, whois и т.д.).

Хотелось найти что-то, что могло само осуществлять «умный», узкоспециализированный поиск, разделять(по критериям и типу) и сортировать информацию и главное — указывать взаимосвязи.
Именно для эти целей и появился на свет инструмент под названием Maltego, разработка южноафриканской компании Paterva.

Читать дальше →

Тест Тьюринга

Время на прочтение4 мин
Количество просмотров116K
Итак сегодня мы поговорим о самом известном тесте для оценки говорящего бота — это тест Тьюринга.
Тьюринг
Тест Тьюринга — эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум» (англ. Computing Machinery and Intelligence), опубликованной в 1950 году в философском журнале «Mind». Тьюринг задался целью определить, может ли машина мыслить.
Стандартное звучание закона: «Если компьютер может работать так, что человек не в состоянии определить, с кем он общается — с другим человеком или с машиной, — считается, что он прошел тест Тьюринга»
Читать дальше →

Победитель Mario AI Competition

Время на прочтение1 мин
Количество просмотров2.6K


О самом Mario AI Competition на Хабре уже писали. Предлагаю посмотреть видео победителя обоих этапов соревнований Робина Баумгартена. Видео записано в замедленном действии, чтобы можно было лучше увидеть как алгоритм работает.

Более подробную информацию и исходники можно найти на сайте автора.