Pull to refresh
6
0
Павел Пасечник @flourait

User

Send message

Латентно-семантический анализ и искусственный интеллект (ЛСА и ИИ)

Reading time5 min
Views23K
Этот пост хотелось бы написать скорее в философском ключе, нежели в математическом (точнее алгебраическом): не что это за страшный зверь — ЛСА, а какая от него может быть польза «нашему колхозу», т.е. ИИ.

Ни для кого уже не секрет, что ИИ состоит из многих взаимонепересекающихся или слабо пересекающихся областей: распознавание образов, распознавание речи, реализации моторных функций в пространстве и пр. Но одной из главных целей ИИ – научить «железо» думать, что включает в себя не только процессы понимания, но и генерирование новой информации: свободного или творческого мышления. В связи с этим возникают вопросы не столько разработки методов обучения систем, сколько осмысления процессов мышления, возможности их реализации.

На основах работы ЛСА, как уже упоминалось в начале статьи, я не буду сейчас останавливаться (планирую в следующем посте), а пока отошлю к Википедии, лучше даже английской (LSA). А вот основную идею этого метода постараюсь изложить на словах.

Формально:
ЛСА используется для выявления латентных (скрытых) ассоциативно-семантических связей между термами (словами, н-граммами) путем сокращения факторного пространства термы-на-документы. Термами могут выступать как слова, так и их комбинации, т.наз. н-граммы, документами – в идеале: наборы тематически однородных текстов, либо просто любой желательно объемный текст (несколько млн. словоформ), произвольно разбитый на куски, например абзацы.

«На пальцах»:
Основная идея латентно-семантического анализа состоит в следующем: если в исходном вероятностном пространстве, состоящим из векторов слов (вектор = предложение, абзац, документ и т.п.), между двумя любыми словами из двух разных векторов может не наблюдаться никакой зависимости, то после некоторого алгебраического преобразования данного векторного пространства эта зависимость может появиться, причем величина этой зависимости будет определять силу ассоциативно-семантической связи между этими двумя словами.

Например, рассмотрим два простых сообщения из разных источников (просто пример для наглядности):
Читать дальше →
Total votes 21: ↑17 and ↓4+13
Comments8

Исследование подтвердило положительное влияние интернет-пиратства на продажи аниме

Reading time2 min
Views4.3K
imageИменитая комиссия экспертов в области экономики, работающая на Японское правительство, опубликовала исследование, которое утверждает, что интернет-пиратство способствует легальным продажам DVD-дисков. Этот вывод противоречит убеждениям представителей развлекательной индустрии, которые в свою очередь утверждают, что незаконные закачки ведут к финансовым ущербам в размере миллиардов долларов по всему миру. Целесообразность увеличения антипиратских мер со стороны представителей аниме-индустрии тоже попадает под сомнение.
Читать дальше →
Total votes 94: ↑83 and ↓11+72
Comments124

Изображаем память с помощью тетрадки в клеточку

Reading time5 min
Views4.5K
Где-то в архивах этого блога можно найти статью про тетрадь в клеточку и ее душевные переживания. Содержание у этой статьи скорее философское, чем прикладное. Но вот сама идея изобразить работу мозга с помощью карандаша и тетради в клеточку показалась мне довольно интересной. Как заметил автор той статьи, работу любой программы можно изобразить на бумаге. Будь то стек вызовов или регистры процессора – их легко можно изобразить с помощью клеточек.

Но это все низкоуровневые процессы. Возможность изобразить их на бумаге скорее теоретическая. На практике от нее мало пользы. Вот если бы можно было с такой же легкостью описывать более высокоуровневые процессы…
Читать дальше →
Total votes 67: ↑55 and ↓12+43
Comments29

История Искусственного Интеллекта, часть 2. Нейросетевой ИИ — неизбежно или невозможно?

Reading time6 min
Views9.8K
Когда я еще только задумывал писать эту статью, я знал о нейросетях только то, что они вроде как копируют процесс мышления нашего мозга. Я и не подозревал, как я тогда ошибался.
В то время, когда кибернетики еще только начинали играть в свои игрушки, другие более серьезные ученые, работали над более серьезной проблемой. На основании нейрофизиологических данных о строении нейронов, клеток нашего мозга, они пытались воссоздать их структуру. Это было за несколько лет, до того самого семинара, где впервые заговорили об ИИ.
Читать дальше →
Total votes 32: ↑28 and ↓4+24
Comments84

История Искусственного Интеллекта, часть 1. Картина без художника.

Reading time6 min
Views15K
Интерес к этой области появился у меня спонтанно. После этого стали появляться все больше и больше идей на эту тему, так что пришлось все это упорядочить. Начать я решил с истории развития Искусственного Интеллекта. Статья получилась довольно-таки большой, так что я разделил ее на две части. Вот первая ее часть, посвященная кибернетике.

Читать дальше →
Total votes 26: ↑24 and ↓2+22
Comments61

Несколько нестандартных способов использования Dropbox

Reading time2 min
Views6.5K
Есть большое множество способов использования Dropbox. Dropbox изначально предназначался для бекапа и шаринга файлов, но в дальнейшем пользователи начали находить новые области применения данного сервиса. Вот некоторые из них, о которых вы, возможно, еще не знаете.

Dropbox
Читать дальше →
Total votes 148: ↑99 and ↓49+50
Comments110

Распознавание цифры по 4 точкам

Reading time2 min
Views3.8K
Хочу поделиться, как я реализовал распознавание цифр без использования OCR библиотек на Delphi. Нужно было быстро и точно вытащить число из прямоугольника, размером 70 на 10 пикселей.
Читать дальше →
Total votes 79: ↑56 and ↓23+33
Comments17

Как накосячить с типографией: подборка работающих способов

Reading time7 min
Views119K

Тут наверняка есть косяки, просто мы ещё не открыли коробку

За три года нас с коллегами сотни раз било по голове ручкой от грабель при работе с типографиями. Мы списывали целые контейнеры криво напечатанной упаковки для игр, переделывали в авральном порядке тиражи, отправляли назад брак, который нам пытались выдать за нормальную печать, и натыкались на банальное кидалово.

Поначалу может показаться, что типографии — это специальные ловушки для тех, кто не умеет правильно формулировать задание, читать договор и проверять тираж. Позже, через несколько сорванных сроков и битых тиражей, приходит понимание каких-то основ.
Читать дальше →
Total votes 158: ↑155 and ↓3+152
Comments104

Подробное руководство по установке Android-x86

Reading time3 min
Views249K
Эмулятор который идет в комплекте с Android SDK, не очень шустрый.
Основная идея использовать VirtualBox + Android X86, для преодоления проблем с производительностью.

Что нам необходимо:
Среда разработки Eclipse + Android SDK тут,
а также VirtualBox.

Под катом много картинок, и процесс установки, а также некоторые полезные советы.
Читать дальше →
Total votes 117: ↑109 and ↓8+101
Comments32

Первый блин комом, или Как начать писать под Android и не бросить

Reading time3 min
Views50K
На написание статьи вдохновили несколько жалоб на разных ресурсах о том, что во время написания или установки sdk что-то не получалось или что-то повисло и поэтому «забил на Android». Действительно, человек, который хочет заняться разработкой под эту платформу, может потеряться в обилии статей и мануалов о том, как написать свое первое «Hello, Adroid» или как сделать конкретное приложение, особенно если недостаточно опыта в программировании. В этой статье я попробую охватить по возможности все способы, которые помогут в процессе самообучения и не дадут потерять энтузиазм из-за появившихся трудностей. Надеюсь, эта статья поможет сэкономить начинающим время и нервы.

Тех, кому этого ресурса достаточно, данная статья вряд-ли заинтересует.

Установка и настройка инструментов для разработки хорошо описана в Android Development Tutorial, поэтому это я могу пропустить.

Где тестировать свое приложение


Сначала нужно определиться, на что устанавливать и где тестировать свой проект. Можно ставить на эмулятор, как это описано в выше указанной статье. Как многие замечают, работает он очень медленно. К тому же, частое заблуждение – перед запуском приложения новички закрывают каждый раз эмулятор и снова его запускают. Этого делать не надо.
Другой способ — можно установить на VirtualBox Android-x86.
Но настоящий девайс рано или поздно понадобится – хотя бы по той причине, что писать приложения, где задействована камера или видео, или очень неудобно, или просто невозможно. Поэтому, если есть возможность приобрести устройство с Android – лучше использовать его. Я ставлю на свой HTC Wildfire, не смотря на то, что в нем появляется ненужный хлам, но я экономлю свое время (и нервы).

Какую литературу использовать

Читать дальше →
Total votes 66: ↑42 and ↓24+18
Comments12

Mozilla объявила о намерении создать собственную мобильную web ОС

Reading time1 min
Views847


Представители Mozilla сегодня сообщили о начале работ по превращению движка Gecko, на основе которого работает браузер Mozilla Firefox, в открытую операционную систему, которая предназначена для работы на мобильных телефонах и планшетных компьтерах. Будущая операционная система уже даже получила название — Boot to Gecko, а ее код будет выкладываться в общий доступ в режиме реального времени. Во всяком случае, именно это пообещал сделать Андреас Гал (Andreas Gal), представитель Mozilla.

Читать дальше →
Total votes 41: ↑33 and ↓8+25
Comments90

Почему, всё-таки, IE9 для XP не будет?

Reading time2 min
Views60K
Официальный ответ на этот вопрос с сайта IE9 Platform Preview:
Q. Does Platform Preview run on Windows XP?
A. No. Internet Explorer 9’s GPU-powered graphics take advantage of new technologies available in Windows 7 and back-ported only to Windows Vista. These technologies depend on advancements in the display driver model introduced first in Windows Vista.

По-русски:
В: Работает ли Platform Preview на Windows XP?
О: Нет. В IE9 используется аппаратное ускорение графики средствами видеокарты, которое использует новые технологии, доступные только в Windows 7 и портированные только в Vista. Эти технологии зависят от улучшений в модели драйверов, впервые применных в Vista.

Данное объяснение с самого начала казалось мне несколько сомнительным. Давайте разберемся.
Читать дальше →
Total votes 49: ↑26 and ↓23+3
Comments46

Автоответчик на звонки в Skype на Python

Reading time4 min
Views11K
Привет! Данный топик будет посвящен написанию автоответчика для Skype, который будет принимать за вас звонки, проигрывать приветствие и записывать ответ.
Читать дальше →
Total votes 75: ↑73 and ↓2+71
Comments20

Chrome 9: Прорыв в скорости, поддержке 3D и веб приложений

Reading time2 min
Views1.3K
Сегодня, с выходом 9-й версии браузера Google Chrome, мы рады представить новые функции, ранее присутствовавшие только в бета версиях. Эти функции включают поддержку WebGL, Живой поиск и Магазин приложений Chrome.
Читать дальше →
Total votes 69: ↑54 and ↓15+39
Comments90

CSS3 сейчас — анимация, прозрачность и многое другое (часть 2)

Reading time3 min
Views48K
Продолжая цикл статей «CSS3 сейчас!» (Первая статья — CSS Transitions), хотелось бы рассказать об анимации средствами CSS3, а конкретно — @keyframe и animate. Так же, в статье мы затронем свойства opacity и цветовую модель rgba(), кроссбраузерное использование border-radius, box-shadow и градиентов.

Читать дальше →
Total votes 61: ↑56 and ↓5+51
Comments41

CSS3 сейчас — transition

Reading time3 min
Views263K
CSS3 и HTML5 развиваются всё быстрее и быстрее, браузеры начинают поддерживать всё больше новых фишек и плюшек. В связи с этим, мне хотелось бы заглянуть в наш будущий рай верстальщиков и сделать цикл обзорных статей по новым плюшкам и фишкам этих технологий.
В этом цикле мне хотелось бы рассмотреть такие свойства CSS3, как transition, animate, opacity и модель rgba().

Использование CSS3.


Часто можно услышать от многих веб-дизайнеров слова «Я уже не могу дождаться, когда же можно будет использовать CSS3...». А между тем, использовать его можно уже сегодня. Да, использование CSS3 для критичных моментов сайта сейчас невозможно. Но использовать его для добавления мелких, некритичных для проекта деталей вполне реально, можно и нужно.

Читать дальше →
Total votes 63: ↑57 and ↓6+51
Comments45

Выпущена Ubuntu 11.04 Natty Narwhal Alpha 2

Reading time2 min
Views848
Прошло ровно два месяца с выпуска первой альфы, и вот уже выпущена вторая альфа Ubuntu 11.04 Natty Narwhal.

Как и в каждом новом релизе, обновлено множество пакетов. Отдельно стоит отметить: LibreOffice 3.3 (заменил OpenOffice.org 3.2), ядро Linux 2.6.38-rc2, X.org Server 1.10 и Mesa 7.10.

Под катом — внешние изменения по сравнению с первой альфой. И прежде чем начать за что-то критиковать Canonical, сначала вспомните, что это именно альфа. :)
Читать дальше →
Total votes 78: ↑61 and ↓17+44
Comments73

PyQt4 и QML

Reading time6 min
Views13K
Совсем недавно, разработчики фреймворка Qt Software, обрадовали нас появлением GUI, альтернативного стандартному, со своим, довольно несложным, языком разметки — QML.
Связкой QML с основной программой является модуль Qt Declarative. Начиная с версии 4.7 — PyQt4 поддерживает этот модуль.
QML значительно проще и гибче основного GUI, помимо того является и языком программирования, так как позволяет писать функции на javascript. В то время как Python довольно простой и гибкий интерпретируемый язык.

далее...
Total votes 48: ↑45 and ↓3+42
Comments16

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity