Pull to refresh
0
0
Rinat Gareev @Aldvin

User

Send message

Text Analytics as Commodity: обзор приложений текстовой аналитики

Reading time11 min
Views17K
text analytics landscapeЕсли бы мне дали миллиард долларов на научные исследования, я бы создал большую программу в масштабе NASA по обработке естественного языка (NLP).[из Reddit AMA Майкла Джордана, 2015]. Из данной публикации вы узнаете, есть ли рынок для приложений текстовой аналитики. И не слишком ли оптимистичен заслуженный профессор М. Джордан по поводу потенциала NLP, а лучше потратить миллиард долларов на что-то другое.

Введение


Вначале определимся с терминами. Интеллектуальный анализ текста (англ., text mining) — это технологии получения структурированной информации из коллекций текстовых документов. Обычно в это понятие включают такие крупные задачи, как
  • категоризация текста
  • извлечение информации
  • информационный поиск.

Часто, когда говорят о применении интеллектуального анализа текста в бизнесе — текстовой аналитики (англ., text analytics) — имеют в виду не просто структурированную информацию, а т.н. углубленное понимание предмета анализа (insights), которое помогает в принятии бизнес-решений. Известный эксперт Сэт Граймс определяет текстовую аналитику как технологические и бизнес процессы применения алгоритмических подходов к обработке и извлечению информации из текста и получению глубокого понимания.

Принято считать, что формируется новый рынок когнитивно-вычислительных (cognitive computing) продуктов. По оценкам MarketsandMarkets глобальный рынок продуктов на основе обработки естественного языка должен составить $13.4 млрд. к 2020 году при росте в 18.4% по CAGR. Таким образом, сейчас этот рынок оценивается примерно в $5.8 млрд. В последние годы этот растущий рынок ознаменовался целым рядом громких сделок, вроде покупки Alchemy API компанией IBM. По другим оценкам, аналогичный рынок в Европе уже сейчас превосходит пол-миллиарда долларов и удвоится к 2019 году. Рынок Северной Америки составляет почти 40% глобального рынка текстовой аналитики и имеет оптимистичные оценки роста.
Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments2

Joel Spolsky: Маркетологи vs. Разработчики

Reading time2 min
Views1.2K
Перевод очередной статьи Джоела Спольски.

Маркетологи vs. Разработчики


На ранней стадии технологического стартапа, вы склонны к тому, чтобы иметь в своем штате много разработчиков и вам кажется, что разработчиков всегда мало. Если вы нанимаете продажников и маркетологов слишком рано, тогда они оказываются не вовлечены в бурную деятельность компании, и вы начинаете думать, что продажи и маркетинг это просто потеря времени.
Читать дальше →
Total votes 41: ↑31 and ↓10+21
Comments14

Отдыхая — учусь, работая — отдыхаю

Reading time2 min
Views1.5K
Вся наша жизнь — это рабочие дни разбавленные выходными и праздниками.
А наш рабочий день — это череда часов, минут, секунд.
Наверное каждый из нас слышал о производственной гимнастике:
каждые час-два, минут на пятнадцать (вместо перекуров), хорошо бы дать отдохнуть глазам, кистям, а ещё спине и ногам.
А хорошо бы совместить полезные упражнения с получением новых навыков — и практичных и эстетичных.
Я сейчас перечислю те занятия, которыми пытаюсь заниматься сам.
По моему мнению упомянутые ниже упражнения не требуют материальных затрат и лишь минимум временных.
Дополняйте, плиз.
Читать дальше →
Total votes 75: ↑63 and ↓12+51
Comments87

Культура сна

Reading time2 min
Views9.7K
Давно еще, пока я учился в школе, меня постоянно мучили мысли о том, что я хоть и высыпаюсь, но встаю мучительно и ничего с утра не хочу. Глубоко в душе я знал, что можно иначе, но как сделать так, чтобы ты с утра буквально вскакивал с кровати и шел воротить горы? Начал во всем разбираться, и вот, что из этого вышло.
Читать дальше →
Total votes 245: ↑230 and ↓15+215
Comments176

Психология и классификация игроков браузерных MMORPG

Reading time4 min
Views4.7K
Основываясь на своем 4-х летнем опыте участия в разработке и поддержке онлайн игры "Мир Гладиаторов: Революция" (http://wglads.ru) в роли разработчика, гейм-дизайнера и маркетолога хочется поделится своим взглядом на психологию игроков, которые играют в бесплатные браузерные MMORPG игры и немного классифицировать их по типам. (Юрий Борунов, директор ИгроСтрой LLC)

Основной особенностью русскоязычных игроков является конечно любовь ко всему бесплатному, то есть нужно понимать, что модель бизнеса на игре, основанная на подписке, среди русскоязычного игроленда не пройдет, потому что наши игроки привыкли играть в бесплатные сервера WoW, LineAge II, покупать пиратские диски игр оффлайновых игрушек, играть в «условно-бесплатные» браузерки. За-то наши игроки прекрасно покупают артефакты и «фиолетовые вещи» по $500 и выше, вместо того, чтобы платить $15 за подписку.

Читать дальше →
Total votes 4: ↑3 and ↓1+2
Comments112

Google запускает виртуальный мир под названием Lively

Reading time1 min
Views1.6K


Lively — новый сервис от компании Google позволит вам создавать и настраивать персонажей и миры, общаться с другими пользователями. В целом, здесь социальное взаимодействие богаче, чем предлагает GTalk сегодня.
Читать дальше →
Total votes 50: ↑44 and ↓6+38
Comments117

Не изобретайте колёса! 6 причин от Java мастера пользоваться существующими.

Reading time3 min
Views966
Колёса для марсианских роверов

— Ну хватит уже этих банальностей про колёса, надоело! — скажешь ты.

А вот и не хватит!

В современном научном мире и мире программирования колёса изобретают только
идиотыбунтари и студенты — в качестве домашнего задания.

Java — это такой особенный язык, разработчики которого очень продуманно подошли к проблеме разработки стандартных библиотек. Так что колес здесь своих достаточно на любой вкус и цвет.
Глотай бери — не хочу!

Вот список из 6 причин использовать существующие наработки для тех, кто еще не уверовал:
Читать дальше →
Total votes 53: ↑37 and ↓16+21
Comments52

5 причин полюбить Mylyn

Reading time7 min
Views12K
Данный пост на самом деле является инициатором еще одного, который уже выходил ранее. Меня на самом удивило, что о такой интересной вещи, как Mylyn, так мало написано на хабре и мне бы хотелось немного это исправить. Под катом перевод достаточно интересной, на мой взгляд, статьи. Надеюсь на интересное обсуждение.
Читать дальше →
Total votes 50: ↑43 and ↓7+36
Comments51

Как мы выбирали инструмент прототипирования. Часть I

Reading time6 min
Views22K

Между разработчиками ПО и пользователями ситуации непонимания имеют место достаточно часто. Пользователь хочет получить эффективный инструмент для решения тех или иных задач, к тому же простой в освоении и удобный в использовании, но имеет весьма приблизительное представление о специфике работы программиста. Программист же зачастую имеет весьма и весьма приблизительное представление о круге задач, с которыми имеет дело пользователь. То, что разработчику кажется блестяще реализованным, конечному пользователю может показаться неудобным. На вещи, которые представляются вполне очевидными пользователю, программист может вообще не обратить внимания. (Подробный анализ этих проблем см., например, в книге Дэвида Платта с провокационным, но выразительным названием «Софт — отстой! И что с этим делать?»). Как избежать ситуаций непонимания и помочь программисту и пользователю найти общий язык? (Данная тема уже не раз становилась предметом исследования представителей самых разных областей знаний — программистов, психологов, специалистов в области эргономики. Подробный и интересный обзор литературы по теме — здесь)

Создание приложений и веб-сайтов представляет собой сложный процесс, в который вовлечены люди разных профессий и разного склада мышления: программисты, дизайнеры, менеджеры. Перед каждым из этих людей стоит строго определенная задача: программист пишет код, дизайнер заботится о визуальной привлекательности, менеджер осуществляет контакт с клиентом. Как привести их работу, что называется, к общему знаменателю? Как обеспечить взаимопонимание всех участников процесса разработки?

Читать дальше →
Total votes 32: ↑20 and ↓12+8
Comments33

Как я в вузе электронную коммерцию преподавала (ч. 1, подготовка к семестру)

Reading time3 min
Views2.9K
Закончив вуз летом 2009 года, я вполне натурально расстроилась, решив, что никогда уже не вернусь в альма-матер. С институтом в моей жизни было многое связано: я всегда активно участвовала в разнообразных конференциях, два младших курса подрабатывала методистом, помогала с выставками и другими мероприятиями… Однако, расставаться надолго не пришлось: в конце лета мне позвонили и поинтересовались, не хочу ли я читать курс электронной коммерции? Я, конечно, хотела. Судя по всему, других желающих не было, так как мне поставили занятия на субботу, чтобы я могла не отрываться от основной работы, и даже согласились закрыть глаза на вероятные отъезды в командировки, с условием, что я отчитаю все положенные часы.
Читать дальше →
Total votes 151: ↑134 and ↓17+117
Comments82

Elastic Server On-Demand — мне один виртуальный сервер, два приложения и пиво, пожалуйста!

Reading time5 min
Views1.7K
Наша аудитория достаточно профессиональная, чтобы я с самого начала материала стал убеждать вас в пользе и полезности виртуализации. Это сейчас тренд номер один (ну, или, по крайней мере, один из основных) в мире ИТ и это не просто дань моде, а реальная и обоснованная потребность рынка. А теперь вспомните последний раз, когда вы развёртывали виртуализированную инфраструктуру. Например, мой опыт в этом достаточно большой (хотя и односторонний) — я просто люблю иногда тестировать различные ОС и специфические конфигурации приложений, поэтому мне часто приходится развёртывать один или несколько виртуальных серверов. Вот из последних — очень хотел JeOS поставить, специальный дистрибутив Ubuntu, ориентированный на виртуальные среды, однако он никак не хотел даже запускаться после установки. А уж сколько было случаев, когда были сложности с установкой тех или иных программ, обновлений, несовместимости конфигураций — это вообще отдельный разговор. А оказалось, и для этого есть решения. Простое и оригинальное — веб-сервис в стиле web 2.0 (да-да, именно так) для создания и распространения виртуальных серверов, их образов. И так, рассмотрим Elastic Server On-Demand от Cohesive FT.

Читать дальше →
Total votes 27: ↑25 and ↓2+23
Comments7

Сайт как инструмент

Reading time4 min
Views4.2K
Один из стандартных вопросов, который задает (или по идее должна задавать) веб-студия на первой встрече с клиентом – зачем вам нужен сайт? Зачастую клиент с готовностью отвечает «нам нужен сайт как инструмент». Но, как показывает опыт, иногда это примерно то же самое, что прийти в магазин и купить дрель, чтобы была. Чтобы в доме был инструмент.

Вспомним классический пример, что покупая дрель, по сути человек покупает дырки, которые можно сделать с помощью этой дрели. Для того чтобы эти дырки появились, инструментом надо пользоваться, надо уметь с ним обращаться и работать. Сама по себе дрель (как и сам по себе сайт) особого смысла не имеют.

С учетом того, что создание сайта – удовольствие чаще всего не дешевое, что же нужно сделать, чтобы инструмент не лежал на полке, а использовался по своему прямому назначению? Декларируя, что мы заказываем сайт-инструмент, надо понимать, какие именно «дырки» мы хотим получить в результате.

Давайте рассмотрим постановку задачи на примере.
Читать дальше →
Total votes 47: ↑41 and ↓6+35
Comments111

Типы HTTP-запросов и философия REST

Reading time4 min
Views939K
Этот пост — ответ на вопрос, заданный в комментарии к одной из моих статей.

В статье я хочу рассказать, что же из себя представляют HTTP-методы GET/POST/PUT/DELETE и другие, для чего они были придуманы и как их использовать в соответствии с REST.
Читать дальше →
Total votes 84: ↑78 and ↓6+72
Comments111

Сравнение средств проектирования — 2

Reading time5 min
Views36K
Этот топик является продолжением статьи о средствах проектирования.
В данной части я постараюсь рассмотреть не менее достойных представителей данной «отрасли».
Итак следующая тройка выходит на старт!
Читать дальше →
Total votes 26: ↑24 and ↓2+22
Comments30

Поиграем в CacheGraph?

Reading time3 min
Views675
imageПредположим у Вас есть сайт. Предположим вы его оптимизировали по самое «немогу», но всеравно хочеться больше.
Лично мне хотелось, но долгое время не получалось.
Когда я победил тормознутость базы кэшированием запросов, тормознутость блоков — кэшированием блоков, а целые страницы кэшировать я не мог…
Cайт конечно стал работать много быстрее, но начал тормозить уже… мемкэшед?
Читать дальше →
Total votes 69: ↑61 and ↓8+53
Comments24

Краткий обзор популярных дополнений

Reading time2 min
Views1.1K

Описание
наиболее полезных и популярных плагинов Miranda IM


ICQJ Plus Mod


Ранее известен как
ICQJ
S7 SSS Mod


Нужен для работы протокола ICQ. Модифицированная версия официального ICQJ Oscar. Имеет наибольшее число фич и базируется на наработках других сборок протокола. Подробнее о поддерживаемых возможностях в этой
сводной таблице.
Читать дальше →
Total votes 5: ↑5 and ↓0+5
Comments7
1

Information

Rating
Does not participate
Registered
Activity