Семантические сети *

Веб 3.0

boldachev 18 мая 2020 в 18:29

Миф семантического веба

5 мин

10K

Семантические сети * Исследования и прогнозы в IT *

В сфере семантического моделирования сложилась довольно странная ситуация: в качестве базовых используется набор стандартов и спецификаций от W3C, заточенных под проект “семантического веба” (RDF/OWL, SPARQL и пр.), хотя сам проект не только не реализован на данный момент, но и, по всей видимости, никогда не будет воплощен вследствие сомнительности исходных гипотез.

Читать дальше →

+18

alexeyev 12 апр 2020 в 10:46

Что такое Emergent Communication и почему это нужно знать

10 мин

2.4K

Natural Language Processing * Искусственный интеллектМашинное обучение * Семантические сети *

Перевод

TL;DR: перевод поста Михаила Нуховича What is Emergent Communication and Why You Should Care: что это такое, зачем это нужно, какие есть точки зрения на задачу и перспективные направления исследований. Обучение с подкреплением, обработка естественного языка, теория игр и философия. Публикуется с любезного разрешения автора.

Вот уже два года как меня увлекла Emergent Communication (EC), по которой я теперь пишу магистерскую диссертацию. В этом году я участвую в организации семинара, благодаря которому у меня и возник интерес к этой области: Workshop on Emergent Communication на конференции NeurIPS. Планирую написать целую серию из постов об EC для широкой аудитории, чтобы помочь всем интересующимся заглянуть в эту сферу (ну и чтобы писать диссертацию было повеселее).

Читать дальше →

dimakochergov 29 фев 2020 в 19:04

Метод нечеткой индукции и его применение для моделирования знаний и информационных систем

7 мин

3.4K

Математика * Семантические сети * Сжатие данных * Тестирование IT-систем *

Из песочницы

В настоящей статье предложен разработанный автором метод нечеткой индукции как объединение положений нечеткой математики и теории фракталов, введено понятие степени рекурсии нечеткого множества, представлено описание неполной рекурсии множества как его дробной размерности для моделирования предметной области. В качестве сферы применения предлагаемого метода и созданных на его основе моделей знаний как нечетких множеств рассмотрено управление жизненным циклом информационных систем, включая разработку сценариев использования и тестирования программного обеспечения.

Читать дальше →

ilvokhin 27 фев 2020 в 12:16

Граф знаний в Поиске: построение из нескольких источников

7 мин

14K

Блог компании VKАлгоритмы * Поисковые технологии * Семантические сети *

Я хочу рассказать о том, что такое граф знаний и об одном из способов его построения из нескольких тематических источников.

Большое количество запросов в поиске содержат единственную сущность — объект, про который спрашивает пользователь. Это могут быть запросы про каких-то людей, фильмы, сериалы, музыкальные или географические объекты. Когда пользователь задает такой запрос, в выдаче ему можно показать дополнительную информационную карточку в надежде, что информация в карточке будет интересна пользователю. Карточки украшают выдачу и повышают ее наглядность. С помощью информационных карточек мы даём человеку понять, что он пользуется интеллектуальным сервисом, потому что поисковая система поняла, что он имел в виду, о каком именно объекте спрашивал. Более того, эту интеллектуальность можно расширить, отвечая на запрос пользователя прямо на странице выдачи. Например, в ответ на «что посмотреть в Праге» мы можем сразу показать достопримечательности этого города.

Читать дальше →

+26

Leo_Gan 17 фев 2020 в 02:40

Null проблема в Data Science и Machine Learning

3 мин

5.9K

Data Engineering * Natural Language Processing * Алгоритмы * Машинное обучение * Семантические сети *

Существующее определение Null в Data Science сильно ограничено. Приложив немножко усилий? мы значительно улучшим обработку данных, ранее попадаемых в Null.

Читать дальше →

Yahor4 13 янв 2020 в 12:55

Введение в метод семантического дифференциала за 5 минут

5 мин

16K

Управление продуктом * Семантические сети * Исследования и прогнозы в IT * Инфографика

Из песочницы

Введение

Для чего может понадобиться знание методики семантического дифференциала?

Можем узнать наше место относительно конкурентов в подсознании потребителей. Нам может показаться, что клиенты плохо относятся к нашему товару, но что будет, если мы узнаем, что к конкурентам они относятся ещё хуже по наиболее значимым для нас критериям?
Можем узнать, насколько успешна наша реклама относительно реклам товаров конкурентов из той же категории (Call of Duty или Battlefield?)
Определим, над чем стоит поработать при позиционировании. Образ компании либо товара воспринимают как «дешевый»? Видимо, при проведении новой рекламной кампании нам предстоит либо оставаться в этом уголке сознания потребителя (и смириться с этим статусом), либо срочно менять вектор развития. Xiaomi позиционируются как более дешевые альтернативы флагманов с тем же железом (условно). У них есть четко выверенная позиция, которая выделяет их на фоне именитых конкурентов, позиционирующих себя как дорогих – Apple, Samsung, etc. Одной из главных проблем в таком случае станет то, что ассоциация (а именно на них и построен весь метод в целом) со словом «дешевый» может привлечь и ассоциацию «плохой», либо «некачественный».

К слову, это работает и при сравнении любых других объектов в выбранной категории — вы можете сравнивать и процессоры, и телефоны, и новостные порталы! По сути, фантазия для применения этого метода не ограничена.

Как определить, по каким именно критериям мне следует сравнивать наши товары?
В принципе, ответить на этот вопрос можно по-разному – вы можете попробовать взять экспертное интервью, полуструктурированное интервью, или же выбрать метод фокус-групп. Некоторые из полученных вами категорий могут встретиться вам на просторах интернета — это не должно вас смущать. Помните, что главное в вашем исследовании — не уникальность полученных данных, а их объективность и достоверность.

Читать дальше →

AloneCoder 12 ноя 2019 в 08:54

XML практически всегда применяется не по назначению

6 мин

53K

Блог компании VKХранение данных * Семантические сети * Веб-разработка * XML *

Перевод

Язык XML был изобретен в 1996 году. Едва он успел появиться, как возможности его применения уже начали понимать неправильно, и для тех целей, к которым его пытались адаптировать, он был не лучшим выбором.

Не будет преувеличением сказать, что подавляющее большинство схем XML, которые мне доводилось видеть, представляли собой нецелесообразное или неправильное использование XML. Более того, такое применение XML свидетельствовало о фундаментальном непонимании того, чем прежде всего является XML.

XML — это язык разметки. Это не формат данных. В большинстве схем XML это разграничение явно не учитывали, путая XML с форматом данных, что в итоге означало ошибку в самом выборе XML, поскольку на самом деле нужен был именно формат данных.

Читать дальше →

+67

boldachev 5 ноя 2019 в 14:40

Knowledge Graph. Плюральность, темпоральность, деятельностный подход

3 мин

5.2K

Исследования и прогнозы в IT * Семантические сети *

Традиционно Knowledge Graphs, то есть информационные системы, поддерживающие концептуальное описание предметных областей (как самых общих, так и узко специальных) задумываются и строятся, как источники проверенной и единственно верной информации о мире. По такому принципу – как собрание исключительно правильных данных – построена и популярная народная энциклопедия Wikipedia.

Читать дальше →

boldachev 23 окт 2019 в 13:25

Семантический браузер или жизнь без сайтов

6 мин

10K

Децентрализованные сети * Исследования и прогнозы в IT * Семантические сети *

Мысль о неизбежности перехода глобальной сети от сайтоцентристской структуры к юзероцентристской я высказал еще 2012 году (Философия эволюции и эволюция интернета или в сокращенном виде WEB 3.0. От сайтоцентризма к юзероцентризму). В этом году я попытался развить тему нового интернета в тексте WEB 3.0 — второй подход к снаряду. Сейчас же выкладываю вторую часть статьи WEB 3.0 или жизнь без сайтов (советую просмотреть перед чтением этой страницы).

Итак, что же получается? Интернет в версии web 3.0 есть, а сайтов нет? А что же тогда есть?

Читать дальше →

VAE 15 окт 2019 в 12:41

Модель натурального ряда чисел и отдельного числа. Контуры

23 мин

Алгоритмы * Информационная безопасность * Криптография * Математика * Семантические сети *

Recovery Mode

В комментариях к опубликованным ранее работам автора было высказано много замечаний и пожеланий. Я благодарю всех читателей — хабровчан и прочих за внимание к работам и тем более за комментарии. Многих читателей не устраивал стиль изложения, подача материала, нечеткость определений и др. Главное, что автор желал бы поправить — это обеспечить доступность понимания идей публикаций, математического инструментария и техники его применения. Работа в интересующем автора направлении — дело и для него новое, но чем дальше «в лес», тем больше и непонятного, и сложного, и, конечно, интересного.

Читать дальше →

boldachev 23 сен 2019 в 14:31

WEB 3.0 — второй подход к снаряду

5 мин

23K

Децентрализованные сети * Исследования и прогнозы в IT * КриптовалютыСемантические сети * Терминология IT

Сначала немного истории.

Web 1.0 — это сеть для доступа к контенту, который размещали на сайтах их владельцы. Статичные html-страницы, доступ к информации только для чтения, основная радость — гиперссылки, ведущие на страницы этого и других сайтов. Типичный формат сайта — информационный ресурс. Эпоха переноса в сеть offline-контента: оцифровка книг, сканирование картинок (цифровые фотоаппараты были еще редкостью).

Читать дальше →

KuzmaKhrabrov 20 сен 2019 в 08:39

Применение сиамских нейросетей в поиске

5 мин

11K

Блог компании VKNatural Language Processing * Машинное обучение * Поисковые технологии * Семантические сети *

Всем привет! В этом посте я расскажу, какие подходы мы в Поиске Mail.ru используем для сравнения текстов. Для чего это нужно? Как только мы научимся хорошо сравнивать разные тексты друг с другом, поисковая система сможет лучше понимать запросы пользователя.

Что нам для этого нужно? Для начала строго поставить задачу. Нужно определить для себя, какие тексты мы считаем похожими, а какие не считаем и затем сформулировать стратегию автоматического определения схожести. В нашем случае будут сравниваться тексты пользовательских запросов с текстами документов.

Читать дальше →

+38

Sistemaalex 7 июл 2019 в 00:37

Как сравнить: «изумительный авто» и «уродливый барак», в маркетинговом опросе и в больших данных

2 мин

3.2K

Семантические сети * Математика * Интернет-маркетинг * Big Data *

Все мы участвовали в опросах, онлайн или в реальной жизни. А когда начинаем новый проект, то без опросов не обойтись. Но иногда есть результаты опросов, с которыми непонятно что делать, кроме как улыбнуться, ниже, на картинке, результат опроса Всероссийского центра изучения общественного мнения (ВЦИОМ).

Полюбопытствовал как сейчас используют вопросы с качественными оценками и обнаружил, что ВЦИОМ, ФОМ, Левада-Центр используют, в основном, трехдиапазонную шкалу (плохо/норма/хорошо). В случаях более детальных вопросов, шкала увеличивается до 5-6 единиц, но редко.

Тогда, на сегодняшний день, складывается ситуация, в которой социологи уходят от многоуровневой шкалы качественных оценок и стараются использовать трехуровневую. И если социология умеет из этого выворачиваться, то при анализе приличных объемов данных, необходимость использования качественных оценок становится усложняющим фактором и снижает надежность результатов. Так как разграничить, например, понятия: «прекрасная квартира» и «отличное жилье» практически невозможно, а с учетом ответа, одного из персонажей «Двенадцати стульев»: «Кому и кобыла невеста», многопересекаемость качеств выходит за разумные пределы.

Читать дальше →

nitrosbase 27 июн 2019 в 11:24

Semantic Web и Linked Data. Исправления и дополнения

15 мин

6.7K

Семантические сети * Профессиональная литература * Исследования и прогнозы в IT * NoSQL * IT-стандарты *

Хочу представить публике фрагмент вот этой недавно вышедшей книги:

Онтологическое моделирование предприятий: методы и технологии [Текст]: монография / [С. В. Горшков, С. С. Кралин и др.; отв. ред. С. В. Горшков]. — Екатеринбург: Изд-во Уральского ун-та, 2019. — 234 с.: ил., табл.; 20 см. — Авт. указаны на обороте тит. с. — Библиогр. в конце гл. — ISBN 978-5-7996-2580-1: 200 экз.

Обложка и корешок книги

Цель выкладки этого фрагмента на Хабре троякая:

Собрать вопросы и замечания, чтобы учесть их при включении этого текста в переработанном виде в другие издания.
Внести дополнения, не очень совместимые с форматом печатной монографии: злободневные примечания (ниже они под спойлерами) и гиперссылки; а также внести исправления (ниже они никак не выделены).
Многие адепты Semantic Web и Linked Data до сих пор считают, что их круг столь узок в основном потому, что широкой публике все еще по-хорошему не объяснили, что же это такое — Semantic Web и Linked Data. Автор фрагмента, хоть к этому кругу и принадлежит, такого мнения не придерживается, но, тем не менее, считает себя обязанным сделать еще одну попытку.

Глава I. Параграф 5. Semantic Web и Linked Data

julryz 26 мая 2019 в 09:20

Автоматизации бизнес процессов компании в Trello с использованием технологии семантического моделирования

4 мин

9.1K

Будущее здесьПрограммирование * Семантические сети *

Из песочницы

В последние годы все чаще говорят о Trello, как о прекрасном инструменте для организации и планирования. В нашей компании мы вот уже 3 года используем Trello для планирования многих процессов, начиная с отпусков, командировок и согласования договоров и заканчивая управлением проектами.

К сожалению, не все так прекрасно в Trello. На нем нельзя сделать кастомный workflow. То есть нам нужно занять одного сотрудника, который будет в различных досках перетаскивать карточки руками. Как же сделать так, чтобы этого сотрудника можно было перевести на другую, более интересную и творческую работу?

Конечно, скажете вы, можно написать скрипт, который будет делать все это за нас. Но тут возникает проблема. Скрипт может написать только программист или человек, который понимает, как это делать. Поддерживать скрипт придется ему же. Мы нашли более простое и логичное решение — это семантическое моделирование.

Семантическое моделирование позволяет всю логику работы доски в Trello записать на естественном языке.

Читать дальше →

+12

nitrosbase 10 мая 2019 в 11:12

Что сейчас происходит с RDF-хранилищами?

7 мин

8.9K

Семантические сети * Исследования и прогнозы в IT * Базы данных * NoSQL *

Из песочницы

Semantic Web и Linked Data подобны ближнему космосу: жизни там нет. Чтобы отправиться туда на более-менее длительный срок… ну, не знаю, что говорили вам в детстве в ответ на «хочу стать космонавтом». Но понаблюдать за происходящим можно и находясь на Земле; стать астрономом-любителем или даже профессионалом гораздо проще.

В статье речь пойдет о свежих, не старее нескольких месяцев, трендах из мира RDF-хранилищ. Метафора в первом абзаце была навеяна вот этой эпических размеров рекламной картинкой.

Поехали!

+13

Kamil_Safin 23 апр 2019 в 09:57

Так сложно найти, легко пропустить и невозможно оформить

9 мин

6.6K

Блог компании «Антиплагиат»Алгоритмы * Математика * Машинное обучение * Семантические сети *

Наши правила жизни: начинать название статей с буквы «Т» и искать текстовые заимствования быстро, точно и, самое главное, красиво. Уже больше года мы успешно находим переводные заимствования и рерайт с помощью нейросетей. Но иногда нужно намеренно «стрелять себе в ногу» и, прихрамывая, идти другой дорожкой, т.е. не проверять ни на парафраз, ни на плагиат, а просто оставить кусочек текста в покое. Парадоксально, больно, но надо. Скажем сразу: трогать не будем библиографию. Как отыскать её в тексте? Почему это легко сказать, но сделать гораздо сложнее, чем кажется? Всё это в продолжении корпоративного блога компании Антиплагиат, единственного блога, где ~~не любят зачёркнутый текст~~.

_{Источник изображения:Fandom.com}

Читать полностью

+12

ph_piter 7 дек 2018 в 13:09

Зависимые типы — будущее языков программирования

7 мин

28K

Блог компании Издательский дом «Питер»Математика * Программирование * Проектирование и рефакторинг * Семантические сети *

Перевод

Всем привет!

Несмотря на диковинность и некоторую отвлеченность рассматриваемой сегодня темы — надеемся, что она сможет разнообразить вам выходные. В конце поста помещаем три ссылки от автора, позволяющие познакомиться с зависимой типизацией в Idris, F* и JavaScript

Читать дальше →

+27

107

arttom 19 ноя 2018 в 15:00

Компьютеры пишут прозу, но все еще уступают людям. Почему?

8 мин

6.2K

Будущее здесьСемантические сети * Искусственный интеллект

Два года назад в японском литературном конкурсе чуть не выиграла повесть, написанная искусственным интеллектом. Она называется «День, когда компьютер написал роман». Пусть это и звучит как дурацкое воплощение анекдота «лучший способ заработать миллион — написать книгу, как заработать миллион», повесть прошла в финал, обойдя примерно полторы тысячи текстов, написанных людьми. Но прорыва не случилось. Художественные тексты по-прежнему пишут люди, нехудожественные — в основном тоже.

Пару месяцев назад компания Meanotek попробовала сделать ИИ-помощника для писательства и написать рассказ с ним в соавторстве. Спойлер — успеха он не добился. Создатели проекта рассказали нам, в чем была идея и как она воплощена. А мы попытались разобраться, почему из машин поэты выходят лучше, чем прозаики.

+15

andyray 14 ноя 2018 в 06:44

Так устроен поиск заимствований в Антиплагиате

11 мин

49K

Блог компании «Антиплагиат»Алгоритмы * Математика * Поисковые технологии * Семантические сети *

Мы уже рассказывали вам об интересных статистиках текстов, делали обзор статей применений автокодировщиков в анализе текстов, удивляли нашими свежими алгоритмами поиска переводных заимствований и парафраза. Я решил продолжить нашу корпоративную традицию и, во-первых, начать статью с «Т», а во-вторых, рассказать:

как быстро найти абзац текста среди сотен миллионов статей;
во что превращается документ после загрузки в систему Антиплагиат, и что с этим делать дальше;
как формируется отчет, который почти никто не смотрит, а стоило бы;
как проиндексировать не все, но достаточно.

Антиплагиат в естественной среде, полетели

+24

1 2 ...

6 7

9 10 ...

20 21

Семантические сети *

Миф семантического веба

Что такое Emergent Communication и почему это нужно знать

Метод нечеткой индукции и его применение для моделирования знаний и информационных систем

Граф знаний в Поиске: построение из нескольких источников

Null проблема в Data Science и Machine Learning

Введение в метод семантического дифференциала за 5 минут

Введение

XML практически всегда применяется не по назначению

Knowledge Graph. Плюральность, темпоральность, деятельностный подход

Семантический браузер или жизнь без сайтов

Модель натурального ряда чисел и отдельного числа. Контуры

WEB 3.0 — второй подход к снаряду

Применение сиамских нейросетей в поиске

Как сравнить: «изумительный авто» и «уродливый барак», в маркетинговом опросе и в больших данных

Ближайшие события

Semantic Web и Linked Data. Исправления и дополнения

Автоматизации бизнес процессов компании в Trello с использованием технологии семантического моделирования

Что сейчас происходит с RDF-хранилищами?

Так сложно найти, легко пропустить и невозможно оформить

Зависимые типы — будущее языков программирования

Компьютеры пишут прозу, но все еще уступают людям. Почему?

Так устроен поиск заимствований в Антиплагиате

Вклад авторов