Comments / Profile of Exbe / Habr

Александр @Exbe

User

Школа программистов HeadHunter 2012

Exbe Sep 27 2012 at 16:11

Мне кажется нереальным охватить все области за 24 занятия, один SOLID с глубоким погружением хватит на тройку-четверку занятий. А если еще PoEAAA, GRASP, MV* и т.д.

Никто не учит до интермеда, сеньора :-) Ищут активных, умных и красивых.

Семантическая сеть, ARC2 и PHP

Exbe May 5 2012 at 21:29

У истоков развития любой технологии стоит человеческая хотелка, от фоногрофа Эдисона до патефона лет 50 эта ниша была занята идеей одного человека и старанием тысяч и тысяч, и только потом пришел магнитофон, cd и т.д.
Я ковыряюсь в семантике, мне интересно.

PS
Я запнулся на фразе ТЭСОТ «Онтолоджи»
ТЭСОТ — Технология Эвристико-Смысловой Обработки Текстов
«Онтолоджи» — фирма? проект? человек? кунг-фу?

ВКонтакте решили скопировать весь интернет

Exbe Apr 20 2012 at 06:41

Интернет-катастрофа не случится, потому что интернет != контакт.
Зато школоты и неадеквата в интернетах меньше станет.

ВКонтакте решили скопировать весь интернет

Exbe Apr 20 2012 at 06:03

Да, как раз собирался про нее написать:

При том ресурс подгружает во время создания своего топика.

-4

Семантическая сеть, ARC2 и PHP

Exbe Apr 18 2012 at 12:41

Это очевидный логический вывод.
Любое «виртуальное хранилище» над хранилищем будет уступать по производительности специализированному. Хотя бы потому, что реализацию можно оптимизировать на самом низком уровне (дисковые операции, память, алгоритмы).
Да, и я не верю, что 40 летний опыт нельзя реюзнуть :-)

За пруфом далеко ходить не надо: последние 25 лет различные ORM создают над реляционной бд объектно-ориентированное хранилище. И вдруг NoSQL оказывается «великим прорывом», а как же иначе — хранилище-то специализированное. Есть, правда, открытые вопросы с сортировками, агрегацией.

Вы же видели ссылку на заявленно-большу и производительную семантик СУБД в комментарии — оно специализированное, и не должно уступать по скорости любому другому специализированному.
Речь идет о порядках, а не microseconds.

Семантическая сеть, ARC2 и PHP

Exbe Apr 16 2012 at 19:46

Я думал, что никогда не промахнусь мимо комментария…
Однако вот

Семантическая сеть, ARC2 и PHP

Exbe Apr 16 2012 at 19:40

У нас php много задач решает, в том числе и плотная работа с хранилищем. Не могу сказать, что супер быстро на больших данных — архитектура хранилища над хранилищем дает о себе знать. С «честной» базой триплетов по скорости не должно проигрывать SQL субд.

-1

Семантическая сеть, ARC2 и PHP

Exbe Apr 16 2012 at 14:48

Да, это действительно проблема и даже, скорее, вызов.
С моих позиций, это задача уровня полета человека на Луну или выход в космос — там тоже были вызовы.

Да, сейчас triplestore хранилище создаются на базе релятивной базы, что не способствует производительности.
Есть специализированные хранилища, наподобие AllegroGraph — быстрые и ёмкие, но даже они имеют потолок. Мне страшно представить какой реальный объем семантических (или мета-данных) имеет средний руки бизнес процесс, а реакция должна быть достаточно быстрой. Для любого бизнеса скорость — это преимущество.
А тут целый ворох проблем: коммуникация, обновление, объемы, запросы… Брр-р-р.
Инновации одним словом.

Семантическая сеть, ARC2 и PHP

Exbe Apr 16 2012 at 11:21

Если только кто-либо опишет порнографию семантически (это кстати хорошая и прибыльная бизнес идея).
Семантика сделает результат поиска чище за счет того, что пользователь выбирает конкретную ветку графа с информацией — если взрослых материалов в ней нету, то и как результат оно не появится.
Сейчас это можно сделать с помощью фасетного поиска или/и принудительной категоризации запроса.
То есть прямо сказать -ага, вот мой запрос относится к домашним питомцам.

Более реальный на сейчас вариант — это фильтрация контента с помощью семантики. В нескольких онтологиях нужно описать характерный признаки из разных областей (от описания фотографии до описания характерных черт порно-доменов) и далее механизм на любом языке для, собственно, самой фильтрации.

Семантика удобна тем, что правила и поведение может задавать специалист без программистких скилов (например в Protégé), а реализация фльтра ограничевается определенным набором «фичей», которые пишет команда программистов.
Мухи отдельно, котлеты отдельно.