Pull to refresh
2
0
Александр @Exbe

User

Send message
Мне кажется нереальным охватить все области за 24 занятия, один SOLID с глубоким погружением хватит на тройку-четверку занятий. А если еще PoEAAA, GRASP, MV* и т.д.

Никто не учит до интермеда, сеньора :-) Ищут активных, умных и красивых.
У истоков развития любой технологии стоит человеческая хотелка, от фоногрофа Эдисона до патефона лет 50 эта ниша была занята идеей одного человека и старанием тысяч и тысяч, и только потом пришел магнитофон, cd и т.д.
Я ковыряюсь в семантике, мне интересно.

PS
Я запнулся на фразе ТЭСОТ «Онтолоджи»
ТЭСОТ — Технология Эвристико-Смысловой Обработки Текстов
«Онтолоджи» — фирма? проект? человек? кунг-фу?
Интернет-катастрофа не случится, потому что интернет != контакт.
Зато школоты и неадеквата в интернетах меньше станет.
Да, как раз собирался про нее написать:
image
При том ресурс подгружает во время создания своего топика.
Это очевидный логический вывод.
Любое «виртуальное хранилище» над хранилищем будет уступать по производительности специализированному. Хотя бы потому, что реализацию можно оптимизировать на самом низком уровне (дисковые операции, память, алгоритмы).
Да, и я не верю, что 40 летний опыт нельзя реюзнуть :-)

За пруфом далеко ходить не надо: последние 25 лет различные ORM создают над реляционной бд объектно-ориентированное хранилище. И вдруг NoSQL оказывается «великим прорывом», а как же иначе — хранилище-то специализированное. Есть, правда, открытые вопросы с сортировками, агрегацией.

Вы же видели ссылку на заявленно-большу и производительную семантик СУБД в комментарии — оно специализированное, и не должно уступать по скорости любому другому специализированному.
Речь идет о порядках, а не microseconds.
Я думал, что никогда не промахнусь мимо комментария…
Однако вот
У нас php много задач решает, в том числе и плотная работа с хранилищем. Не могу сказать, что супер быстро на больших данных — архитектура хранилища над хранилищем дает о себе знать. С «честной» базой триплетов по скорости не должно проигрывать SQL субд.
Да, это действительно проблема и даже, скорее, вызов.
С моих позиций, это задача уровня полета человека на Луну или выход в космос — там тоже были вызовы.

Да, сейчас triplestore хранилище создаются на базе релятивной базы, что не способствует производительности.
Есть специализированные хранилища, наподобие AllegroGraph — быстрые и ёмкие, но даже они имеют потолок. Мне страшно представить какой реальный объем семантических (или мета-данных) имеет средний руки бизнес процесс, а реакция должна быть достаточно быстрой. Для любого бизнеса скорость — это преимущество.
А тут целый ворох проблем: коммуникация, обновление, объемы, запросы… Брр-р-р.
Инновации одним словом.

Если только кто-либо опишет порнографию семантически (это кстати хорошая и прибыльная бизнес идея).
Семантика сделает результат поиска чище за счет того, что пользователь выбирает конкретную ветку графа с информацией — если взрослых материалов в ней нету, то и как результат оно не появится.
Сейчас это можно сделать с помощью фасетного поиска или/и принудительной категоризации запроса.
То есть прямо сказать -ага, вот мой запрос относится к домашним питомцам.

Более реальный на сейчас вариант — это фильтрация контента с помощью семантики. В нескольких онтологиях нужно описать характерный признаки из разных областей (от описания фотографии до описания характерных черт порно-доменов) и далее механизм на любом языке для, собственно, самой фильтрации.

Семантика удобна тем, что правила и поведение может задавать специалист без программистких скилов (например в Protégé), а реализация фльтра ограничевается определенным набором «фичей», которые пишет команда программистов.
Мухи отдельно, котлеты отдельно.
2

Information

Rating
Does not participate
Location
Санкт-Петербург и область, Россия
Registered
Activity