Если формальная верификация программы, меняющей два значения в памяти, заняла такой объём кода, то кто гарантирует отсутствие ошибок в этом доказательстве? Неужели весь этот приведённый код с леммами и теоремами пишется целиком вручную?
Насколько возможно за обозримое время верифицировать более сложную систему? Например, программу управления микроволновкой.
Если база данных используется как тупая записная книжка через ORM, то вряд ли получится заметно ощутить преимущества PostgresSQL. Если запросы довольно сложные, то стоит посмотреть на EXPLAIN и сравнить работу двух оптимизаторов. Думаю, это достаточно формальный критерий для принятия решения.
Я не интересовался работами, посвящёнными непосредственно сравнению методов обработки языков различных семей. Однако из всего, что я видел, сходу могу посоветовать несколько ссылочек:
Вообще, нынешний RuSSIR как раз посвящён многоязычному информационному поиску. Вероятно, в материалах конференции будет что-то интересное именно по данному вопросу.
Не вижу абсолютно ничего плохого в том, чтобы обратить внимание людей на действительно хороший свободный продукт. Хотя отсутствие в оригинале и комментах к оригиналу даже ссылочки на проведённое автором сравнение Postgres и MSSQL напрягает даже меня.
Если мне не изменяет память, то на предыдущей работе массивы использовались для хранения списка категорий продукта в товарном каталоге при денормализации данных. Postgres имеет возможность выполнять запросы над массивами как над обычными таблицами. Благодаря этому можно было фильтровать, агрегировать и выдавать данные без лишних преобразований.
Это перевод, и автор оригинальной статьи наверняка ответит на все вопросы. Странно, но хабр не подсвечивает тег <abbr>, которым размечено второе предложение.
В этом и вся беда отечественного NLP (которое не пикап): ни словарей, ни программного обеспечения, ни моделей обученных, ничего.
Особенно досадно, что машиночитаемые корпусы текстов и тезаурусы русского языка разрабатываются на наши же с вами налоги, но при этом доступны только узкому кругу разработчиков и паре-тройке «своих» организаций.
Всё зависит от языка, с которым работает система. Многие западноевропейские языки (тот же английский) прекрасно обрабатываются статистическими парсерами. Нельзя исключать статистические методы только потому, что они внешне могут казаться игрой в кости.
Однако последние исследования подтверждают очевидную истину, что действительно классных результатов можно достичь только благодаря слаженной междисциплинарной работе специалистов-лингвистистов и исследователей в области искусственного интеллекта.
Где-то недавно пробегала ссылка на тот же «Диалог», речь шла как раз о синтаксическом анализе.
Скорее всего он имеет кучу патентов на полезные модели, где необходимо просто представить схему развития прототипа с целью достижения необходимых характеристик для его применения в тех или иных областях. Слово «прототип» в патентном праве имеет несколько иной смысл, чем привыкли понимать нормальные люди.
Если формальная верификация программы, меняющей два значения в памяти, заняла такой объём кода, то кто гарантирует отсутствие ошибок в этом доказательстве? Неужели весь этот приведённый код с леммами и теоремами пишется целиком вручную?
Насколько возможно за обозримое время верифицировать более сложную систему? Например, программу управления микроволновкой.
EXPLAIN
и сравнить работу двух оптимизаторов. Думаю, это достаточно формальный критерий для принятия решения.Вообще, нынешний RuSSIR как раз посвящён многоязычному информационному поиску. Вероятно, в материалах конференции будет что-то интересное именно по данному вопросу.
Особенно досадно, что машиночитаемые корпусы текстов и тезаурусы русского языка разрабатываются на наши же с вами налоги, но при этом доступны только узкому кругу разработчиков и паре-тройке «своих» организаций.
Однако последние исследования подтверждают очевидную истину, что действительно классных результатов можно достичь только благодаря слаженной междисциплинарной работе специалистов-лингвистистов и исследователей в области искусственного интеллекта.
Где-то недавно пробегала ссылка на тот же «Диалог», речь шла как раз о синтаксическом анализе.