Как стать автором
Обновить

Комментарии 4

Я вот хочу видеть библиотеку по математике. Ну, такую, чтобы всё в ней было. Начиная с арифметических операций — зачем нам средства языка программирования, если x и y можно сложить средствами библиотеки. В библиотеке, конечно же, должны быть вектора и матрицы, плотные и разряженные, и чтобы операции над ними сразу все, что возможны. Да, ну и статистика там должна быть. Распределения там всякие, PDF, CDF и всё прочее. Зачем оно мне нужно? Ну, а почему бы и нет, все ведь только выиграют. Ну и методы оптимизации обязательно, как же без них. Ах да, чуть не забыл, хочу, чтобы ещё и функции для обработки изображений были. Ну а что, там же математика тоже используется.

Мой призыв: пойдите и сделайте мне такую библиотеку! Не знаю, зачем она мне или ещё кому-то, но вы всё таки сделайте! А я пока посижу и покритикую.
см. «Корпус русского языка» (для других языков они также есть в наличии)
В комментариях к оригинальной статье есть ответы на многие вопросы.

Например то, что задача сложная. Что примеры восновном на генерацию текста, а не на анализ.

ОЕЯ обладает большой сложностью. И модели там тоже сложные. Вот скажем банальная задача приведения к нормальной форме. Она сложная. Скажем банальное «мама мыла раму» как приводить слово «мыла»?

Какие времена глагола есть в русском языке? Сколько их? «делаю» и «сделаю» — это одно и то же время? А почему?
Сколько падежей в русском языке? В школе учат, что 6. А в каком падеже Маша в предложении «Маш, послушай меня»? А «Он из лесу вышел» в каком падеже стоит слово «лес»?

Или вот пример с грамматикой зависимостей. Достаточно сходит на НКРЯ и прочитать, какие типы и виды зависимостей бывают. СинТагРус — корпус с размеченными зависимостями создается высококвалифицированными лингвистами, в то же время он за год пополняется примерно на 5-8 тыс. предложений. При том, что над ним постоянно работают 3-4 человека. Почему так медленно?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории