Как стать автором
Обновить

Комментарии 8

Не смотрели в сторону OpenCorpora для словаря (http://opencorpora.org/dict.php)? Там очень большое количество слов уже размечены и указаны их всевозможные формы.

Знаю о таком словаре.

Если память мне не изменяет, он появился немного позже того момента, как я сделал редактирование словаря непосредственно в игре, после чего я закончил большие эксперименты со словарями и генерацией текста в целом.
[username1] зазевался и [username2] что есть сил врезал в область паха соперника. В результате чего [username1] получил травму: закрытый перелом <вырезано цензурой>
В квестовом движке QSP вроде бы есть встроенная библиотека, похожая на вашу. Если честно думал, увидеть прям генератор рассказов. Допустим в игре каждый день нужен свежий выпуск газеты, с фейковыми новостями.
Если честно думал, увидеть прям генератор рассказов.

Специфика немного не та — большие тексты читать никто не будет.

При создании героя, генерируется его биография. Вот такая примерно:

Когда-то давно, в дварфовских горах, родилась девочка Тара.

Отец Тары был ремесленником, самым обычным горожанином. И дочь воспитывал вполне соответствующие – хорошей девочкой, которая стала бы хорошей невестой: доброй, заботливой, честной и прилежной… Но судьба распорядилась по-своему.

Юная Тара боролась за сердце богатого мужчины. Конкуренток было много, и одна из них написала в стражу донос на Тару — якобы та занимается демонологией и некромантией без разрешения властей… Тара действительно немного владела магией, но в упомянутом никогда не была виновна. Однако, стража убедила суд в обратном. Когда девушка воскресилась после позорной публичной казни, оказавшись бессмертной героиней, то узнала, что мужчина тот уже сыграл свадьбу — взял в жёны другую. А написавшая донос пропала неведомо куда. Таре следовало забыть о прежней жизни. Отныне её ждала совершенно особенная судьба.


Создаётся из трёх независимых кусков, каждый из которых подбирается под параметры героя.

Генерировать что-то бОльшее особого смысла нет, так как шаблонность игроки всё-равно видеть будут.
а не думали попробовать марковские цепи?
Вы их для определения формы слова предлагаете или для полной генерации текстов?

Если для полной генерации, то это будет издевательство над пользователями — ничего осмысленного они не дадут.

Если для опредления формы слова по предыдущим словам, то в более линейном языке (например английском) они, может, и сработали бы. А русские предложения нелинейны (в том смысле, что зависимые слова могут быть разнесены по разным концам предложения). Соответветственно, модель не сможет правильно подобрать слова. Кроме того, тексты предполагаются художественным (значит ожидается исспользование редкоупотребимых слов и словосочетаний), что помешает набрать статистику для марковских цепей.
я имел в виду генерацию текста
мы вот пробовали конечно небольшие тайтлы генерить с помощью цепей, получить более-менее, но конечно есть гепы
но все равно интересно было бы посмотреть
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории