
05.02.2010, 17:29
|
|
Участник форума
Регистрация: 21.02.2008
Сообщений: 255
Провел на форуме: 975514
Репутация:
177
|
|
кроме словарной базы попробуй использовать шаблоны предложений.
к примеру такие: %сущ% %прил% %глагол% %прил% %сущ%
что при переводе в текстовый вид получается так: спгпс
чтоб не хранить стопицот миллиардов шаблонов, из шаблонов надо делать регэкспы.
такие к примеру: сп?гпс
но ещё есть знаки препинания)
попробуй ввести несколько типов данных: буква, слог, слово, словосочетание, предложение и т.д.
из типов данных строятся более сложные структуры, по которым определяются типы предложений. чем больше шаблонов и информации в представленных типах данных тем "умнее" твой код - т.е. шанс распознания больше.
хоть такой подход и прост, он совсем не подходит даже для слабого ИИ, потому что текстовое представление данных (буква=символ) ОЧЕНЬ ограничит твою программу
|
|
|