Пишу семантико-синтаксический парсер для русского языка, основанный на правилах/шаблонах/фреймах. Получаю морфологическую информацию каждого токена в запросе, а затем к массиву этих данных применяю правила (фреймы), для определения семантических связей в запросе. Собственно, нужны эти правила, в любом доступном скрипту формате (xml, sql, etc..).
Пример правил:
Глагол(личн., нв.з., действ.) -> Сущ. (им. п, ед.ч.)
Я ни разу не лингвист и даже не фиолог, но думаю что подобных правил будет несколько десятков, и написание их всех требует высокого уровня владения языком, кое у меня ограничено школьными знаниями, которые за 7 лет уже порядком подзабыты. Может кто делал похожее, и у кого то есть такие данные? Поделитесь, буду очень благодарен.