dinsdag 14 juni 2011

Corpus met geannoteerde Nederlandse zinnen

Ik heb net 951 Nederlandse voorbeeldzinnen geannoteerd. De voorbeeldzinnen zijn afkomstig uit het handboek 'Grammatica Nederlands' en van de website Dutch Grammar. De bedoeling is om met dergelijk XML-corpus van geannoteerde zinnen de grammaticacontrole in onze taalsoftware te verbeteren.

De gebruikte annotaties zijn grotendeels dezelfde als voor het Engels. De voornaamste verschillen zijn het gebruik van bijwoorden als scheidbaar deel van werkwoorden en de ehb-tag (er, hier, daar).