dinsdag 24 mei 2011

Corpus met geannoteerde Engelse zinnen

Ik heb net 598 Engelse voorbeeldzinnen uit het handboek 'Snel en vlot grammatica Engels' geannoteerd. De bedoeling is om met dergelijk XML-corpus van geannoteerde zinnen de grammaticacontrole in onze taalsoftware te verbeteren. Een XML gebaseerd corpus van geannoteerde Engelse en Nederlandse zinnen zal het makkelijker maken om nieuwe grammaticaregels in onze taalsoftware in te bouwen en onze vertaalsoftware te verbeteren.

De bedoeling is om nu dezelfde oefening te herhalen voor de Nederlandse grammatica. Op deze manier wil ik ook vaststellen of een gemeenschappelijk annotatieschema voor zowel de Engelse als de Nederlandse grammaticaregels mogelijk is.