Bewertung von MT-Systemen aus Benutzersicht:
Evaluierung im Projekt MIROSLAV
Jutta Marx

 
Der Beitrag stellt das Evaluierungskonzept im Projekt MIROSLAV (Machine Translation Initiative for Russian and other Slavic Languages) vor, dessen Ziel u.a. in der Bewertung des maschinellen Übersetzungssystems T1 Russisch-Deutsch besteht. Maßgeblich ist hierbei die streng benutzerorientierte Sichtweise, die das Gesamtkonzept prägt und keine generelle, globale Bewertung von T1 versucht, sondern konkrete Aussagen über dessen Nutzbarkeit für einen spezifischen Benutzer in einer spezifischen Anwendungssituation zur Bewältigung einer spezifischen Aufgabe anstrebt. So werden bspw. bei der linguistischen Fehleranalyse nur diejenigen Fehler berücksichtigt, die starke Auswirkungen auf das Textverständnis haben, da nur solche Faktoren den Benutzer der Anwendungsdomäne (d.i. die Berliner Außenstelle der Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen, kurz: GESIS) des Projekts interessieren. Die strikte Benutzerorientierung spiegelt sich auch in der Tatsache wider, daß sowohl Übersetzungsqualität als auch -produktivität untersucht werden, da beide Faktoren von entscheidender Bedeutung für die Brauchbarkeit eines solchen Systems sind und je nach Einsatzgebiet unterschiedlich gewichtet werden müssen.

Das Evaluierungskonzept ist hierarchisch aufgebaut und wird schrittweise von der Analyse des Benutzerbedürfnisses und der zu bewältigenden Arbeitsaufgabe bis hin zum konkreten Testdesign verfeinert. Der Methodenkatalog ist breit gefächert (indirekte Evaluierung, Rating-Verfahren, Benutzertests etc.) und schöpft damit die im Bereich der MÜ-Evaluierung und der Softwareergonomie wichtigsten Verfahren aus.