Im Rahmen der Evaluation kommerzieller maschineller Übersetzungssysteme (Personal Translator plus 98 von linguatec und IBM, PowerTranslator 6.5 von Globalink, Logos 7.8.3, SystranPRO 2.0, T1 von Langenscheidt und Transcend von Intergraph) sind die morphosyntaktischen Besonderheiten instruktiver Texte Bestandteil der ausgewählten grammatischen Phänomene, anhand derer die Frage nach der linguistischen Performanz der sechs untersuchten Systeme beantwortet werden soll.
Das für die Evaluierung sprachlicher Instruktionsformen erstellte Testkorpus, das die verschiedenen Realisierungen der in geschriebenen englischen Instruktionstexten auftretenden morphosyntaktischen Formen umfaßt, setzt sich aus Installationsanleitungen aus Softwarehandbüchern, Hardware-Bedienungsanleitungen sowie aus Automobil-Reparaturanweisungen zusammen. Die Imperative, die den Löwenanteil der verbalen Instruktionsformen im Englischen ausmachen, wurden nach ihrem Auftreten in syntaktischen Strukturen untergliedert, so daß in parataktischen Strukturen vor allem die Koordination mit and und bei hypotaktischen Strukturen finale, temporale und konditionale Nebensätze bei der Evaluierung Berücksichtigung finden. Darüber hinaus wurden auch andere morphosyntaktische Formen mit instruktiver Funktion sowie textsortentypische Erscheinungen wie Aufzählungen in die Testsuite aufgenommen.
Da der englische Imperativ im deutschen sowohl imperativisch als auch infinitivisch wiedergegeben werden kann, spielt bei der Bewertung der Systeme bereits eine erste Rolle, ob sie alternativ beide Entsprechungen des englischen Imperativs realisieren können, was drei der getesteten Systeme (Personal Translator plus 98, T1 und Logos) ermöglichen. In der vierstufigen Bewertungsskala bezeichnen die Bewertungen (1) "Testsatz oder -phrase ist korrekt übersetzt" und (2) "Phänomen ist korrekt übersetzt" all jene Sätze, in denen das jeweils untersuchte Phänomen korrekt ins Deutsche übersetzt wurde. Die so definierte Korrektheit der Übersetzung liegt – bezogen auf das gesamte Testkorpus – summa summarum zwischen 61% und 88%, wobei Logos und Personal Translator plus 98 die Liste der Systeme anführen. Abhängig vom Sachgebiet und den einzelnen Phänomenen sowie bei Betrachtung der vollständig korrekt übersetzten Testsätze ergibt sich allerdings ein differenzierteres Bewertungsbild, was für die gewählte phänomenbezogene linguistische Form der Evaluierung im Unterschied zu einem hier nicht differenzierenden Systemvergleich spricht.