Microsoft: Wenn die KI-Übersetzung scheitert und die Deutsche Bahn ins Spiel kommt – Teil 1

Stop - Pixabay

Admin-Passwörter schützen mit Windows LAPS. eBook jetzt herunterladen » (Anzeige)

Microsoft steht ja vor dem Problem, dass es seine  Produkte und damit auch die Dokumentation in verschiedenen Sprachen bereitstellen muss. Bereits bei der Lokalisierung von Windows oder anderen Produkten geht einiges schief, obwohl da noch Menschen drüber schauen sollten. Wo der Nutzer aber gänzlich verloren geht, sind die maschinellen Übersetzungen von Support-Beiträgen. Ich versuche gewohnheitsmäßig die englischen Support-Beiträge zu lesen, und liege wohl wieder richtig, wie der neueste Flop, auf den mich ein Leser hingewiesen hat, aufzeigt. Der Fall zeigt exemplarisch die Gefahr der KI-Unterstützung, die uns auch in vielen anderen Bereichen droht. Ich habe daher das Thema mal in Teil 1 zum konkreten Beispiel und mit einigen Informationen sowie Gedanken in Teil 2 aufbereitet.

Maschinelle Textübersetzungen

Bei Textübersetzungen sind Lösungen, die auf AI (LLMs, Sprachmodelle) setzen, inzwischen ganz gut. Auch ich lasse mich gerne durch Deepl oder Google Translate unterstützen – entweder, um zu überprüfen, ob ich einen englischsprachigen Text beim Lesen richtig verstanden habe, oder um einen Text in einer mir fremden Sprache überhaupt zu verstehen. Und ich nutze Deepl, um englische Rohtexte zu verfassen.

Ergebnisse müssen überprüft werden!

Eine der Lehren aus diesen Ansätzen ist aber, dass man das Ergebnis sehr kritisch überprüfen sollte oder muss. Auch wenn Deepl sehr gut ist, staune ich immer wieder, was da übersetzt wird. Manchmal ist es nach meinem Empfinden genial, aber es gibt Fälle, wo die Übersetzung total in die Hose geht.

Wenn der Kontext nicht beachtet wird

Ein riesiges Problem ist, dass die Sprachmodelle den Kontext der Originaltexte nicht verstehen und eine scheinbar formal korrekte Übersetzung anfertigen. Diese macht dann aber im Kontext des behandelten Sachgebiets weniger Sinn, weil Begriffe nicht stimmig oder einfach nicht im Gebrauch sind.

Wenn dann das LLM noch dichtet

Bei Sprachmodellen kommt dann noch eine weitere Komponente hinzu: Diese neigen dazu, bestimmte Begriffe zu interpretieren und dann umzusetzen. Es ist genial, wenn ein DSGVO korrekt in den englischsprachigen Begriff GDPR übersetzt wird. Und manchmal staune ich, wie Deepl Abkürzungen aus dem amerikanischen englisch in deutsche Begriffe umsetzt – oft geht es gut, manchmal liegt das Ergebnis aber daneben.

Betrifft auch von Menschen angefertigte Übersetzungen

Dieses Übel ist mir in den letzten 45 Jahren immer wieder, auch bei menschlichen  Übersetzungen begegnet. Anfang der 80er Jahre musste ich in die Welt der Mikroprozessorprogrammierung einsteigen. Beim Arbeitgeber gab es jede Menge deutsche Handbücher von Siemens, in denen Mikroprozessorkomponenten und -Bauteile von Intel und anderen Herstellern, die wir einsetzten, beschrieben waren.

Das hatten sehr fitte deutsche Übersetzer angefertigt, alles war perfekt und auf Siemens-Nomenklatur abgestimmt. Ich erinnere mich, dass ich Stunden saß und versuchte, die deutschen Beschreibungen zu einem Interrupt-Controller oder einem UART-Baustein zu verstehen – denn ich musste diese Bauteile teilweise in Maschinensprache zum Initialisieren ansprechen und in zu schreibende Software einbinden. Auch nach mehrmaligem Lesen war mir nicht klar, was gemeint war.

Ende vom Lied war, dass ich nach zwei, drei Stunden frustriert aufstand und durch die Räume der Abteilung wanderte, um bei Kollegen nachzufragen, ob man vielleicht die Originaldokumentation von Intel irgendwo habe. Sah zuerst schlecht aus, überall standen die rot-weißen Siemens-Handbücher. Bis ich dann zu einem älteren Kollegen kam, der auf eine Reihe blauer Ordner mit der Aufschrift Intel deutete: "Da steht die Intel-Dokumentation, kannst Du dir ausleihen, benutzt eh keiner, wie haben ja die deutschen Siemens-Übersetzungen". Ich habe mir die Ordner gegriffen und hatte mein Aha-Erlebnis: Es reichte den englischsprachigen Text einmalig zu lesen, um zu verstehen, was Sache war.

Seit dieser Zeit versuche ich IT-Beschreibungen in der englischen Originalfassung zu lesen und greife hilfsweise auf deutsche Übersetzungen zurück, um das Verständnis zu überprüfen. Ähnliche Erfahrungen habe ich in den letzten 32 Jahren gemacht, wenn professionelle Übersetzer Manuskripte meiner Bücher in englisch übersetzten. Das Ergebnis war in der Regel gut, aber wenn sich eine "Stilblüte" einschlich, kam diese wiederholt vor.

Kontrolle ist wichtig

Ich habe gelernt, dass man die Ergebnisse einer (maschinellen) Übersetzung nochmals mit "Sinn-und-Verstand" gegen lesen muss. Allerdings habe ich als Vielschreiber auch die negative Erfahrung gemacht, dass einerseits Fähigkeiten verloren gehen, wenn man auf maschinelle Übersetzungshilfe zurück greift. Es wird alles scheinbar leichter und geht schneller von der Hand, aber das tägliche Üben fehlt und das Textverständnis beim Lesen fremdsprachiger Texte nimmt ab.

Eine neue KI-Übersetzungsblüte

Bei Microsoft nimmt das Problem nochmals eine andere Dimension an. Das Unternehmen hat ja vor langer Zeit beschlossen, seine Online-Dokumentation abseits der englischen Sprache durch maschinelle Übersetzungen bereitzustellen oder bei bestimmten Themen generell auf Übersetzungen zu verzichten. Blog-Leser Martin E. hat mich die Tage auf eine besondere Übersetzungsblüte aufmerksam gemacht, die sehr gut das Problem verdeutlicht. Eine Übersetzung geht im Kontext schief, aber dann macht ein Sprachmodell noch eigenständig etwas ganz anderes, sinnentstellendes daraus.

UEFI-Anforderungen für Secure Boot (English)

Obiger Screenshot zeigt die englischsprachige Originalfassung dieses Supportbeitrags, der die Anforderungen für die UEFI Secure Boot-Konfiguration für Windows 11 25H2 beschreibt. Die Tabellen zeichnen sich dadurch aus, dass dort viele Abkürzungen wie DB (Data Base), PK (Platform Key), und KEK (Key Exchange Key) enthalten sind.

Deutsche Übersetzung der UEFI-Secure Boot-Anforderungen

Die maschinensprachliche Übersetzung in deutsch sieht auf den ersten Blick gut aus, geht aber für Fachleute erkennbar schief, wie obiger Screenshot zeigt. Die meisten Begriffe aus den Tabellen hat der maschinelle Übersetzer bzw. dessen LLM nicht angetastet. Aber beim Kürzel DB hat dann das Sprachmodell angeschlagen und geschlussfolgert, dass damit die Deutsche Bahn gemeint sein muss – ist natürlich total in die Hose gegangen.

Artikelreihe:
Microsoft : Wenn die KI-Übersetzung scheitert und die Deutsche Bahn ins Spiel kommt – Teil 1
Technische Hypotheken: Muss die KI-Revolution ausfallen? – Teil 2

Dieser Beitrag wurde unter AI, Problem abgelegt und mit , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

22 Antworten zu Microsoft: Wenn die KI-Übersetzung scheitert und die Deutsche Bahn ins Spiel kommt – Teil 1

  1. Bernd Bachmann sagt:

    Dass die maschinengenerierte Übersetzung auf den ersten Blick gut aussehen soll, kann ich gar nicht nachvollziehen. Beide Sätze sind grammatischer Schwachsinn und ergeben inhaltlich keinen Sinn bzw. sagen etwas ganz anderes aus als das englische Original.

    • Günter Born sagt:

      Sieh es mir nach – mit 8 1/2 Volksschule und mehr als "Schmalspur-Abi" (Abi-Äquivalent wurde mir erst mit FH-Abschluss anerkannt) mache ich Gen-Z in Sachen Grammatik alle Ehre – für mich sieht die Übersetzung gut aus!

      Und wer gönnt sich schon die Feinheit und legt sich die Originalfassung neben die Übersetzung – so, wie oben passiert?

      PS: Und ich habe Legastheniker in der Familie, die beim besten Willen und größter Anstrengung an deinem Test scheitern würden …

      • Gast sagt:

        Mir, Gen. X mit englisch als zweiter Fremdsprache, rollen sich die Fußnägel auf, wen ich sehe, was Gen. Z, die Englisch manchmal schon im Kindergarten lernt, so auf Englisch raushaut im Ticketsystem.

        Leute, die Anfang der 60er auf dem Land aufgewachsen sind, haben es da viel schwerer und fragen, was Pizza TOGO mit dem Land in Afrika zu tun hat.

    • Patrick sagt:

      Ich würde immer noch von grammatikalischen Unzulänglichkeiten schreiben, aber ich denke selbständig. (Mit der KI werden wohl immer mehr Menschen den Bezug zur Sprache ganz verlieren.)

  2. HackIT0 sagt:

    Gut zu wissen, daß die "Deutsche Bahn" die UEFI-Zertifikate ausstellt. Gleich mal beim Pressesprecher nachfragen … 🤣 (LOL) Eine Überprüfung der Supportartikel wäre ja sinnvoll, aber vieleicht hat man ja schon die zuständigen Mitarbeiter entlassen und dafür die halozinierende KI eingestellt.

  3. MaxM sagt:

    Auch für mich ist die Übersetzung kein korrekter deutsche Satz:
    "OEMs müssen sicherstellen, dass die UEFI-Konfiguration für den sicheren Start bereitgestellt und auf Windows 11-, 25H2-Geräten mit vorinstallierten Windows folgendes umfasst:"

    Mein Vorschlag:
    OEMs müssen sicherstellen, dass die UEFI-Konfiguration für den sicheren Start, die auf Windows 11-25H2-Geräten mit vorinstalliertem Windows bereitgestellt und verteilt wird, folgendes umfasst:

    Die Past Participle-Konstruktionen "provisioned and shipped" gibt man im Deutschen am besten über einen eingeschobenen Relativsatz wieder.

    • Bernd Bachmann sagt:

      Genau. Hinter dem „bereitgestellt" fehlt (z.B.) ein „wird"; ohne das ist es grammatischer Unfug. Und im englischen Original muss nicht sichergestellt werden, dass da eine Konfiguration bereitgestellt wird, sondern dass die (selbstverständlich) bereitgestellte Konfiguration etwas Bestimmtes beinhaltet.

      Und die englische Komma-Konstruktion im zweiten Satz funktioniert auf deutsch so nicht, sondern bedürfte z.B. eines „oder" statt des Kommas hinter Linux. Und statt „erfordern" müsste „erfordert" stehen. Und „to ship" bedeutet hier natürlich nicht „versenden", sondern meinetwegen wie im ersten Satz „verteilen", oder vielleicht noch besser „ausliefern".

      Ist doch nicht so schwierig, sollte man denken.

      • MaxM sagt:

        @Bernd Bachmann: Erstmal danke für die Bestätigung der falschen Übersetzung.

        "nicht so schwierig": Da wäre ich vorsichtig in der Beurteilung. Viele meiner Geschäftskollegen, die glauben, ein passables Englisch zu sprechen, wären wahrscheinlich überfordert ;-)

  4. Kai sagt:

    Bei uns wird gerade, aus politisch motivierten Gründen, Microsoft 365 ausgerollt. Schon beim ersten Produkt, der Office-Suite (Microsoft 365 Apps vor Enterprise), dürfen die Nutzer direkt feststellen, wie qualitativ hochwertig Microsoft seine Produkte mittlerweile gestaltet. Einige Wochen lang konnte man im Office.com Portal auf deutsch das "Büro herunterladen". Seit ein paar Tagen hat Microsoft wohl festgestellt, dass es da einige Übersetzungsfehler gab. Mittlerweile steht dort "App installieren". Etwas peinlich, wenn man sein beliebtestes Produkt den Kunden auf diese Art und Weise anpreist.

    • User007 sagt:

      Ist das wirklich 'ne die Qualität betreffende Sache – die Funktionalität ist doch nicht eingeschränkt bzw. nicht mehr vorhanden, oder?
      Also ist das vllt. doch eher nur eine "Nebensächlichkeit" aus der Betrachtung mit der deutschen Brille, denn das Produkt wird nunmal in englischer Sprachversion hergestellt und überwiegend vertrieben.
      Und ob das wirklich das "beliebteste Produkt" ist, ist sehr fraglich. 🤷‍♂️

    • Anonym sagt:

      Das kommt, wenn man Übersetzer rauswirft und alles die KI machen lässt…

  5. Stefan Schmiedl sagt:

    Ich hab noch schwammige Erinnerungen an den Englisch-Unterricht, wo mal viel Zeit investiert wurde in "may", "may not", "must" und "must not". Die Warnungen des Lehrers, dass "must not" _nicht_ "muss nicht" ist, hallen jetzt noch kräftig nach.

    Ich weiß auch noch, dass mich Ende der 90-er ein "muss nicht" in einem Access-Dialogfeld mal einen halben Nachmittag gekostet hat, bevor ich drauf gekommen bin, dass das im Original wohl ein "must not" gewesen sein muss.

    Schlechte Übersetzungen haben Tradition, die sind ein Kulturgut und dürfen nicht weg :-)

  6. Daniel sagt:

    Ich erinnere mich noch an Siemens-Anleitungen, die von Menschen übersetzt waren aber völlig unverständlich waren ("stecken sie die Recheneinheit in die Steckdose der Hauptbaugruppe"). Gemeint war die CPU in den Sockel des Mainboard zu stecken.

    Unverständliche Anleitungen gab es schon immer, auch ohne KI.

    • Anonym sagt:

      Ja, da war einiges … von fachfremden Menschen übersetzt … mit entspr. Ergebnis.

      • Gast sagt:

        Ich hatte einen Kasten für meine "schlappigen Platten" (Floppy Disk).
        Bei meinem mechanischen Plattenspieler sollte ich den Tonarm 7 mal um seine Achse drehen (Plattenteller)
        Microsoft erzählte in den Docs etwas von Benutzer-Dosen:
        "The user cans do something" (statt "the users can") wurde zu "Die Benutzer-Dosen" statt "die Benutzer können"
        Ist wohl korrigiert, ich finde es nicht mehr.

  7. Martin sagt:

    Was habe ich mich schon über die Ergebnisse von YouTubes Echtzeit-Übersetzung der Untertitel geärgert. Da muss man zur Kontrolle immer das Untertitelskript mit einblenden lassen. Das Seltsame: Kopiert man einen völlig falsch übersetzten Untertitel und fügt diesen dann auf der Website von Google-Translate ein, ist es dort oft besser oder sogar vollkommen richtig. YouTube hat eine angepasste Engine, die aber fast immer deutlich schlechter ist, als das Original der Konzernmutter.

    Aber jetzt, wo die automatische Übersetzung seit Mitte August praktisch gar nicht mehr funktioniert und man massive Klimmzüge machen muss, um sie zum Arbeiten zu bewegen, fehlt sie mir doch. Vor allem, weil selbst asiatische TV-Giganten, deren Kanäle beispielsweise 19,5 Mio. Abonennten haben und die ihre Serien hochladen, inzwischen grausig schlechte englische Untertitel haben (falsche/fehlende Pronomen und Satzschlusszeichen, Slang, kaputtes Timing), sodass man auf französische (die von einer Fanseite erstellt werden) umschalten muss und deshalb dann unbedingt die automatische Übersetzung nötig ist. Bis vor 2 Jahren waren die englischen Untertitel desselben TV-Produzenten noch nahezu perfekt! Die haben jetzt wohl einen billigeren Übersetzer eingestellt, oder es macht jetzt der Sohn vom Assistenten des Chefs. Aber sehr viele verwenden nur noch maschinell übersetzte Untertitel, was bei thailändisch zu englisch nicht funktionieren kann.

    Manchmal hilft es , IPv6 im Firefox zu deaktivieren:
    about:config
    network.dns.disableIPv6 = true
    Aber selbst dann muss man die Seite mehrfach mit Strg+F5 neu laden und die Übersetzung mehrfach deaktivieren und neu einstellen. Dazu muss das Video nicht laufen. Wenn nach dem Einstellen links oben im Bild kein Hinweis auf die Übersetzung kommt, funktioniert sie garantiert nicht. Schaltet man sie dann kurz aus und wieder ein (C oder Button), ist sie meist auf die Quellsprache zurückgesetzt, was mit entsprechender Bildschirmeinblendung quittiert wird. Falls nichts eingeblendet wurde und laut Menüeintrag die Übersetzung noch eingestellt ist, sollte man einige Male für 5 Sekunden auf der C-Taste bleiben, denn manchmal kommt dann im Bildschirm der Hinweis auf die Übersetzung und dann funktioniert sie auch. Falls das nicht hilft, muss man die Seite neu laden.

    Falls es partout nicht funktionieren will: VPN über San José oder Tokio funktioniert noch am häufigsten. Niederlande mag Google/YT gar nicht, da muss man immer bestätigen, dass man kein Bot ist. Aber ich hatte auch schon Tage, da half auch kein VPN, sondern nur noch Tor, aber da meckert Google/YT dann, dass das Video nicht verfügbar sei oder man sich anmelden müsse, damit man sehe, dass man kein Bot sei, was man natürlich nicht tun sollte. Einfach so lange eine neue Tor-Verbindung suchen, bis es geht.

    Mutmaßung: Google macht mit seinen Versuchen, fremde KI-Crawler und vermutlich Account-Sharing und günstige Auslands-Abos zu verhindern, alles kaputt!

    https://support.google.com/youtube/thread/368737344/
    https://support.google.com/youtube/thread/368742704/

    • Martin sagt:

      Ich hatte nun DNS over HTTP/TLS in Verdacht und es scheint tatsächlich das Problem zu sein.
      Mit dem base.dns.mullvad.net/dns-query funktioniert es praktisch gar nicht, mit dem in Firefox mitgelieferten NextDNS funktioniert zwar FR-DE aber EN-DE nicht. Interessanterweise funktioniert beides nicht mal mit dem Firefox-Standard Cloudflare!

      Deshalb habe ich DoH im Firefox nun deaktiviert und nutze über den Router adguard. In Brave und Vivaldi bleibt mullvad als DoH drin.

  8. EDV-Opa sagt:

    Ich bin da letztens auch über KI Übersetzungen beim Microsoft Admin Portal gestolpert. Ich habe einfach nicht daran gedacht und wie blöde nach dem Download für das Office 365 Paket gesucht. Alle Links und Anleitungen führten mich irgendwie nicht zum Ziel, keine Spur vom Office Paket. Bis ich begriffen habe, das Microsoft ihr eigenes Produkt als 'Büro' übersetzt hat. Da gab es dann den Link 'Büro installieren' … aha …

  9. aus dem Rhein-Main Gebiet sagt:

    Bei Microsoft werden sogar die *Parameter* von *Befehlen* übersetzt. Zum Beispiel bei *PowerShell* oder *WinGet*. Hatte das schon bei Administrator.de gemeldet:
    https://administrator.de/info/microsoft-winget-uebersetzung-ki-674525.html#comment-674525

    Hier der Link zu WinGet show
    https://learn.microsoft.com/de-de/windows/package-manager/winget/show#usage

    oder WinGet Upgrade (da ist es noch schlimmer
    https://learn.microsoft.com/de-de/windows/package-manager/winget/upgrade
    * –Gewohnheit
    * –akzeptiere-Paketvereinbarungen

    Das man wortgetreu bzw. buchstabengenau übersetzt, ist schon sehr sehr dünn (um es mal vornehm zu sagen). Liest da keiner drüber?

Schreibe einen Kommentar zu Bernd Bachmann Antwort abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Hinweis: Bitte beachtet die Regeln zum Kommentieren im Blog (Erstkommentare und Verlinktes landet in der Moderation, gebe ich alle paar Stunden frei, SEO-Posts/SPAM lösche ich rigoros. Kommentare abseits des Themas bitte unter Diskussion. Kommentare, die gegen die Regeln verstoßen, werden rigoros gelöscht.

Du findest den Blog gut, hast aber Werbung geblockt? Du kannst diesen Blog auch durch eine Spende unterstützen.