Papiere und Veröffentlichungen

Symbolsuche

Über Systran

SYSTRAN verfügt über mehr als 50 Jahre Erfahrung in Übersetzungstechnologien und leistet Pionierarbeit bei den größten Innovationen in diesem Bereich. Dazu gehören die ersten webbasierten Übersetzungsportale und die ersten neuronalen Übersetzungsmodule, die künstliche Intelligenz und neuronale Netzwerke für Unternehmen und öffentliche Organisationen kombinieren.

SYSTRAN stellt Geschäftskunden hoch entwickelte und sichere automatisierte Übersetzungslösungen in verschiedenen Bereichen zur Verfügung, wie z. B. globale Zusammenarbeit, Erstellung mehrsprachiger Inhalte, Kundensupport, elektronische Ermittlungen, Big Data-Analyse, E-Commerce, etc. SYSTRAN bietet eine maßgeschneiderte Lösung mit einer offenen und skalierbaren Architektur, die eine nahtlose Integration in bestehende Anwendungen und IT-Infrastrukturen von Drittanbietern ermöglicht.

Rosetta-LSF: Ein abgestimmtes Corpus aus französischer Gebärdensprache und Französisch für Text-zu-Zeichen-Übersetzung

Rosetta-LSF: Ein abgestimmtes Corpus aus französischer Gebärdensprache und Französisch für Text-zu-Zeichen-Übersetzung

Elise Bertin-Lemée, Annelies Braffort, Camille Challant, Claire Danet, Boris Dauriac, Michael Filhol, Emmanuella Martinod, Jérémie Segouat.

13th Conference on Language Resources and Evaluation (LREC 2022), Juni 2022, Marseille, Frankreich.

Gemeinsame Generierung von Untertiteln und Untertiteln mit Dual-Decodierung

Gemeinsame Generierung von Untertiteln und Untertiteln mit Dual-Decodierung

Da immer mehr audiovisuelle Inhalte produziert werden, erscheint die Entwicklung automatischer Lösungen für Untertitelung und Untertitelung, die den Erwartungen eines wachsenden internationalen Publikums gerecht werden, als einzig gangbare Möglichkeit, den Durchsatz zu steigern und die damit verbundenen Postproduktionskosten zu senken. Automatische Untertitel und Untertitelung müssen oft eng miteinander verflochten sein, um ein angemessenes Niveau zu erreichen ... Fortsetzung

In: Proceedings of the 19th International Conference on Spoken Language Translation (IWSLT 2022), May 2022, Dublin, Ireland

SYSTRAN @ WMT 2021: Terminologieaufgabe

SYSTRAN @ WMT 2021: Terminologieaufgabe

In diesem Dokument werden SYSTRAN-Einreichungen für die gemeinsame Terminologieaufgabe von WMT 2021 beschrieben. Wir arbeiten in der Übersetzungsrichtung Englisch-Französisch mit einem Standard-Transformer-neuronalen maschinellen Übersetzungsnetzwerk, das wir mit der Möglichkeit verbessern, Terminologiebeschränkungen dynamisch einzubeziehen, eine sehr gängige industrielle Praxis. Es werden zwei dem Stand der Technik entsprechende Methoden zur Terminologieeinfügung auf der Grundlage von (i) der Verwendung ... Fortsetzung

MinhQuang Pham, Antoine Senellart, Dan Berrebbi, Josep Crego, Jean Senellart

In: Proceedings of the Sixth Conference on Machine Translation (WMT), Online, November 10-11, 2021

Überprüfung der maschinellen Übersetzung für mehrere Domänen

Überprüfung der maschinellen Übersetzung für mehrere Domänen

Beim Aufbau von maschinellen Übersetzungssystemen ist es häufig erforderlich, das Beste aus heterogenen Sätzen paralleler Daten in Schulungen zu machen und Eingaben aus unerwarteten Bereichen beim Testen robust zu handhaben. Dieses Multi-Domain-Szenario hat eine Menge von aktuellen Arbeiten angezogen, die unter den allgemeinen Dach des Transfer-Learning fallen. In dieser Studie besprechen wir... Fortsetzung

MinhQuang Pham, Josep Maria Crego, François Yvon

Transaktionen der Association for Computational Linguistics 9: 17-35, 1. Februar 2021

Integration von Domänenterminologie in die neuronale maschinelle Übersetzung

Integration von Domänenterminologie in die neuronale maschinelle Übersetzung

Dieses Dokument erweitert bestehende Arbeiten zur Terminologieintegration in neuronale maschinelle Übersetzung, eine gängige industrielle Praxis zur dynamischen Anpassung von Übersetzungen an einen bestimmten Bereich. Unsere Methode, die auf der Verwendung von Platzhaltern basiert, die durch morphosyntaktische Annotation ergänzt werden, nutzt effizient die Fähigkeit des neuronalen Netzes, mit symbolischem Wissen umzugehen, um die Oberflächenverallgemeinerung zu übertreffen... Fortsetzung

Elise Michon, Josep Maria Crego, Jean Senellart

In: Proceedings of the 28th International Conference on Computational Linguistics, December 2020

Eine Studie zu Restadaptern für neuronale Mehrdomänen-Maschinentransformation

Eine Studie zu Restadaptern für neuronale Mehrdomänen-Maschinentransformation

Domain-Anpassung ist ein altes und ärgerliches Problem für maschinelle Übersetzungs-Systeme. Der häufigste Ansatz und erfolgreichste Ansatz für die überwachte Anpassung ist die Feinabstimmung eines Basissystems mit in-domänenparallelen Daten. Durch die standardmäßige Feinabstimmung werden jedoch alle Netzwerkparameter geändert, sodass dieser Ansatz rechnerisch aufwändig und anfällig für Überanpassung ist. Ein moderner, schlanker Ansatz ergänzt stattdessen ... Fortsetzung

MinhQuang Pham, Josep Maria Crego, François Yvon, Jean Senellart

Tagungen der fünften Konferenz zur maschinellen Übersetzung, November 2020

Priming Neural Machine Translation

Priming Neural Machine Translation

Priming ist ein bekanntes und studiertes psychologisches Phänomen, das auf der vorherigen Präsentation eines Reizes (Stichwort) basiert, um die Verarbeitung einer Reaktion zu beeinflussen. In diesem Papier schlagen wir ein Framework vor, um den Prozess des Priming im Kontext der neuronalen maschinellen Übersetzung (NMT) nachzuahmen. Wir bewerten den Effekt ähnlicher Übersetzungen als ... Fortsetzung

MinhQuang Pham, Jitao Xu, Josep Maria Crego, François Yvon, Jean Senellart

Tagungen der fünften Konferenz zur maschinellen Übersetzung, November 2020

Effiziente und qualitativ hochwertige neuronale maschinelle Übersetzung mit OpenNMT

Effiziente und qualitativ hochwertige neuronale maschinelle Übersetzung mit OpenNMT

Dieses Dokument beschreibt die OpenNMT-Einreichungen für die gemeinsam genutzte WNGT 2020-Effizienzaufgabe. Wir untersuchen das Training und die Beschleunigung von Transformatormodellen mit verschiedenen Größen, die in einem Lehrer-Schüler-Setup trainiert werden. Wir präsentieren außerdem eine benutzerdefinierte und optimierte C++-Inferenzengine, die eine schnelle CPU- und GPU-Decodierung mit wenigen Abhängigkeiten ermöglicht. Durch Kombination zusätzlicher Optimierungen ... Fortsetzung

Guillaume Klein, Dakun Zhang, Clément Chouteau, Josep Crego, Jean Senellart

Proceedings of the Fourth Workshop on Neural Generation and Translation, Seiten 211-217, Association for Computational Linguistics, Juli 2020

Förderung der neuronalen maschinellen Übersetzung mit ähnlichen Übersetzungen

Förderung der neuronalen maschinellen Übersetzung mit ähnlichen Übersetzungen

In dieser Präsentation werden Methoden zur Datenaugmentierung bei der neuronalen maschinellen Übersetzung vorgestellt, um ähnliche Übersetzungen in vergleichbarer Weise zu nutzen, wie ein menschlicher Übersetzer Fuzzy Matches verwendet. Wir zeigen, wie wir das neuronale Modell einfach mit Informationen sowohl über die Quell- als auch über die Zielseite der Fuzzy-Matches füttern, und wir erweitern die Ähnlichkeit um ... Fortsetzung

Jitao Xu, Josep Crego, Jean Senellart

In: Proceedings of the Sixth Conference on Machine Translation (WMT), Online, November 10-11, 2021

Allgemeine und spezialisierte Word-Einbettungen für die maschinelle Übersetzung mehrerer Domänen

Allgemeine und spezialisierte Word-Einbettungen für die maschinelle Übersetzung mehrerer Domänen

Die überwachte maschinelle Übersetzung funktioniert gut, wenn Zug- und Testdaten aus derselben Verteilung abgetastet werden. Wenn dies nicht der Fall ist, tragen Anpassungstechniken dazu bei, dass das Wissen, das von außerhalb des Bereichs liegenden Texten gelernt wird, zu innerhalb des Bereichs liegenden Sätzen verallgemeinert wird. Wir untersuchen hier eine verwandte Einstellung, Multi-Domain-Anpassung, wo die Anzahl der Domänen ist potenziell groß und ... Fortsetzung

Minh Quang Pham, Josep Crego, François Yvon, Jean Senellart

Buch: "International Workshop on Spoken Language Translation", "Proceedings of the 16th International Workshop on Spoken Language Translation (IWSLT)", November 2019, Hongkong, China