Papiere und Veröffentlichungen

Symbolsuche

Über Systran

SYSTRAN verfügt über mehr als 50 Jahre Erfahrung in Übersetzungstechnologien und leistet Pionierarbeit bei den größten Innovationen in diesem Bereich. Dazu gehören die ersten webbasierten Übersetzungsportale und die ersten neuronalen Übersetzungsmodule, die künstliche Intelligenz und neuronale Netzwerke für Unternehmen und öffentliche Organisationen kombinieren.

SYSTRAN stellt Geschäftskunden hoch entwickelte und sichere automatisierte Übersetzungslösungen in verschiedenen Bereichen zur Verfügung, wie z. B. globale Zusammenarbeit, Erstellung mehrsprachiger Inhalte, Kundensupport, elektronische Ermittlungen, Big Data-Analyse, E-Commerce, etc. SYSTRAN bietet eine maßgeschneiderte Lösung mit einer offenen und skalierbaren Architektur, die eine nahtlose Integration in bestehende Anwendungen und IT-Infrastrukturen von Drittanbietern ermöglicht.

Auf dem Weg zur beispielbasierten NMT mit Multi-Levenshtein-Transformatoren

Auf dem Weg zur beispielbasierten NMT mit Multi-Levenshtein-Transformatoren

Maxime Bouthors, Josep Crego, François Yvon.

Konferenz 2023 über empirische Methoden in der natürlichen Sprachverarbeitung (EMNLP 2023), Dezember 2023, Singapur.

BiSync: Ein zweisprachiger Editor für synchronisierte einsprachige Texte

BiSync: Ein zweisprachiger Editor für synchronisierte einsprachige Texte

In unserer globalisierten Welt entstehen immer mehr Situationen, in denen Menschen in einer oder mehreren Fremdsprachen kommunizieren müssen. Bei schriftlicher Kommunikation können Benutzer mit guten Fremdsprachenkenntnissen Unterstützung durch CAT-Technologien (Computer Aided Translation, computerunterstützte Übersetzung) finden. Diese Technologien ermöglichen Benutzern oft den Zugriff auf externe Ressourcen, wie z. B. ... Fortsetzung

Josep Crego, Jitao Xu, François Yvon.

61st Annual Meeting of the Association for Computational Linguistics (ACL 2023), Juli 2023, Toronto, Kanada.

Beispielbasierte maschinelle Übersetzung von Text in eine hierarchische Darstellung von SignLanguage

Beispielbasierte maschinelle Übersetzung von Text in eine hierarchische Darstellung von SignLanguage

Dieser Artikel präsentiert ein Experiment zur automatischen Übersetzung von Text in Zeichensprache (SL). Da wir nicht über einen großen Alignment-Korpus verfügen, haben wir einen beispielbasierten Ansatz genutzt und AZee, eine Zwischendarstellung des Vortrags in SL in Form von hierarchischen Begriffen, verwendet.

Élise Bertin-Lemée, Annelies Braffort, Camille Challant, Claire Danet, Michael Filhol

18e Conférence en Recherche d'Information et Applications — 16e Rencontres Jeunes Chercheurs en RI — 30e Conférence sur le Traitement Automatique des Langues Naturelles — 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (TALN 2023), Jun 2023, Paris, Frankreich.

Integration von Translation Memories in nicht autoregressive maschinelle Übersetzung

Integration von Translation Memories in nicht autoregressive maschinelle Übersetzung

Jitao Xu, Josep Crego, François Yvon.

7. Konferenz des European Chapter of the Association for Computational Linguistics (EACL 2023), Association for Computational Linguistics, Mai 2023, Dubrovnik, Kroatien.

Zweisprachige Synchronisierung: Wiederherstellung der Übersetzungsbeziehungen mit Bearbeitungsvorgängen

Zweisprachige Synchronisierung: Wiederherstellung der Übersetzungsbeziehungen mit Bearbeitungsvorgängen

Maschinelle Übersetzung (MT) wird normalerweise als einmaliger Vorgang betrachtet, bei dem die Zielsprache eines beliebigen Ausgangstextes von Grund auf neu erstellt wird. Wir betrachten hier eine allgemeinere Einstellung, die von einer anfänglichen Zielsequenz ausgeht, die in eine gültige Übersetzung der Quelle umgewandelt werden muss, wodurch die Parallelität zwischen Quelle und Ziel wiederhergestellt wird. Für diese zweisprachige Synchronisationsaufgabe berücksichtigen wir verschiedene Architekturen (sowohl autoregressiv als auch nicht autoregressiv) und Trainingssysteme und experimentieren mit mehreren praktischen Einstellungen wie simuliertes interaktives MT, Übersetzen mit Translation Memory (TM) und TM-Bereinigung. Unsere Ergebnisse deuten darauf hin, dass ein einzelnes generisches, editierbares System nach der Feinabstimmung mit speziell für diese Aufgaben trainierten Systemen verglichen oder sogar übertroffen werden kann.

Jitao Xu, Josep Crego, François Yvon

The 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), Dez 2022, Abou Dabi, Vereinigte Arabische Emirate

Nicht autoregressive maschinelle Übersetzung mit Translation Memories

Nicht autoregressive maschinelle Übersetzung mit Translation Memories

Die nicht autoregressive maschinelle Übersetzung (NAT) hat in letzter Zeit große Fortschritte gemacht. Die meisten bisherigen Arbeiten konzentrieren sich jedoch auf Standardübersetzungsaufgaben, auch wenn einige editbasierte NAT-Modelle, wie der Levenstein Transformer (LevT), gut geeignet scheinen, um mit einem Translation Memory (TM) zu übersetzen. Dies ist das Szenario, das hier betrachtet wird. Zuerst analysieren wir das Vanille LevT Modell... Fortsetzung

Jitao Xu, Josep Crego, François Yvon

The 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), Dez 2022, Abou Dabi, Vereinigte Arabische Emirate.

Zuverlässige Übersetzung französischer Live-Sprachprotokolle

Zuverlässige Übersetzung französischer Live-Sprachprotokolle

Trotz eines erheblich verringerten Leistungsgefälles bei direkten Ansätzen werden Kaskadenlösungen mit automatischer Spracherkennung (ASR) und maschineller Übersetzung (MT) noch weitgehend in der Sprachübersetzung (ST) eingesetzt. Direkte Ansätze, die ein einziges Modell zur Übersetzung des Eingangssprachsignals verwenden, leiden unter dem kritischen Engpass der Datenknappheit. Darüber hinaus zeigen mehrere Branchenanwendungen Sprachprotokolle ... Fortsetzung

Elise Bertin-Lemée, Guillaume Klein, Josep Crego, Jean Senellart

Proceedings of the 15th Biennial Conference of the Association for Machine Translation in the Americas (Volume 2: Users and Providers Track and Government Track), Sep 2022, Orlando USA

Latent Group Dropout für maschinelle Übersetzung mit mehreren Sprachen und Domänen

Latent Group Dropout für maschinelle Übersetzung mit mehreren Sprachen und Domänen

Mehrdomänen- und mehrsprachige maschinelle Übersetzungen stützen sich häufig auf Strategien zum Teilen von Parametern, bei denen große Teile des Netzwerks die Gemeinsamkeiten der anstehenden Aufgaben erfassen sollen, während kleinere Teile reserviert sind, um die Besonderheiten einer Sprache oder einer Domäne zu modellieren. Bei adapterbasierten Ansätzen sind diese Strategien in der Netzwerkarchitektur fest kodiert, unabhängig ... Fortsetzung

Minh-Quang Pham, François Yvon, Josep Crego

Ergebnisse der Association for Computational Linguistics: NAACL 2022, Jul 2022, Seattle, Vereinigte Staaten

Beispielbasierte multilineare Gebärdensprachenerstellung aus einer hierarchischen Darstellung.

Beispielbasierte multilineare Gebärdensprachenerstellung aus einer hierarchischen Darstellung.

Boris Dauriac, Annelies Braffort, Elise Bertin-Lemée.

Jun 2022, Marseille, Frankreich.

Mehrdomänenanpassung in der neuronalen maschinellen Übersetzung mit dynamischen Abtaststrategien

Mehrdomänenanpassung in der neuronalen maschinellen Übersetzung mit dynamischen Abtaststrategien

Der Aufbau effektiver neuronaler maschineller Übersetzungsmodelle erfordert häufig die Verwendung unterschiedlicher Sätze heterogener Daten, um die Leistung für die Bereiche von Interesse zu optimieren. Solche Multi-Source-/Multi-Domain-Anpassungsprobleme werden typischerweise durch Instanzenauswahl- oder Regewichtungsstrategien angegangen, basierend auf einer statischen Bewertung der Relevanz von Trainingsinstanzen in Bezug auf die Aufgabe... Fortsetzung

MinhQuang Pham, Antoine Senellart, Dan Berrebbi, Josep Crego, Jean Senellart

In: Proceedings of the 23rd Annual Conference of the European Association for Machine Translation, Jun 2022, Gent, Belgium