論文・出版物

アイコン検索

企業情報

シストランは、50年以上にわたる翻訳技術分野での経験を持ち、業界における数々のイノベーションを牽引してきました。業界初のWebベース翻訳ポータルや、ビジネス向けニューラル翻訳エンジンの開発などを通じて、翻訳技術の新時代を切り開いています。

シストランは、ビジネス向けに、多言語コミュニケーション、ビッグデータ分析など、多様な領域での最先端かつセキュアな自動翻訳ソリューションを提供しています。オープンで拡張性の高いアーキテクチャを採用し、既存の他社アプリケーションやITインフラにスムーズに連携可能。

接尾辞の配列とA*解析を使用した高速近似文字列照合[PDF]

接尾辞の配列とA*解析を使用した高速近似文字列照合[PDF]

翻訳メモリの文脈における近似文字列一致問題に対する新しい厳密な解を提示する。この問題では、テキストセグメントは大きなコーパスに対して照合されなければならず、エラーが発生する可能性がある。サフィックス配列を使用して正確なn グラム一致を検出し、A*検索ヒューリスティックを使用して一致を破棄し、A*解析を使用して候補セグメントを検証します。この方法は、現実的なシナリオのセグメントに対して4.3~247ミリ秒の平均参照時間で、標準ベースラインを100倍上回ります。

ジャン・セネラート・フィリップ・ケーン

AMTA、2010年10月。

SYSTRAN英語/英語/中国語ハイブリッド機械翻訳システム [PDF]

SYSTRAN英語/英語/中国語ハイブリッド機械翻訳システム [PDF]

このレポートでは、CWMT2009の機械翻訳評価作業に参加したSYSTRANの中国語 – 英語および英語 – 中国語の機械翻訳システムについて説明します。基本システムはSYSTRAN ルールベースの機械翻訳システムで、さまざまな統計的手法で拡張されています。ルールベースのシステムの翻訳に基づいて、提供されたバイリンガルおよびモノリンガルのトレーニング企業で統計的な事後編集を行います。本報告では、CWMT2009評価のシステムの裏付けとなる技術、トレーニングデータ、評価結果について述べる。評価作業では、当社の主要システムが上位にランクされました。

Jin Yang、江ノ上聡、Jean Senellart、Tristan Croiset

2009年11月、CWMT

コーパス抽出の語彙規則をルールベースの機械翻訳システムに選択的に追加[PDF]

コーパス抽出の語彙規則をルールベースの機械翻訳システムに選択的に追加[PDF]

この研究では、既存のルールベースの汎用機械翻訳システムが、並列コーパスが利用可能な場合に、どのように改善され、特定のドメインに自動的に適応されるかを示します。並列データから辞書エントリを抽出して、この適応を行う。この初期セットから、これらのルールの適用はベースラインパフォーマンスに対してテストされます。次に、文字列ベースの自動メトリックによって評価される文レベルの改善と劣化に応じて、ルールがプルーニングされます。Europarl データセットを使用した実験では、元のルールベースのシステムよりもBLEUが3%絶対的に向上したことが示されています。

Loic Dugast、Jean Senellart、Philipp Koehn

MTサミット、2009年8月

WMT'09用SMTおよびSPE機械翻訳システム [PDF]

WMT'09用SMTおよびSPE機械翻訳システム [PDF]

2009年のWMT共有タスク評価のための機械翻訳システムの開発について述べた。私たちはフランス語と英語の翻訳についてのみ考えている。ここでは、モーゼスデコーダに基づく統計系と、SYSTRANのルールベースのシステムを用いた統計的事後編集系について述べた。また、比較可能なコーパスから追加のバイリンガルテキストを自動的に抽出する技術も調査しました。

Holger Schwenk、Sadaf Abdul Rauf、Loic Barrault、Jean Senellart

火星2009

統計的な事後編集と辞書の抽出: ACL-WMT2009のSYSTRAN/Edinburghの提出[PDF]

統計的な事後編集と辞書の抽出: ACL-WMT2009のSYSTRAN/Edinburghの提出[PDF]

要約:ここでは、WMT2009に対して提出された2つのSystran/University of Edinburghについて説明します。このモデルには、特定の名前付きエンティティ(英語からフランス語、ドイツ語から英語)の処理と語句ルール(英語からフランス語)の抽出を含む統計的な事後編集モデルが含まれます。

ロイック・デュガスト、ジャン・セネラート、フィリップ・コーン

2009年3月期

RBMTシステムを再獲得できますか?[PDF]

RBMTシステムを再獲得できますか?[PDF]

本稿では、第3回ACL統計機械翻訳ワークショップの共有タスクに対するSYSTRANの提出について述べる。私たちの主な貢献は、人間が翻訳した並列コーパスを使用せずに訓練されたフランス語 – 英語の統計モデルで構成されています。代わりに、SYSTRAN ルールベースの翻訳エンジンを使用して単一言語コーパスを翻訳し、パラレルコーパスを作成しました。結果は、エラー分析の尺度とともに提供されます。

ロイック・デュガスト、ジャン・セネラート、フィリップ・コーン

2008年6月

WMT2017向けSYSTRAN純粋神経型MT エンジン

WMT2017向けSYSTRAN純粋神経型MT エンジン

本稿では、WMT 2017に提出されたSYSTRANのシステムについて、英語とドイツ語の両方の翻訳方向でニュース翻訳タスクを共有する方法について説明する。当社のシステムは、オープンソースのニューラル機械翻訳システムであるOpenNMT1を使用して構築されており、LSTMエンコーダ/デコーダと注意を払ったシーケンス間モデルを実装しています。私たちは、自動的に逆翻訳された単一言語データを使用して実験を行いました。得られたモデルは、評価試験文に従ってモデルを微調整する適応技術によってさらに高度に専門化されています。

ヨンチャオ・デン、ユンギ・キム、ギヨーム・クライン、キャサリン・コバス、ナタリア・セガル、クリストフ・サーヴァン、ボー・ワン、ダクン・ジャン、ジョセップ・クレゴ、ジーン・セネラート

「Proceedings of the Second Conference on Machine Translation」に掲載、265-270ページ、Association for Computational Linguistics、2017年、コペンハーゲン、デンマーク

SYSTRAN翻訳スタイルシート: XSLTによる機械翻訳[PDF]

SYSTRAN翻訳スタイルシート: XSLTによる機械翻訳[PDF]

XSL変換スタイルシートは通常、XML形式で記述されたドキュメントを別のXML形式に変換したり、XML ドキュメントを変更したり、XML ドキュメントに保存されたコンテンツをパブリッシング形式(XSL-FO、(X)HTML...)にパブリッシュしたりするために使用されます。SYSTRAN Translation Stylesheets (STS)は、XSLTを使用して、XML ドキュメント (ネイティブ XML ドキュメント形式、または他の種類のドキュメント形式のXLIFFなどのXML表現)の機械翻訳を制御します。

ジャン・セネラート・ピエール・セネラート

(2005年9月)

SYSTRANの直感的なコーディング技術[PDF]

SYSTRANの直感的なコーディング技術[PDF]

汎用MTシステムのカスタマイズは、特定の用途に合わせて機械翻訳の品質を向上させる効果的な方法です。ユーザ固有の辞書を作成することは、カスタマイズ プロセスの最初で最も重要なステップです。直感的な辞書作成ツールが開発され、ユーザーが簡単かつインテリジェントにユーザー辞書を作成できるように利用されるようになりました。SYSTRANの革新的で独自のIntuitiveCoding®技術は、このツールを動かすエンジンです。膨大な言語リソース、形態素解析器、統計ゲッサー、有限状態オートマトン、コンテキストフリー文法など、さまざまなコンポーネントで構成されています。方法論的には、IntuitiveCoding®は、用語集のインポートと交換における高品質の辞書作成のためのクロスアプリケーションアプローチでもあります。この文書では、さまざまなコンポーネントについて説明します。 続き

Jean Senellart、Jin Yang、Anabel Rebollo

MTサミットIX(2003年9月22日~26日)

SYSTRAN レビューマネージャ [PDF]

SYSTRAN レビューマネージャ [PDF]

SYSTRAN Review Manager (SRM)は、MTのカスタマイズおよびローカリゼーションプロジェクトを管理するための包括的なエンタープライズソリューションであるSYSTRAN Linguistics Platform (SLP)を構成するコンポーネントの1つです。SRMは、SYSTRANソリューションと組み合わせた言語リソースのレビュー、品質評価、およびメンテナンスに使用される生産性ツールです。SRMは、SYSTRANの開発チームが社内で使用し、用語や同形異義語などの主要な言語上の課題に対処するため、企業のお客様にもライセンス供与されます。これは、SRMをQAプロセスの重要なコンポーネントにします。非常に柔軟性が高く、小規模から大規模までのローカリゼーションおよびMT カスタマイズプロジェクトに適応します。そのWebベースのインターフェイスとマルチユーザーアーキテクチャにより、 続き

ジャン=セドリック・コスタ、クリスティアン・パニソド

MTサミットIX、2003年9月22日~26日。