품질과 정확성을 한 단계 더 향상시킵니다.
번역 품질을 더욱 향상시키기 위해 귀하의 전문 분야 전문용어를 반영한 언어 모델로 지속적인 업그레이드가 가능합니다.
SYSTRAN 모델 스튜디오
자체 전문용어 언어 모델 생성 기능
자신의 데이터 또는 기존 번역 메모리 결과로 학습된 나만의 맞춤형 번역 모델을 만들어 번역 효율성과 생산성을 크게 향상시키세요!
자체 번역 메모리 활용으로 번역 모델 고도화 기능
평가
사용자 언어 모델로 평가 및 분석
또한, 자체 테스트 세트를 추가하거나 데이터 업로드 단계에서 테스트 및 평가를 위해 훈련 데이터의 일부를 할당하도록 선택할 수 있습니다.
SYSTRAN의 방대한 카탈로그 활용
자체 번역 모델을 처음부터 구축하는 것은 어려운 작업일 수 있습니다. 다행히도 처음부터 고민하지 않아도 됩니다! 수십 년 동안 기계 번역의 선두주자인 SYSTRAN은 다년간의 전문성을 바탕으로 광범위한 번역 모델 카탈로그를 구축해 준비해 놓았습니다.
SYSTRAN 카탈로그에서 기존 모델을 선택하여 시작점으로 적용하고 자신의 데이터로 사용자를 지정하세요. 50개 이상의 언어와 수십 개의 인기 전문 도메인(법률, 의료, 금융, IT 등)을 바로 사용할 수 있습니다!
웨비나
모델 스튜디오 쉽고 빠른 맞춤형 번역 모델 학습
번역 결과물의 고품질을 보장하려면 분야 전문용어 번역이 필수적이며, 모델 스튜디오가 그 해결책입니다! 사용자 지정은 필수입니다., Model Studio가 해결책입니다!
이 웨비나에서는 SYSTRAN의 제품 소유자인 Guersande Chaminade와 계정 관리자인 Stéphanie Labroue가 SYSTRAN Model Studio를 사용하여 다양한 분야 전문용어 맞춤형 번역 모델을 만드는 방법을 알려드립니다.
CUSTOMIZATION
각 업종에 맞는 번역 솔루션 제공
NFA 기능이란 무엇입니까?
Neural Fuzzy Adaptation 신경 퍼지 적응의 줄임말인 NFA는 엔진이 인덱스에 따라 번역할 수 있도록 하는 강력한 기능입니다. 번역가가 새 세그먼트를 사후 편집하면 시스템이 이러한 변경 사항을 즉시 반영하여 번역 품질을 지속적으로 개선합니다.
최신 웨비나 두 개를 통해 NFA에 대해 자세히 알아보세요. XTM 다른 하나는 MemoQ와 함께 진행합니다.
대상 언어를 평가하는 데 BLEU 점수만 사용하나요?
현재 Model Studio는 BLEU 점수만 표시합니다. Comet과 같은 다른 도구를 통합하기 위해 적극적으로 노력하고 있지만, 당분간은 BLEU 점수를 주요 평가 지표로 사용하는 효율성과 편의성에 초점을 맞추고 있습니다.
SYSTRAN 번역 서버 및 SYSTRAN 번역 프라이빗 클라우드 두 개 이상의 모델을 동시에 배포할 수 있나요?
물론이죠! 여러 모델을 배포하고 특정 프로젝트에 가장 적합한 모델을 선택할 수 있습니다. 모델을 배포하기 전에 다양한 테스트 파일을 업로드하고 비교하여 각 모델의 성능을 확인할 수 있는 평가 기능을 활용할 수도 있습니다.
최대 3개의 모델을 나란히 비교할 수 있어 요구 사항에 맞는 가장 이상적인 모델을 쉽게 찾을 수 있습니다.
그러나 이 기능을 사용하지 않아도 여러 모델을 쉽게 배포할 수 있습니다.
최대 100만 개의 세그먼트 제한은 어떻게 되나요?
Model Studio는 정확도와 견고성 측면에서 최대 1백만 개의 문장 쌍을 최대한 활용할 수 있도록 맞춤화되었습니다. 이 제한은 중복 제거 및 잠재적으로 손상된 문자를 제거한 후의 데이터에 적용됩니다.
또한 네트워크 문제를 방지하기 위해 대용량 파일을 한 번에 업로드하지 않는 것이 좋습니다.
학습 데이터의 마크업 태그는 어떻게 처리하나요?
현재로서는 태그와 마크업 표시자를 처리하는 데 어려움이 있을 수 있습니다. 처리를 개선하기 위해 태그가 포함된 긴 문장은 삭제될 수 있습니다. 하지만 태그를 더 잘 처리할 수 있는 솔루션을 적극적으로 연구 중이며, 이 기능은 2024년에 제공될 예정입니다.
그 동안에는 CatTools에 태그를 입력하고 이 CatTools이 태그를 처리하도록 할 수 있습니다.
모델 학습 데이터는 익명화해야 하나요?
앞서 살펴본 바와 같이 플레이스홀더는 태그로 간주될 수 있으므로 플레이스홀더를 사용하여 데이터를 비정형화하면 처리하기가 어려울 수 있습니다.
학습 데이터는 플레이스홀더나 태그 대신 'XX'를 사용하여 익명화해야 합니다.
이를 통해 개인정보 보호 및 데이터 보호 규정 준수를 보장합니다. SYSTRAN은 고객 데이터 보안을 최우선시하며, 플랫폼에 강력한 안전 조치를 갖추고 있으니 안심하세요.
예를 들어, 데이터 세트 수준에서 조정할 수 있는 자동 학습 데이터 삭제 기능이 있습니다. 기본값은 90일로 설정되어 있지만, 180일 동안 데이터를 삭제하지 않는 옵션도 제공합니다. 업로드 후 이 값을 변경할 수 있습니다.
업로드 후에는 데이터가 어떻게 정리되나요?
자동 데이터 정리 는 업로드 중과 처리 중에 수행됩니다.
데이터는 크게 두 단계의 처리 과정을 거칩니다.
첫번째 단계는, 소스 및 대상 세그먼트에서 중복된 부분을 제거합니다. 두번째 단계로는, 잘못된 인코딩을 해결하고 대상 또는 소스에서 빈 문장을 제거합니다.
그런 다음 데이터 처리 중에 주로 잘못 정렬된 세그먼트나 잘못된 언어에 대해 또 다른 필터링 및 정리가 이루어집니다.