動画の多言語間変換

 
シームレスな多言語への音声翻訳を実現するMetaのSeamlessM4T v2のデモ。英語、スペイン語、フランス語、ドイツ語間での音声翻訳が可能である。

SeamlessM4Tは、約100言語の間で多言語変換を可能とするサービスである。

SeamlessM4T is our foundational all-in-one Massively Multilingual and Multimodal Machine Translation model delivering high-quality translation for speech and text in nearly 100 languages.
[出典]facebookresearch/seamless_communication
https://github.com/facebookresearch/seamless_communication
 

上記WEBページにも紹介されているが、同サービスは、下記の5つの機能を組み合わせることで実現されている。

Speech-to-speech translation (S2ST)
Speech-to-text translation (S2TT)
Text-to-speech translation (T2ST)
Text-to-text translation (T2TT)
Automatic speech recognition (ASR)
 
MetaのSeamlessM4T v2はローカルにインストールして動作させることもできる。下記WEBページに、インストール手順に関する詳しい説明がある。
 
カテゴリー: 生成AI パーマリンク