翻訳・ローカリゼーション業界では、過去5年間で、大規模言語モデル(LLM)と高度な機械翻訳(MT)の使用が急速に普及しました。
大規模言語モデルはこのような急成長にもかかわらず、翻訳業界にとって大きな課題を提示しています。そのため、最終的には、求められる条件により適した別のAIモデル、すなわち小規模言語モデルがこれに取って代わると、当社は考えています。
初期の段階では、ニューラル機械翻訳(NMT)システム(現在の大規模言語モデルの前身)の導入は慎重に行われていました。2019年、エンドユーザーのお客様向けの翻訳プロジェクトで機械翻訳を使用しているケースは、わずか13%程度でした。
しかし、その後品質と効率性が急速に向上したことで、より広く導入されるようになりました。2020年までに、プロジェクトの約24%で機械翻訳が使用されるようになり、これは前年の2倍近くになります。
2022年頃に登場した大規模言語モデルによって、翻訳ワークフローの自動化はさらに進みました。
今日、技術的に先進的な企業のすべてにおいて、大規模言語モデルを翻訳ワークフローへ統合することが標準になっていると言っても良いでしょう。
Nimdzi社のアナリストは、「大規模言語モデル(LLM)やLLMにより強化された機械翻訳などのAIツールの新しい波が、翻訳管理システム、コンテンツ・プラットフォーム、字幕作成ツールなどに組み込まれた機能として、翻訳ワークフローに急速に浸透している」と指摘しています。
つまり、ほんの5年前まではニッチで実験的な技術であったものが、今日では、翻訳やローカリゼーション業務の中核的な要素になっているということです。
ジェネラリストがスペシャリストに勝ることはない
大規模言語モデルは、非常にパワフルで柔軟性があり、一般的なタスクに対しては極めて効果的に機能します。しかし、一般的なタスクで優れたパフォーマンスを発揮する能力と、この能力を支える幅広い学習データは、コンテンツを翻訳する場面になると、それら自体が自らの衰退を予測させる理由になってしまいます。
汎用LLMは、多くのトピックについて人間が作成したようなテキストを生成しますが、業界ごとに存在するその分野固有の微妙なニュアンスを反映していないことがよくあります。
例えば、財務報告書を翻訳する場合、汎用モデルでは「equity」という用語を誤って解釈してしまう場合があります。一般的に、「equity」は不動産の文脈で最もよく使用され、不動産の市場価値から住宅ローンの負債残高を差し引いたものを指します。しかし、会計分野においては、「equity」は企業や資産に対する所有価値を指します。
これらの違いを理解していないと、LLMは、不正確な翻訳や解釈を生成し、重要なコミュニケーションにおいて正確性を欠いてしまう場合があります。
このような広範に利用されるモデルでは、多大なコンピューティング能力が必要になるため、運用コストが高くなり、翻訳結果が出るまでに時間がかかる場合があります。また、専門性を欠いているため、人手による編集が必要な箇所が多くなり、効率が低下して所要時間が長くなってしまいます。
大規模なプロジェクトでは、これらの要因がコストの増加と納品の遅延につながり、ビジネスにとって非常に重要な品質と信頼性に直接影響が出ます。
「良いものは包みが小さい(Good things come in small packages)」ということわざがあります。Strakerは、カスタム小規模言語モデルの真の力を引き出しました。
何でも屋の汎用大規模言語モデル(LLM)ではなく、特定の業界やタスクに特化した小規模言語モデル(SLM)の構築とトレーニングを、当社は成功裡に成し遂げてきました。
ローカリゼーションに特化することで、当社のモデルは、汎用モデルが苦手とする業界用語、専門用語、言語の複雑性に対応し、比類のない精度とニュアンスの理解を実現しています。
Strakerは、ローカリゼーションに特化して設計された、小規模の特化型AIモデルのファミリーとしてTiriを構築しました。Tiriは、1つのジェネラリスト・モデルではなく、特定の言語や業界の高精度翻訳に対応できるように訓練された、専門翻訳者のチームのように稼働します。
Tiriのモデルは、翻訳メモリや過去の翻訳履歴などの質の高い特定のデータによって学習されているため、財務用語、法律用語、技術用語を非常に正確に理解することが可能です。
例えば、Tiri Jのような日本語から英語へのIR翻訳向けの当社の特化型AIモデルのパフォーマンスは、特定の業界や特定のお客様のニーズに合わせてAI言語モデルをカスタマイズすることで、翻訳品質が劇的に向上することを示しています。これらのモデルは、一般的な商用ソリューションが提供する翻訳をはるかに上回る、文脈に即した、対象業界のニーズに合った翻訳結果を提供します。
Tiriモデルは、規模が小さく焦点が絞られているため、必要なコンピューティング・リソースが少なくて済みます。このため、処理速度が速くなり、膨大なインフラストラクチャー費用をかけずに既存のワークフローに容易に統合することが可能です。その結果、コストを削減し、納期を短縮することで、高品質な出力を維持しながら、効率的に事業を拡大できます。
Tiriは、Strakerの製品スイートに直接連携される人間からのフィードバックを通じて、学習し改善するように設計されています。この人間のフィードバックによる強化学習(RLHF)アプローチにより、翻訳は時間の経過とともに正確性をより高め、お客様のニーズにより合致したものになっていきます。
Strakerは、AIを活用した言語サービスの未来の鍵を握るのが、専門性であることを理解しています。 Tiriのようなカスタム小規模言語モデルは、企業がコンテンツをローカライズする方法に革命をもたらします。文脈の中で言語を理解するという最も重要な点に焦点を当てることで、優れた精度、スピード、効率性を実現します。
● 正確性の向上 - 業界標準の用語と、特定の分野に固有の文脈に対応できます。
● コスト削減 - 小規模モデルは、必要なコンピューティング・サイクルが少なくて済みます。
● 所要時間の短縮 - 翻訳、品質評価、公開を数週間ではなく数時間で実行します。
汎用LLMが翻訳業界に革命をもたらした一方で、当社は、小規模言語モデルがその革命に終わりを告げると考えています。小規模言語モデルは、LLMのように高いコストや膨大なコンピューティング能力を必要とせず、スピードと拡張性を兼ね備え、特定の業界に特化した文脈に基づく翻訳を提供することが可能です。
ローカリゼーションにおける精度と拡張性を必要とするビジネスにとって、Tiriは、今後ますますグローバル化が進む市場で成功を収めることを可能にする、AIソリューションです。
ビジネス・リーダーの皆様へ:Tiriについて詳しくはこちらをご覧ください https://www.straker.ai/jp/ai-platform/tiri
エンジニアの皆様へ:当社のテクノロジーの指針についてはこちらをご覧ください https://labs.straker.ai