翻訳知識の共有と再利用
翻訳知識と翻訳資産
今回は、私が提唱している翻訳工学の基礎についてのお話しです。一時期叫ばれていた、「もったいない」熱は早くも冷めてしまったようですが、資源や食品などのほかにも、毎日世界各地で大量に作られては、捨てられているものがあります。
それは「翻訳知識」です。翻訳知識とは、「何をどう訳すか」という知識です。もっとも単純な形では、単語レベルの対訳用語集や翻訳ソフト用のユーザー辞書です。また、文単位の翻訳メモリーも含まれます。翻訳知識という言葉は、自然言語処理・機械翻訳の分野ではよく使われますが、翻訳の現場でも考える必要があります。翻訳工学は、「翻訳知識を合理的に共有し、再利用しよう」いう考え方に基づいています。
一方、「翻訳資産」という言葉があります。翻訳資産とはだれかが「コストをかけて作った翻訳知識」、つまり「資産として見た翻訳知識」です。用語集や翻訳メモリーなど、具体的なデータとしては翻訳知識と同じものを指します。企業の中だけでも、翻訳資産を共有・再利用する意味はありますが、「資産」としてだけ捉えると大局が見えなくなってしまいます。
オープンソースでの翻訳知識の共有
残念ながら、オープンソースの世界では、せっかくプログラミングのコードという資産を、理念に基づいて共有しているのに、翻訳知識の共有は進んでいません。この原因として、オープンソースではLinuxがかなりの比重を占めていますが、Linuxで使える翻訳メモリー ツールや翻訳ソフトがほとんどないことも関係しています。このことは、翻訳知識という考え方自体がオープンソースの世界で浸透していないこととあわせて、鶏と卵の関係であり、悪循環が続いています。もっと早く、正確に、楽に仕事ができることを知られていないのは大変もったいないことです。翻訳知識をうまく共有できれば、UIやヘルプなどの各国語へのローカライゼーションが可能になり、世界中の人にソフトを使ってもらえます。このための具体的な取り組みの一つとして、私は翻訳ソフト用の共有ユーザー辞書仕様UTXの策定をお手伝いしています(下図)。
豊富な翻訳知識を持つ経験豊かな翻訳者にとっては、苦労して蓄積した翻訳資産を提供するには抵抗があるでしょう。しかし、重要なのは、「翻訳知識を共有することで相互に利益を得られる」ということです。翻訳知識は、規模が大きくなれば価値が高まります。現状では、「正当な対価が得られないので翻訳知識を公開しない」という、全体からみて悪循環が続いています。そのため、翻訳知識を提供してもらう場合は、その人の翻訳知識の価値を評価し、(お金とは限りませんが)適切な対価が得られる、もしくはモチベーションが維持される仕組みが必要です。
翻訳資産の適切な管理
翻訳資産の適切な管理は、翻訳会社・翻訳依頼者・翻訳者の3者に共通する、重要な仕事です。「存在するはずの翻訳メモリーや用語集が行方不明になった」ということはありませんか? しなくていいはずの作業をやり直すことになり、本来は不要のコストが発生します。特に数カ月や数年経った後で、以前の翻訳資産が急に必要になることがあります。翻訳資産は「資産」ですから、責任者が、どの翻訳メモリーにどんな情報が含まれているかをきちんと把握しておくことが重要です。簡単にできる対策としては、「なるべく具体的なファイル名、フォルダー名を付ける」という方法があります。
訳語の確定に必要なコスト
翻訳者は、絶えず「適切な訳語」を追究してゆく必要があります。翻訳作業に占める「訳語の確定に必要なコスト」というものを、もっと真剣に考えるべきではないでしょうか。用語集により翻訳知識を共有・再利用できれば、「訳語の確定に必要なコスト」は下げられます。
「想定読者の半分以上が理解できる訳語」、つまり「分かりやすい訳語のみを使う」のが、翻訳での基本原則と私は考えています。「想定読書の半分以上が理解できない訳語」は、「難解な訳語」です。アクセシビリティという語はその一例であり、実際に「アクセシビリティ」を必要としている人には難解な訳語です。
「分かりやすい訳語」を見つけるには、さまざまな文脈でもなるべく一貫して使える、などといったことも考慮する必要があります。最近、マイクロソフトでも用語について投票でユーザーの意見を募集していました。先ほどの「対価」の問題もありますが、もっと体系的な仕組みはないものかと思います。
以下のアンケートでご希望やご感想をお寄せください! 本コラムのトピック選定は、このアンケートの結果を参考にしています。
|