例えば"This is Nagaoka."という文章を機械的に日本語に訳すと
「これは長岡<地名>です」、「私は長岡<人名>です」のどちらがより適しているかは
翻訳エンジンは判断できないですよね。
なぜなら文脈に応じて言葉の意味は540°くらい変わっちゃうから。
じゃあ、なんで人間はそういう心配なしにコミュニケーションできるんでしょう?
電話に出て一言目に「長岡です」と言えば日本人なら疑いもなく「私は長岡です」と取るでしょ。
これって実は経験的法則というやつなんです。
ン十年と毎日ン時間も会話をしてきましたから、
どの単語をどの助詞で繋げてどの接続詞を選び・・・etcetc
としたときにどんなレスポンスがあるのかの莫大なDBを持っていますね。
これを利用することで相手が言った言葉が
「自分の概念に置き換えるとどんな意味に近いのか」をシミュレートします。
どんな言葉を伝えれば
「自分の概念に近いものを相手に与えられるか」をシミュレートできます。
例えば「一目惚れをして胸がドキドキした」なんてマンガのフレーズを読んだ女の子が
実際に誰かに一目惚れしたときに気分の高揚を感じたら
「ああ、これが胸のドキドキなのか」とリンク付けするわけです。
AさんとBさんが「胸のドキドキ」にそれぞれの概念をリンク付けしていますが
実際にその2つが等しいのか等しくないのかは誰にも分かりません。
ですがこのリンクによってお互いに「胸のドキドキ」という概念を共有することはできます。
人生が長くなるにつれ、この概念と言葉のリンクというDBが蓄積されていくわけです。
結局は人間という奴は感情の生き物であっても言葉の生き物ではありませんから
会話というのは感情を文章にパッキングして相手に送るだけです。
受け取った人は文章をアンパッキングして自分の概念に照らし合せて感情を共有しているに過ぎません。
話を元に戻して、なぜ機械翻訳の能力に限度があるかの答えは
コンピューターがコンピューターだからです。
元も子もありませんがこうとしか言い様がないと思います。
まとめ。
人間はパッキングエンジンXとアンパッキングエンジンYを持っていまして
感情xに対して話者がx⇒X(x)とパッキングして出力し
聞き手がX(x)をX(x)⇒Y( X(x) ) = x'とアンパッキングします。
このxとx'が"大体"同じだから会話が成立するんですね。