1.機(jī)器口譯的基本概念
相對于機(jī)器翻譯,機(jī)器口譯是一個(gè)相對陌生的概念。機(jī)器口譯(MI),又稱“口語翻譯”(Spoken Language Translation,SLT)、“語音機(jī)器翻譯”(Speech-to-Speech MT)或“自動口譯”(AutomatedInterpretation),是指讓計(jì)算機(jī)實(shí)現(xiàn)從一種語言的語音到另一種語言的語音自動翻譯的過程(瑞諾爾, 2010)。其理想目標(biāo)是讓計(jì)算機(jī)像人一樣在持不同語言的說話人之間充當(dāng)口譯員的角色。會議演講、交談(通過電話、網(wǎng)絡(luò)或面對面交流)、廣播等場景下的話語翻譯都是機(jī)器口譯應(yīng)用的重要領(lǐng)域。
機(jī)器口譯可分解為三個(gè)步驟:一是語音識別,即機(jī)器通過軟件接收說話人的語音,然后將其識別轉(zhuǎn)化為文字;二是語言轉(zhuǎn)換,即機(jī)器翻譯程序?qū)ξ谋具M(jìn)行加工轉(zhuǎn)譯;三是語音合成,即機(jī)器將譯文自動形成目的語語音輸出。因此,機(jī)器口譯包含三項(xiàng)核心技術(shù):語音識別、機(jī)器翻譯和語音合成。
與機(jī)器翻譯一樣,人們常把機(jī)器口譯與計(jì)算機(jī)輔助口譯(CAI)或“機(jī)助口譯”混為一談。機(jī)器口譯是全自動口譯,無需人工輔助,例如各種在線語音翻譯系統(tǒng)、口語翻譯機(jī)、口譯機(jī)器人、自動口譯電話等。計(jì)算機(jī)輔助口譯則指譯員在計(jì)算機(jī)的輔助之下完成口譯任務(wù)。計(jì)算機(jī)輔助口譯的原理是:計(jì)算機(jī)快速識別源語語音,然后將識別的內(nèi)容進(jìn)行機(jī)器翻譯,最后將譯文呈現(xiàn)在屏幕上,供譯員參考。不難看出,最后的譯文是顯示在屏幕上供譯員參考還是轉(zhuǎn)換成語音由機(jī)器播出,這是機(jī)器口譯與計(jì)算機(jī)輔助口譯的根本區(qū)別之所在。
2. 機(jī)器口譯的優(yōu)缺點(diǎn)
機(jī)器口譯有著人工口譯難以企及的一系列優(yōu)點(diǎn):
一是成本低。人工口譯培養(yǎng)周期長、難度大、費(fèi)用高,特別是同傳,國際會議上每個(gè)語種往往需要安排兩名譯員,人力和開支要求均比較高;機(jī)器口譯使用成本低,有的甚至完全免費(fèi)。
二是效率高。人工口譯費(fèi)時(shí)、費(fèi)事、效率低下,還時(shí)常出現(xiàn)翻譯盲點(diǎn),且譯員受體力、腦力和能力的限制,難以長時(shí)間、不間斷、高強(qiáng)度地工作,特別是同傳;機(jī)器口譯速度快、效率高,不會疲勞,且受海量數(shù)據(jù)支持,學(xué)習(xí)快,無翻譯盲點(diǎn),可以大大提高翻譯效率和同傳準(zhǔn)確性。
三是使用方便。人工口譯難找,特別是非通用語種;機(jī)器口譯不受語種和時(shí)空的限制,一個(gè)系統(tǒng)可同時(shí)安裝幾種、幾十種甚至幾百種語言互譯,因而方便、快捷、省事,尤其是準(zhǔn)確性要求不高的口譯。此外,國際會議上同傳設(shè)備使用麻煩,同傳接收機(jī)經(jīng)常不夠用,且容易丟失,引發(fā)糾紛;機(jī)器口譯相對簡便,只需在智能手機(jī)或平板電腦上安裝一個(gè)應(yīng)用軟件即可收聽同傳或者進(jìn)行交談。
當(dāng)然,機(jī)器口譯也存在著一系列缺點(diǎn),主要瓶頸有兩個(gè):
一是語音識別軟件尚不完美。語音識別的準(zhǔn)確性與說話人的口語質(zhì)量和周圍環(huán)境密切相關(guān)。目前,多數(shù)語音翻譯系統(tǒng)和應(yīng)用軟件只能識別語速不快、發(fā)音規(guī)范、前后連貫的語句。假如說話人語速很快,講話不連貫,或者講方言、帶口音、吐字不清、發(fā)音錯誤、使用同音字,語音識別系統(tǒng)就會出錯。同時(shí),環(huán)境噪聲(背景噪聲、背景語音、混響、回聲、多人講話)、信道噪聲(麥克風(fēng)調(diào)整、電話調(diào)整、電話蜂音)、網(wǎng)絡(luò)連接不暢、說話人距離遠(yuǎn),都會嚴(yán)重降低語音識別的準(zhǔn)確率。
二是機(jī)器翻譯不夠準(zhǔn)確。機(jī)器算法無法理解和翻譯語言文學(xué)性,包括文化、語境、語法和情感。人類語言非常復(fù)雜,許多詞語是多義的,具體意思取決于特定的語境。機(jī)器翻譯常常忽略上下文來翻譯詞句,也不遵守語法,因而譯文生硬,常常伴有語法和語序錯誤,準(zhǔn)確性和流暢性較差。目前,機(jī)器翻譯還基本停留在表層結(jié)構(gòu)的句法分析之上,無法像人腦一樣理解意義、區(qū)分情感色彩和文化差異,因而無法識別和傳達(dá)語言的深層含義、言外之意和文化元素(包括幽默和隱喻)。