最近,通義APP 翻譯能力全面升級。官方信息顯示,本次通義APP攻克了文字翻譯、同傳翻譯、文檔翻譯、圖片翻譯四大核心場景,打造面向個人與專業用戶的“最強翻譯綜合體”。
針對本次升級的諸多功能,「電廠」選取多個實際用例、分多角度進行實測。
結果顯示,不論是小眾語言文本翻譯,還是在同聲傳譯、跨語言文檔翻譯、圖片翻譯等生產力場景下,升級后的通義APP都能精準理解翻譯指令,以及有效處理專業術語、上下文語義一致性等復雜語言問題,在專業性表達、語義一致性等方面表現突出。
支持119種語言/方言翻譯,讓出游不再“難行”
據官方信息,升級后的通義APP新版本支持多達119種語言與方言的文字互譯,涵蓋印歐、亞非、南亞等多語種體系,并且著力打磨復雜語義處理能力。
提升語言覆蓋密度,在大模型應用領域并不是一個容易的選擇。究其原因,作為世界第一大語言的英語既是當下互聯網及科研領域的主流語言,又有豐富充足的訓練語料,因此是各大AI翻譯應用積累用戶規模、形成數據飛輪的最好選擇。
但在日常使用場景下,“小眾”語言無疑同樣存在用戶市場。通義APP選擇“看見”這部分人的需求,不僅事涉回報比,更意味著對技術的極大挑戰。
以隸屬印歐語系的葡萄牙語為例,其是擁有約2.6億母語或官方使用者的世界第六大語言,也是在巴西、葡萄牙等旅游勝地廣泛應用的“區域性熱門語言”。即便如此,葡語翻譯在大模型應用領域也絕非熱門功能。
為了測評通義APP在小眾語言翻譯領域的語義準確度,本次「電廠」也以葡萄牙語為例,準備了葡語版本的機場問詢臺常用問答、機場廣播素材,并將其輸入通義APP進行翻譯為中文。
結果顯示,通義APP準確地捕捉和翻譯出了地名、指引路線、登機口變更、登機時間等關鍵信息,足以滿足旅客的基本對話需求。
接下來,電廠還測試了通義APP對隸屬壯侗語系的老撾語的翻譯能力。
公開信息顯示,老撾語的語序、表達均與漢語差異極大。比如不同于中文常用的“形容詞+名詞”的語法結構、老撾語通常將形容詞放在名詞之后;由于文化背景不同,許多老撾語表達在中文中并沒有直接可對照的詞匯……
「電廠」預設了一個旅行中常見的車站問答情景,將對話輸入通義APP。翻譯結果顯示,在對問答語氣的理解、翻譯的準確性、金錢單位等專有名詞的理解方面,通義APP的表現同樣優秀。
特別指出的是,不只是日常場景,在強專業性、高難度的翻譯場景下,通義APP的表現也較為優異。
以馬來語為例,這是一門屬于南島語系的語言,目前廣泛應用于馬來西亞、新加坡、印度尼西亞、文萊等熱帶國家。
我們將流行于馬來語地區的諺語“air yang tenang jangan disangka tiada buaya”輸入通義APP及其他多個模型進行翻譯。
通義APP給出的答案為“靜水莫當無鱷魚”,兼顧了精煉、準確兩大要素;其他模型給出的答案則大多局限于字面意思理解,如“別以為平靜的水中沒有鱷魚”“風平浪靜,別以為沒有鱷魚”。
打造專屬隨身的免費同傳服務,不限時間及次數
除了文本翻譯,升級后的通義APP更支持10大語種同傳翻譯。
具體來說,通義APP可以識別包含中文(普通話)、英語、日語、韓語、粵語、德語、法語、俄語、意大利語、西班牙語這10大語言,并能夠翻譯出中文、英語、日語、韓語這4大語言。
同聲傳譯,又稱為同步口譯,是一種高級翻譯形式,要求譯員在講話者發言的同時、幾乎同步地將其所說內容翻譯成另一種語言。當前世界上95%的國際高端會議都采用同聲傳譯的方式翻譯,由于難度極高,同傳有“翻譯之王”“翻譯皇冠之上的明珠”之稱,同傳師也供不應求、日薪也高達萬元之上。
這樣的背景下,通義APP同傳功能的推出,意味著每個用戶都可以擁有一個專屬、隨身的同傳師。
針對同傳功能,「電廠」選取了最為常用的中、英文場景,分別測試了通義APP的英傳中、中傳英功能。
在英傳中場景下,「電廠」選取了斯坦福大學首位紅杉講席教授、美國國家工程院院士、華裔人工智能科學家李飛飛的TED演講《有了空間智能,AI將會理解現實世界》。
在整個同傳過程中,通義APP精準地捕捉到了演講者的語氣、對演講內容進行合理分段,并實時將英文轉化為符合中文語序的譯文,同傳的中文內容閱讀流暢、相較英文原文十分準確。
在中傳英場景下,「電廠」讓通義APP翻譯了2025年6月21日晚間新聞聯播天氣預報的內容。
結果顯示,在總時長約1分鐘50秒的主持人口播過程中,通義APP幾乎一字不差地識別了播報內容,在頓挫的語氣中準確完成了長句識別等任務。
同傳翻譯過程中,通義APP 幾乎不存在啟動延遲,也能夠合理翻譯長句和準確預判譯文結構。
特別要指出的是,相較同類型產品,通義APP同傳功能不限時、不限次、完全免費,完全擺脫了時間限制與付費門檻。
告別DeepL,一個APP實現專業級文檔/圖片翻譯
在生產力場景中,通義APP全新升級的翻譯能力也能派上用場。針對跨語言文檔處理需求,可以提供專業級的文檔翻譯體驗。
以英文文本閱讀為例,「電廠」將一份索尼NEX-7 微單相機英文版快速使用說明輸入了通義APP。后者在不到一分鐘的時間內完成了全部64頁內容的翻譯處理。
可以看到,翻譯文檔不僅實現了用詞的精準,而且還保持了和原文檔一致的排版。此外通義APP還完成了文中表格內容的翻譯處理。
在全文翻譯完畢后,通義APP還自動生成了全文總結與腦圖,幫助用戶高效掌握文檔核心信息。
同時,本次通義APP全面升級了圖像場景下的多語言理解與生成能力,其圖片翻譯體驗同樣達到了專業級別。在菜單、圖文海報等應用場景下,中英互譯、一鍵出圖不再是難題。
以一張英文攝像機功能使用說明圖為例,在圖片翻譯頁面將其輸入后,點擊“對照原圖查看譯文”按鈕,即可生成一張中文版本的實用功能說明圖。
可以看到,區別于傳統OCR(XXX)工具僅完成“翻譯單詞”的任務,通義APP還保留了圖片原本的排版結構。
左-英文原圖,右-中文翻譯圖片結果
2023年7月,通義APP上正式上架應用市場,并在經歷了一年多時間的穩定更新后,于2024年末從阿里云分拆、并入阿里智能信息事業群。
為了更加貼近用戶,通義APP也悄然完成了一系列“改頭換面”,比如其在上半年完成了交互設計的全面改版、只為打造更加易用的用戶界面,曾引起市場廣泛關注。但這或許只是第一步。
翻譯功能的上線,折射出通義APP不止要“好看易用”,還希望在用戶深度使用的諸多生活和生產力場景中提供價值。隨著底層模型技術能力升級和產品打磨深入,通義APP的“進化”遠未停止,未來有望為AI智能應用服務市場帶來更多新鮮感。