當(dāng)前位置：首頁(yè) > 最新資訊 > 行業(yè)資訊

鵝廠造了個(gè)AI翻譯公司：專攻網(wǎng)絡(luò)小說(shuō)，自動(dòng)適配語(yǔ)言風(fēng)格，真人和GPT-4看了都說(shuō)好

沃卡惠
行業(yè)資訊
2024-05-28 09:26:55
312

鵝廠搞了個(gè)150多人的“翻譯公司”，從老板到員工都是AI智能體！

主營(yíng)業(yè)務(wù)是翻譯網(wǎng)絡(luò)小說(shuō)，質(zhì)量極高，參與評(píng)價(jià)的讀者認(rèn)為比真人翻譯得還要好。

而且相比于雇傭真人，用它來(lái)翻譯文學(xué)作品，成本降低了近80倍。

公司名為TransAgents，每個(gè)崗位都配備了30個(gè)不同的職工，能夠根據(jù)語(yǔ)言、體裁和目標(biāo)受眾適配不同的翻譯風(fēng)格。

相比于傳統(tǒng)的翻譯，產(chǎn)出的譯文更加靈活多樣，也更符合目標(biāo)語(yǔ)言的表達(dá)習(xí)慣，文學(xué)性也更強(qiáng)。

所以，TransAgents雖然在以相似度為基礎(chǔ)的自動(dòng)評(píng)估中“失敗”，卻贏得了讀者和專業(yè)人士的大力肯定。

這樣的表現(xiàn)甚至讓人感嘆說(shuō)，或許人類對(duì)人工智能生成的內(nèi)容更加青睞的時(shí)代，就要來(lái)了。

還有人表示，TransAgents是證明自己錯(cuò)看了人工智能的又一證據(jù)——本以為由于模型限制，小說(shuō)的翻譯對(duì)AI會(huì)極其困難，結(jié)果AI智能體把這個(gè)任務(wù)完成得非常好。

所以，TransAgents到底有沒(méi)有那么神呢？

真人和GPT-4都說(shuō)好

為了評(píng)估TransAgents的翻譯質(zhì)量，作者選擇了WMT2023數(shù)據(jù)集，需要對(duì)其進(jìn)行篇章級(jí)的文學(xué)翻譯。

該數(shù)據(jù)集從12部網(wǎng)絡(luò)小說(shuō)中各截取了20個(gè)連續(xù)的章節(jié)，涉及如下八種類型：

游戲類（Video Games，VG）

東方玄幻類（Eastern Fantasy，EF）

科幻愛(ài)情類（Sci-fi Romance，SR）

當(dāng)代愛(ài)情類（Contemporary Romance，CR）

玄幻類（Fantasy，F(xiàn)）

科幻類（Science Fiction，SF）

恐怖驚悚類（Horror & Thriller，HT）

玄幻愛(ài)情類（Fantasy Romance，F(xiàn)R）

起初，作者使用d-BLEU進(jìn)行了自動(dòng)評(píng)估，該方法會(huì)與參考樣本進(jìn)行相似度計(jì)算，相似度越高得分也就越高。

具體到本項(xiàng)目當(dāng)中，參考樣本一共有兩組，樣本一是人工給出的翻譯結(jié)果，樣本二是對(duì)網(wǎng)絡(luò)中的雙語(yǔ)文本進(jìn)行對(duì)齊后得到。

結(jié)果，TransAgents的得分并不理想，只有25分，連SOTA的一半都不到。

但這并不意味著TransAgents的翻譯質(zhì)量不行，而是因?yàn)橛孟嗨贫葋?lái)衡量文學(xué)作品翻譯的表現(xiàn)，本身就有失偏頗。

文學(xué)翻譯不是逐字對(duì)照，而是需要在語(yǔ)義、語(yǔ)氣、風(fēng)格等方面進(jìn)行創(chuàng)造性的轉(zhuǎn)換，這些轉(zhuǎn)換可能導(dǎo)致譯文與參考譯文在表面上差異較大，相似度不高自然就不意外了。

所以，作者干脆直接讓真人（至少10人）來(lái)評(píng)價(jià)翻譯的質(zhì)量，順便也讓GPT-4（0125-Preview）來(lái)看了看，在TransAgents、GPT-4（1106-Preview）和真人當(dāng)中，誰(shuí)的翻譯最好。

測(cè)評(píng)者會(huì)看到針對(duì)同一段原文的不同翻譯，其中真人只看譯文，GPT-4則是原文譯文都看。

結(jié)果，真人測(cè)評(píng)者有超過(guò)一半都認(rèn)為TransAgents比人類翻譯得更好，8.4%認(rèn)為兩者質(zhì)量相當(dāng)，GPT-4也認(rèn)為TransAgents比自己（和人類）的翻譯質(zhì)量高。

除了這些大眾評(píng)審之外，兩名專業(yè)的翻譯也認(rèn)為，雖然人工翻譯更加忠實(shí)于原文，但TransAgents給出的翻譯明顯更有文學(xué)色彩，更加簡(jiǎn)潔、在遣詞用句上體現(xiàn)出了語(yǔ)言天賦和深厚的文學(xué)表現(xiàn)力。

MATTR和MTLD測(cè)試指標(biāo)也證明了這一點(diǎn)，尤其是在MTLD上，TransAgents的語(yǔ)言多樣性比真人和GPT-4高出了三分之一左右。

在作者展示的案例中，TransAgents會(huì)根據(jù)目標(biāo)語(yǔ)言的習(xí)慣對(duì)翻譯內(nèi)容做出調(diào)整，真人（Ref1）和GPT-4雖然翻的也沒(méi)錯(cuò)，但相比之下不如TransAgents符合語(yǔ)言習(xí)慣。

另外在前后一致性上，TransAgents也超過(guò)了單純使用GPT-4，對(duì)相同的原文保持使用一樣的譯文。

當(dāng)然，也不是說(shuō)所有類型它都擅長(zhǎng)，在前面提到的8種類型中，TransAgents在游戲、科幻愛(ài)情等類型上的表現(xiàn)突出，而在恐怖驚悚等類型上就比較平庸了。

△圖中虛線代表50%Win rate

同時(shí)作者也發(fā)現(xiàn)，TransAgents在翻譯時(shí)并非“照單全收”，而是會(huì)出現(xiàn)一定程度的遺漏現(xiàn)象。

不過(guò)從測(cè)試中未看過(guò)原文的讀者給出的評(píng)分來(lái)看，這樣的遺漏似乎沒(méi)有影響到他們的閱讀體驗(yàn)。

所以，這家“翻譯公司”是如何運(yùn)行的呢？

多智能體分工協(xié)作

在這個(gè)公司當(dāng)中，不同的智能體分別扮演著CEO、初/高級(jí)編輯、真·翻譯、本地化專家和校對(duì)（Proofreader）這些不同的職位，除CEO外每個(gè)職位各有30人，每個(gè)人擅長(zhǎng)的領(lǐng)域也有所不同，另外還有一個(gè)Ghost Agent。

這些智能體由GPT-4-Turbo驅(qū)動(dòng)，每個(gè)角色都包含姓名、年齡、職位、工作年限及掌握的語(yǔ)言等多維度的設(shè)定。

接到“客戶”的翻譯要求后，CEO會(huì)綜合分析原文和目標(biāo)語(yǔ)言、體裁、目標(biāo)受眾等信息，從幾位高級(jí)編輯中選擇擅長(zhǎng)領(lǐng)域最匹配的一位。

此時(shí)，Ghost Agent會(huì)對(duì)CEO的選擇進(jìn)行評(píng)估，告知其人選是否合適，從而減少選擇失當(dāng)?shù)默F(xiàn)象。

被選定的高級(jí)編輯會(huì)與CEO合作，再次結(jié)合任務(wù)需求和個(gè)人特點(diǎn)，從公司人才庫(kù)中進(jìn)一步選擇初級(jí)編輯、翻譯、本地化專家和校對(duì)等團(tuán)隊(duì)成員。

團(tuán)隊(duì)組建好后，首先由初級(jí)編輯逐章節(jié)識(shí)別所有潛在的關(guān)鍵術(shù)語(yǔ)，生成初始術(shù)語(yǔ)表，交由高級(jí)編輯審查，刪除其中的通用術(shù)語(yǔ)，生成修訂后的術(shù)語(yǔ)表，反復(fù)迭代直到不需要進(jìn)一步修改。

然后，結(jié)合術(shù)語(yǔ)在不同語(yǔ)境下的意義，高級(jí)編輯會(huì)將術(shù)語(yǔ)表中的關(guān)鍵術(shù)語(yǔ)翻譯為目標(biāo)語(yǔ)言。

有了術(shù)語(yǔ)表后，初級(jí)編輯會(huì)為每一章生成詳細(xì)的章節(jié)摘要，盡可能保留關(guān)鍵信息和細(xì)節(jié)，然后還是讓高級(jí)編輯來(lái)審查，并刪除冗余或不必要的信息，讓章節(jié)摘要更加簡(jiǎn)明扼要。

接著，高級(jí)編輯根據(jù)修訂后的章節(jié)摘要編寫全書的摘要，概括主要情節(jié)、人物和主題，并隨機(jī)選擇書中的一章，分析其語(yǔ)氣、風(fēng)格和目標(biāo)受眾，制定翻譯風(fēng)格指南。

翻譯風(fēng)格指南會(huì)發(fā)送給項(xiàng)目團(tuán)隊(duì)所有成員，以確保譯文風(fēng)格的一致性。

根據(jù)風(fēng)格指南，公司中的真·譯員會(huì)逐章節(jié)進(jìn)行初步翻譯，把初稿交給初級(jí)編輯審查，檢查是否遵循翻譯風(fēng)格指南，并提出改進(jìn)意見(jiàn)。

在此基礎(chǔ)之上，高級(jí)編輯會(huì)評(píng)估經(jīng)過(guò)修改的譯文質(zhì)量，決定是否需要進(jìn)一步修改，譯員、初級(jí)編輯和高級(jí)編輯反復(fù)迭代，直到譯文質(zhì)量滿足要求。

但此時(shí)得到的翻譯文本并不是終稿，還要交給本地化專家進(jìn)行調(diào)整。專家會(huì)識(shí)別可能需要文化調(diào)適的內(nèi)容，如習(xí)語(yǔ)、隱喻等等，并對(duì)這些內(nèi)容進(jìn)行調(diào)整，使其在保留原文意圖的基礎(chǔ)之上更貼近目標(biāo)語(yǔ)言和文化。

調(diào)整后的文本會(huì)讓初級(jí)編輯和高級(jí)編輯再次審查，確保譯文在文化適應(yīng)性和忠實(shí)度之間取得平衡。

這之后，還有校對(duì)人員再次檢查語(yǔ)法、拼寫、標(biāo)點(diǎn)和格式錯(cuò)誤，如果有修改，還要再讓編輯進(jìn)一步審核。

這些流程都走完后，高級(jí)編輯會(huì)進(jìn)行最后的終審，重點(diǎn)關(guān)注相鄰章節(jié)之間的連貫性，確保情節(jié)、人物、主題等元素在全書范圍內(nèi)保持一致，一旦發(fā)現(xiàn)問(wèn)題則發(fā)回給前面的團(tuán)隊(duì)成員進(jìn)行修改，直到形成最終的譯本。

如果客戶對(duì)譯本有修改意見(jiàn)，則會(huì)再次由高級(jí)編輯牽頭，組織相關(guān)人員進(jìn)行修改，直到定稿。

不僅是在工作流程上極其嚴(yán)格規(guī)范，在客戶對(duì)譯本滿意后，高級(jí)編輯還會(huì)組織項(xiàng)目團(tuán)隊(duì)“開(kāi)會(huì)”進(jìn)行項(xiàng)目總結(jié)，分享經(jīng)驗(yàn)教訓(xùn)。

過(guò)程中積累的有價(jià)值的術(shù)語(yǔ)、翻譯技巧、文化調(diào)適策略等知識(shí)會(huì)被整理歸納，上傳至公司的知識(shí)庫(kù)，供后續(xù)項(xiàng)目參考。

One More Thing

TransAgents已經(jīng)不是第一個(gè)由智能體組成的“公司”了，去年就有來(lái)自清華的“游戲公司”ChatDev爆紅網(wǎng)絡(luò)，背后所運(yùn)用的核心技術(shù)就是多智能體。

如果把視線放寬，不只看“公司”，還有斯坦福的AI小鎮(zhèn)、清華的AI狼人殺游戲，都在使用多智能體進(jìn)行著真實(shí)人類社會(huì)的模擬。

總之隨著大模型研究的深入，智能體和群體智能實(shí)驗(yàn)已成AI研究最熱門方向之一，而且從這次的TransAgents來(lái)看，多智能體協(xié)同已經(jīng)開(kāi)始顯現(xiàn)出了實(shí)際效益。

（順便提一句，有網(wǎng)友發(fā)現(xiàn)，從斯坦福小鎮(zhèn)到ChatDev，再到這次的TransAgents，多智能體研究的作者是真的喜歡《星露谷物語(yǔ)》式的繪畫風(fēng)格。）

當(dāng)然，也有人對(duì)此表示了擔(dān)憂，認(rèn)為由AI來(lái)主導(dǎo)翻譯，會(huì)導(dǎo)致語(yǔ)言的同質(zhì)化，讓各種語(yǔ)言中獨(dú)特的表達(dá)消失。

更有甚者，已經(jīng)跳出TransAgents本身，想到Ilya對(duì)大規(guī)模Agent合作的恐懼了……

那么你認(rèn)為在群體智能這條路上還能創(chuàng)造出什么新奇的成果呢？歡迎在評(píng)論區(qū)曬出你的腦洞。

上一篇：云計(jì)算如何影響科學(xué)研究的數(shù)據(jù)管理？

下一篇：5G網(wǎng)絡(luò)的普及對(duì)應(yīng)用開(kāi)發(fā)者的創(chuàng)新有何影響？

久久亚洲一区二区三区四区,亚洲熟妇av一区二区三区色堂,国产精品免费大片,精品无码久久久久久久久曰韩邻居

鵝廠造了個(gè)AI翻譯公司：專攻網(wǎng)絡(luò)小說(shuō)，自動(dòng)適配語(yǔ)言風(fēng)格，真人和GPT-4看了都說(shuō)好

猜你喜歡

熱門文章

物聯(lián)網(wǎng)卡和手機(jī)卡有什么區(qū)別？

物聯(lián)卡是正規(guī)卡嗎

定向流量和通用流量的區(qū)別

沃卡惠怎么補(bǔ)卡？

沃卡惠流量卡怎么樣?

產(chǎn)品推薦

新聞動(dòng)態(tài)

《與沃同行》-“綠肥紅瘦”刊

端午安康！愛(ài)吃咸粽的看過(guò)來(lái)！

清明節(jié)｜緬懷先人，也要關(guān)愛(ài)家人

女神節(jié)| 灼灼其華，你是最美的花

團(tuán)圓時(shí)刻，燈謎增趣！你準(zhǔn)備好了嗎？

關(guān)注我們

鵝廠造了個(gè)AI翻譯公司：專攻網(wǎng)絡(luò)小說(shuō)，自動(dòng)適配語(yǔ)言風(fēng)格，真人和GPT-4看了都說(shuō)好

猜你喜歡

熱門文章

產(chǎn)品推薦

新聞動(dòng)態(tài)

關(guān)注我們

微信公眾號(hào)

鵝廠造了個(gè)AI翻譯公司：專攻網(wǎng)絡(luò)小說(shuō)，自動(dòng)適配語(yǔ)言風(fēng)格，真人和GPT-4看了都說(shuō)好