當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

翻譯應(yīng)用再+1,網(wǎng)易、科大訊飛正在挖掘的AI+動(dòng)漫市場(chǎng)?

 2021-03-22 20:04  來(lái)源: A5專(zhuān)欄   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

“由于漢化組成員身體抱恙,本周暫時(shí)停止更新。”看到這樣的消息,小武嘆了口氣,默默退出應(yīng)用程序。這已經(jīng)是他喜歡的動(dòng)漫在兩個(gè)月內(nèi)的第三次停更了。

環(huán)視四周,上下班時(shí)間的公交和地鐵上,隨處可見(jiàn)戴著耳機(jī)盯著手機(jī)屏幕、利用碎片時(shí)間追番看劇的年輕人。在步調(diào)緊湊的現(xiàn)代生活中,觀(guān)看影視劇和動(dòng)漫已經(jīng)成為不少上班族的日常娛樂(lè)消遣。

信息傳播的日漸便利,讓人們有機(jī)會(huì)在網(wǎng)絡(luò)上觀(guān)賞更多來(lái)自不同國(guó)家地區(qū)、各式各樣題材的影視動(dòng)漫作品。但在那之前,字幕、對(duì)話(huà)的翻譯與排版,以及改漫作品的圖像繪制可是一項(xiàng)耗費(fèi)人力物力及時(shí)間的大工程。一些較少人關(guān)注的小眾作品經(jīng)常因?yàn)榉g問(wèn)題而無(wú)法及時(shí)更新。

“像我喜歡的一些動(dòng)漫及小說(shuō)、影集改漫作品,可能受眾太少吧,大型平臺(tái)沒(méi)有引進(jìn),只能通過(guò)特定的粉絲論壇和網(wǎng)站收看。但這些網(wǎng)站的漢化時(shí)間與翻譯質(zhì)量十分不穩(wěn)定,有時(shí)也挺糟心的。”即便作品內(nèi)容可以及時(shí)更新,但缺少了漢化翻譯,像小武這類(lèi)沒(méi)有日文基礎(chǔ)的讀者根本無(wú)法理解劇情發(fā)展。

隨著科技進(jìn)步,人工智能已經(jīng)能在文本、圖像的識(shí)別與翻譯方面發(fā)揮不少作用,應(yīng)用及商業(yè)化也早已成熟, Google、微軟等不少互聯(lián)網(wǎng)及科技公司都曾推出相關(guān)的服務(wù)。

“智能相對(duì)論”看到, 國(guó)內(nèi)的互聯(lián)網(wǎng)公司也推出了不少AI翻譯產(chǎn)品,并已取得不錯(cuò)的商業(yè)成果。如百度大腦AI開(kāi)放平臺(tái)就推出了在線(xiàn)通用文本翻譯業(yè)務(wù),可實(shí)現(xiàn)兩百個(gè)以上的語(yǔ)種在線(xiàn)互譯,做到實(shí)時(shí)文本翻譯及譯文語(yǔ)音合成,能應(yīng)用于移動(dòng)端、PC網(wǎng)站及各類(lèi)智能硬件。

其文檔翻譯及圖片翻譯功能則可識(shí)別不同檔案及圖片格式,在不改變文檔格式的前提下完成翻譯工作。去年三月,百度翻譯的每日翻譯量已達(dá)到千億次;也為滬江網(wǎng)校、OPPO、海淘1號(hào)等不同領(lǐng)域的企業(yè)提供通用文本翻譯服務(wù)。

網(wǎng)易的有道智云平臺(tái)也提供實(shí)時(shí)語(yǔ)音翻譯、文本翻譯、圖片翻譯及部份語(yǔ)言離線(xiàn)翻譯等服務(wù),支持超過(guò)110個(gè)語(yǔ)種的自動(dòng)識(shí)別與互譯,能為直播、錄播視頻提供實(shí)時(shí)字幕轉(zhuǎn)寫(xiě)翻譯。騰訊云也推出了機(jī)器翻譯產(chǎn)品,可實(shí)現(xiàn)文本翻譯、語(yǔ)音翻譯、圖像翻譯等多種功能,支持API方式接入。

科大訊飛則基于語(yǔ)音識(shí)別技術(shù)推出了一個(gè)視頻譯制智能協(xié)作平臺(tái),這款A(yù).I.視頻字幕制作應(yīng)用具備自動(dòng)創(chuàng)建視頻字幕、字幕機(jī)器翻譯、在線(xiàn)校對(duì)、譯后編輯和團(tuán)隊(duì)協(xié)作等功能,可利用人工智能機(jī)器翻譯,自動(dòng)為外國(guó)視頻添加中文字幕,目前累計(jì)用戶(hù)為105萬(wàn)。

即便現(xiàn)有的AI翻譯產(chǎn)品種類(lèi)多樣,但漫畫(huà)的表現(xiàn)形式與一般文本不同,其翻譯嵌字問(wèn)題并非一般的翻譯軟件就能解決。

來(lái)自不同角色的對(duì)話(huà)、擬聲詞、文字注解、旁白等主體和作用不同的文字都會(huì)出現(xiàn)在同一幅圖片中,一頁(yè)漫畫(huà)中的文字通常包含多種字體、大小,且漫畫(huà)中的對(duì)話(huà)框文本排版并無(wú)規(guī)律。面對(duì)此類(lèi)特殊的表現(xiàn)形式,普通的翻譯軟件往往無(wú)法完整地讀取、識(shí)別所有需要翻譯的文字。

“之前我曾經(jīng)試過(guò)將原文漫畫(huà)圖片上傳翻譯軟件,但效果不佳。翻譯出來(lái)的文字經(jīng)常超出對(duì)話(huà)框,一些手繪、異形及不同大小的文字經(jīng)常沒(méi)法識(shí)別,整體而言作用不大 ,試過(guò)一次就沒(méi)再用了。”小武告訴“智能相對(duì)論”。

為了幫助像小武這類(lèi)的讀者即時(shí)看到翻譯完成的作品,并解決民翻盜版問(wèn)題。去年,一家專(zhuān)門(mén)從事漫畫(huà)的機(jī)器翻譯技術(shù)公司完成了一款從識(shí)別、翻譯到嵌字都能自動(dòng)完成的AI自動(dòng)翻譯系統(tǒng)“Mantra Engine”。

AI漢化組coming

漫畫(huà)的翻譯工作主要可分為文本轉(zhuǎn)錄識(shí)別、對(duì)話(huà)框內(nèi)及背景文字翻譯、翻譯后的文本排版三個(gè)步驟。

在文本識(shí)別方面,Mantra的研究團(tuán)隊(duì)開(kāi)發(fā)了專(zhuān)門(mén)用于漫畫(huà)字符識(shí)別的OCR引擎,可定位識(shí)別來(lái)自不同角色的對(duì)話(huà)、擬聲詞、文字注解、旁白等主體和作用不同的異形文字,即便漫畫(huà)圖片十分擁擠也能夠辨識(shí)。

在內(nèi)容翻譯上,這款應(yīng)用程序針對(duì)漫畫(huà)常出現(xiàn)的,因角色轉(zhuǎn)換或畫(huà)面連貫造成的主賓語(yǔ)銜接或缺位口語(yǔ)對(duì)話(huà)模式,以及傳統(tǒng)商務(wù)翻譯中少見(jiàn)的口吃與結(jié)巴等特殊句式加強(qiáng)訓(xùn)練。

通過(guò)文本分組、文本閱讀順序、提取視覺(jué)語(yǔ)義三種方式,結(jié)合對(duì)話(huà)語(yǔ)意和角色情緒、動(dòng)作,實(shí)現(xiàn)多模態(tài)的上下文感知,幫助翻譯出最符合角色人設(shè)、表情與情感的多語(yǔ)言譯文。

作為一套AI自動(dòng)化翻譯引擎,Mantra可自動(dòng)擦除原文字符,并于圖像上嵌入符合譯文語(yǔ)言形態(tài)的文字排版,包含對(duì)話(huà)框的增減、拆分與文字對(duì)齊等功能。為漫畫(huà)翻譯中耗時(shí)最久、人力成本最高的嵌字工作提供更加快速有效的自動(dòng)化解決方案。

實(shí)驗(yàn)結(jié)果顯示,這款程序比傳統(tǒng)人工翻譯所需時(shí)間減少了一半;整體而言可減少六成至七成的翻譯成本。目前,這套系統(tǒng)可輸出JPG、PNG和PDF等格式,但能翻譯的語(yǔ)言并不太多,翻譯結(jié)果也仍需人工修正。

研究團(tuán)隊(duì)表示,下一步將提高翻譯準(zhǔn)確度,開(kāi)發(fā)針對(duì)漫畫(huà)表情的識(shí)別系統(tǒng),并計(jì)劃拓展可用語(yǔ)言。希望能將該技術(shù)以計(jì)量收費(fèi)的形式,幫助漫畫(huà)出版行業(yè)拓展海外市場(chǎng),并協(xié)助漫畫(huà)作者在社交媒體上自由地發(fā)布作品。

有待發(fā)現(xiàn)的需求

事實(shí)上,Mantra自動(dòng)翻譯系統(tǒng)的誕生并非由于研發(fā)團(tuán)隊(duì)創(chuàng)造了全新的先進(jìn)技術(shù),而是研發(fā)者看到細(xì)分市場(chǎng)的需求,將已經(jīng)發(fā)展成熟的AI翻譯技術(shù)與圖像識(shí)別轉(zhuǎn)換加以融合應(yīng)用,試圖優(yōu)化現(xiàn)有的生產(chǎn)方式,希望在降低成本的同時(shí)提高產(chǎn)出效率。

雖然國(guó)內(nèi)的OCR識(shí)別與AI文本翻譯技術(shù)早已成熟,除了漫畫(huà)漢化所需的自動(dòng)嵌字技術(shù)尚待開(kāi)發(fā),不少互聯(lián)網(wǎng)公司已有能力提供多種類(lèi)型的AI翻譯服務(wù)。但在商業(yè)應(yīng)用方面,仍集中于商務(wù)交流、出國(guó)旅游、教育學(xué)習(xí)方面。

目前市面上應(yīng)用于影視文化、知識(shí)產(chǎn)權(quán)等文化產(chǎn)業(yè)的AI翻譯產(chǎn)品大多為基于語(yǔ)音識(shí)別技術(shù)的視頻字幕語(yǔ)言轉(zhuǎn)換服務(wù),針對(duì)漫畫(huà)及圖書(shū)繪本的翻譯需求所設(shè)計(jì)的自動(dòng)化解決方案尚未出現(xiàn),漫畫(huà)翻譯的市場(chǎng)需求似乎仍未受到關(guān)注。

“智能相對(duì)論”以百度為例,其文字識(shí)別服務(wù)雖包含卡證、票據(jù)等多場(chǎng)景的OCR識(shí)別,使用方式有云端、離現(xiàn)實(shí)別SDK、私有化部署等;文字翻譯方面,也提供AI翻譯定制化服務(wù),可由用戶(hù)自行上傳特定領(lǐng)域的語(yǔ)料庫(kù),為AI翻譯模型進(jìn)行訓(xùn)練。但在應(yīng)用場(chǎng)景上仍需要客戶(hù)“自行想象”,尚未發(fā)展出像Mantra那樣專(zhuān)門(mén)針對(duì)漫畫(huà)、指向明確的自動(dòng)化“一條龍”翻譯服務(wù)。

近年,國(guó)內(nèi)語(yǔ)言服務(wù)行業(yè)涉及的翻譯服務(wù)領(lǐng)域呈現(xiàn)多樣化。 《2019中國(guó)語(yǔ)言服務(wù)行業(yè)發(fā)展報(bào)告》顯示,在受訪(fǎng)企業(yè)中,影視文化與知識(shí)產(chǎn)權(quán)的訂單占比各占36.7%和36%。國(guó)內(nèi)二次元群體不斷擴(kuò)大,在線(xiàn)動(dòng)漫市場(chǎng)規(guī)模持續(xù)增長(zhǎng),用戶(hù)為內(nèi)容付費(fèi)進(jìn)出口逆差也不斷增加,漫畫(huà)翻譯的市場(chǎng)需求也逐漸明顯。

Mantra的出現(xiàn)為人工智能在動(dòng)漫制作與傳播方面開(kāi)啟了新的應(yīng)用模式與細(xì)分市場(chǎng)。從生產(chǎn)商與出版社的角度而言,可節(jié)省創(chuàng)作時(shí)間與勞動(dòng)成本,在促進(jìn)作品的海外傳播效率并防止盜版;站在小武等讀者的立場(chǎng),能更快看到新鮮出爐的作品,不再為語(yǔ)言翻譯問(wèn)題所苦。

在二次元文化“出圈”、動(dòng)漫受眾不斷增加的今日,AI所帶來(lái)的生產(chǎn)力與傳播效率提升,或可帶來(lái)不少商業(yè)機(jī)會(huì)。以動(dòng)漫大國(guó)日本為例,據(jù)日本出版科學(xué)研究所統(tǒng)計(jì),2020年,日本漫畫(huà)市場(chǎng)規(guī)模較上一年增加23%,達(dá)6126億日元,創(chuàng)1978年開(kāi)始統(tǒng)計(jì)以來(lái)的最高紀(jì)錄。

據(jù)艾瑞咨詢(xún)統(tǒng)計(jì),中國(guó)泛二次元用戶(hù)規(guī)模自2014年來(lái)持續(xù)上升,至2019年已達(dá)3.9億人,在線(xiàn)動(dòng)畫(huà)及漫畫(huà)市場(chǎng)規(guī)模進(jìn)入穩(wěn)步增長(zhǎng)?!?020微博動(dòng)漫白皮書(shū)》顯示,微博泛二次元用戶(hù)同比增長(zhǎng)11.4%,連續(xù)4年保持穩(wěn)定增長(zhǎng);54%的動(dòng)漫用戶(hù)是內(nèi)容付費(fèi)用戶(hù)。在泛娛樂(lè)融合的產(chǎn)業(yè)背景下,動(dòng)漫行業(yè)前景可觀(guān)。

一如Clubhouse的爆火,即便多人在線(xiàn)語(yǔ)音通訊技術(shù)早已成熟、語(yǔ)音社交早已出現(xiàn),仍有部份需求未被覆蓋。就像Mantra告訴我們的,一些AI技術(shù)發(fā)展成熟后想要走的更遠(yuǎn),還需要更有想象力的應(yīng)用場(chǎng)景。對(duì)于掌握成熟AI翻譯技術(shù)的百度、網(wǎng)易、科大訊飛等企業(yè)而言,AI自動(dòng)翻譯漫畫(huà)這個(gè)暫時(shí)未被注意的應(yīng)用場(chǎng)景或許能帶來(lái)新的機(jī)會(huì)。

文/ 智能相對(duì)論(ID:aixdlun)

作者/ 離離

*本文圖片均來(lái)源于網(wǎng)絡(luò)

深挖智能這口井,同好添加vx:zhinengxiaoyan

此內(nèi)容為【智能相對(duì)論】原創(chuàng),

僅代表個(gè)人觀(guān)點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。

部分圖片來(lái)自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。

 

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
ai翻譯
科大訊飛

相關(guān)文章

熱門(mén)排行

信息推薦