文 | 楊蘇穎
來(lái)源 | 智能相對(duì)論
在前文字時(shí)代,聲音曾經(jīng)是人類(lèi)唯一的交流工具。由于聲音的傳播距離非常有限,所以那個(gè)時(shí)候人類(lèi)的生存以“部落”為單位,關(guān)系十分緊密。后來(lái)隨著傳播媒介的一步步發(fā)展,我們開(kāi)始不再需要彼此近距離交流就能獲得大量信息,反而,卻開(kāi)始突然懷念單一的聲音帶給我們的感覺(jué),這種最原始的媒介承載著人類(lèi)最充沛的情感。
今年1月份,世界首部利用人工智能模擬人聲的紀(jì)錄片在央視播出,而這部名為《創(chuàng)新中國(guó)》的紀(jì)錄片解說(shuō)詞卻全程是由在2013年就“已逝”的聲音完成的。這個(gè)奇跡的背后是科大訊飛利用語(yǔ)言合成技術(shù)成功幫AI模擬出了我國(guó)已故著名配音演員,語(yǔ)言藝術(shù)家李易的聲音。
科大訊飛強(qiáng)勁的語(yǔ)言合成技術(shù)讓AI模擬的聲音成功打動(dòng)了李易老師的學(xué)生、朋友和家人。在A(yíng)I自然流暢的語(yǔ)言解說(shuō)當(dāng)中,似乎還能再見(jiàn)故人的音容笑貌??拼笥嶏w這項(xiàng)語(yǔ)音合成技術(shù)主要由三個(gè)步驟構(gòu)成:
一是輸入文本,讓機(jī)器模擬人對(duì)自然語(yǔ)言的理解過(guò)程,對(duì)文本進(jìn)行語(yǔ)言處理,主要包括文本規(guī)整、詞語(yǔ)切分、語(yǔ)法語(yǔ)義分析,然后給出后續(xù)步驟所需要的發(fā)音提示;
二是規(guī)劃音段特征,比如音調(diào)、音長(zhǎng)、音重等等,讓機(jī)器可以對(duì)語(yǔ)言的特有韻律進(jìn)行處理,使機(jī)器模擬的聲音更自然并且更準(zhǔn)確地傳達(dá)實(shí)際語(yǔ)義。
最后根據(jù)前兩部分處理的結(jié)果進(jìn)行語(yǔ)音合成即可。通過(guò)這幾個(gè)步驟,AI模擬的聲音與人聲已經(jīng)非常相似,即使是最熟悉的人在某些情況下也很難分辨機(jī)器人與人聲的界限。
AI配音拉動(dòng)的兩駕“馬車(chē)”
那么這么驚艷的人工智能配音技術(shù),它的邊界究竟能夠延伸到多遠(yuǎn)的地方呢?智能相對(duì)論分析師楊蘇穎就此提出了人工智能配音的兩個(gè)用武之地。
1、“粉絲經(jīng)濟(jì)”向AI配音伸出“橄欖枝”?
“粉絲經(jīng)濟(jì)”已經(jīng)成為現(xiàn)在文娛產(chǎn)業(yè)經(jīng)濟(jì)增長(zhǎng)的主要支柱之一。隨著最近養(yǎng)成類(lèi)偶像節(jié)目的火爆,粉絲對(duì)明星投入的情感越來(lái)越多,隨之帶動(dòng)這個(gè)群體為明星付費(fèi)的意愿同樣水漲船高。網(wǎng)傳范冰冰弟弟范丞丞在新浪微博發(fā)布付費(fèi)閱讀的自拍,一夜徒手狂賺幾百萬(wàn)(后遭到經(jīng)紀(jì)人否認(rèn))。既然,明星的周邊如此火爆,何不運(yùn)用配合人工智能語(yǔ)音合成的VR、AR技術(shù)來(lái)打造的虛擬范丞丞們,讓他們更真實(shí)地出現(xiàn)在粉絲的日常生活當(dāng)中呢?要深挖中國(guó)的粉絲潛力,比起像騰訊視頻之前在明日之子上打造虛擬二次元偶像“荷茲”,聽(tīng)著現(xiàn)實(shí)當(dāng)中熟悉的偶像聲音叫自己起床,陪自己聊天,這樣的虛擬真人版偶像或許更能得到粉絲認(rèn)可。
2、AI配音是音也是“藥”
據(jù)國(guó)外媒體報(bào)道,有研究表明,年邁夫婦可能因?yàn)橐环絾逝级龃笏劳雎剩@種現(xiàn)象被稱(chēng)為“心碎綜合癥”。這項(xiàng)研究由哈佛大學(xué)和威斯康斯大學(xué)麥迪遜分校的兩位科學(xué)家負(fù)責(zé),研究結(jié)果顯示,男性喪妻后“全因死亡率”的概率增大了18%,女性喪夫后“全死因死亡率”的概率增大了16%。并且我們還可以做一個(gè)合理推斷,在其他喪子或者喪雙親的情況下,這種“心碎綜合癥”的表現(xiàn)也一定存在,比如在唐山大地震和汶川地震之后。心理學(xué)家表示,要想修復(fù)這種創(chuàng)傷是非常困難的。但是人工智能配音的AI或許可以做到呢,它能夠利用過(guò)去已有的音頻合成親人的聲音,如果心理醫(yī)生說(shuō)的話(huà)能夠用親人的聲音來(lái)傳達(dá),也許可以幫助病人更快地走出陰霾。
AI 配音在舞臺(tái)上也會(huì)唱“黑臉”
但是,一切技術(shù)都是刀子的翻版,人工智能配音技術(shù)解決問(wèn)題的同時(shí)也會(huì)引發(fā)新的問(wèn)題,智能相對(duì)論分析師楊蘇穎認(rèn)為,這項(xiàng)技術(shù)在廣泛落地之前還要接受不少拷問(wèn)。
1、AI盜用聲音卻能“無(wú)罪釋放”?
手機(jī)里高德地圖我們足夠熟悉,但大家不知道的可能是其導(dǎo)航應(yīng)用所采用林志玲聲音其實(shí)部分是采用了人工智能配音技術(shù)后期合成的。那么大家可能覺(jué)得語(yǔ)音合成必須得提前去技術(shù)公司錄制這樣一段純凈的聲音。
但是事實(shí)上,語(yǔ)音合成卻對(duì)音頻質(zhì)量沒(méi)有那么高的要求,利用海量的互聯(lián)網(wǎng)音頻也可以實(shí)現(xiàn)人聲模仿。Google Research軟件工程師發(fā)表論文《Looking to Listen atthe Cocktail Party》采用的全新視聽(tīng)模型可以在不同噪音之中,把重疊的人聲分離出來(lái),形成每一位說(shuō)話(huà)者單獨(dú)純凈的音頻信號(hào)。同時(shí),訊飛也提出以全自動(dòng)無(wú)監(jiān)督方法快速得到單個(gè)目標(biāo)發(fā)音人的純凈音庫(kù)。
之前伯明翰阿拉巴馬大學(xué)的一項(xiàng)調(diào)查表明,如果給予AI的的信息足夠多,它可以生成任何人以假亂真的圖片或者視頻?,F(xiàn)在個(gè)人的聲音已經(jīng)越來(lái)越成為個(gè)人身份的標(biāo)志之一,對(duì)個(gè)人聲音利益的侵害也同肖像一樣可能造成個(gè)人人格尊嚴(yán)和財(cái)產(chǎn)利益上的損失。我們知道明星的形象擁有肖像權(quán),如果他們的照片被他人私自用作商業(yè)用途時(shí),他們可以一紙?jiān)V狀將別人告上法庭維護(hù)自己的肖像權(quán)。但是目前在我國(guó)立法界及學(xué)界對(duì)聲音權(quán)的保護(hù)卻仍無(wú)統(tǒng)一定論,如果個(gè)人的聲音被別人盜用是沒(méi)有法律能夠?qū)ζ溥M(jìn)行保護(hù)的。
2、AI配音攪局聲紋識(shí)別
大家可能聽(tīng)說(shuō)過(guò)聲紋鑒定,一般來(lái)說(shuō)人的發(fā)聲具有特定性和穩(wěn)定性,雖不能說(shuō)完全達(dá)到了指紋那樣精確的程度,卻仍然有越來(lái)越多國(guó)家已經(jīng)把聲紋鑒定作為辨認(rèn)犯罪嫌疑人的重要手段。
但在GeekPwn2017國(guó)際安全極客大賽上,白帽黑客們卻上演了一場(chǎng)與聲紋識(shí)別的對(duì)弈。現(xiàn)場(chǎng)5組選手有4組根據(jù)《王者榮耀》里英雄妲己的聲音樣本,利用AI語(yǔ)音合成技術(shù)模擬妲己聲音通過(guò)“聲紋鎖”的驗(yàn)證,成功欺騙了語(yǔ)音驗(yàn)證系統(tǒng),這意味著利用個(gè)人聲音驗(yàn)證身份可能沒(méi)那么靠譜。
“聲紋識(shí)別”在現(xiàn)實(shí)當(dāng)中用途十分廣泛,離我們最近的有手機(jī)聲紋解鎖,另外,在智能家居產(chǎn)品當(dāng)中,以及公共安全領(lǐng)域,它也有許多落地點(diǎn)。但是當(dāng)聲紋識(shí)別碰上了AI語(yǔ)音合成技術(shù),一場(chǎng)智能的博弈就開(kāi)始了,一不小心就會(huì)打開(kāi)個(gè)人隱私安全的潘多拉魔盒。AI語(yǔ)音合成技術(shù)越高明,挾持該技術(shù)的人就能越輕而易舉的闖入你的生活。
此外,在警察偵查工作中,原本進(jìn)行聲紋分析可以判斷說(shuō)話(huà)人的性別、年齡、方言(生活地區(qū))等特征為偵查提供方向和范圍,但 AI配音的干擾要求刑偵手段需迅速跟上科技發(fā)展的步伐,否則聲紋鑒定的有效性就會(huì)受到普遍質(zhì)疑,司法判決的過(guò)程也會(huì)變得異常艱難,這無(wú)疑是為犯罪者提供了另一層保護(hù)傘。
3、AI能不能別老和藝術(shù)家杠上?
AI配音在《創(chuàng)新中國(guó)》中的表現(xiàn)非常令人吃驚,人類(lèi)激動(dòng)的眼淚印證了語(yǔ)音合成技術(shù)的成功。因此,不禁有人發(fā)問(wèn),AI配音如果在行業(yè)里廣泛應(yīng)用會(huì)否取代傳統(tǒng)的配音演員呢?配音演員由四字組成,不僅重在“配音”,其實(shí)亦重在“演員”。今年年初口碑爆棚的綜藝《聲臨其境》在展示了優(yōu)秀演員的配音功力同時(shí),也讓觀(guān)眾看到在配音間里,配音者不僅僅是提供聲音,更要演戲。因?yàn)榕湟舯仨氁蟿”窘巧那榫w,甚至包括呼吸的頻率都要對(duì)得上。
目前要建立機(jī)器的情感識(shí)別系統(tǒng)已經(jīng)非常困難,機(jī)器深度學(xué)習(xí)需要大量數(shù)據(jù)進(jìn)行量化分析,而人類(lèi)情感是最難以被量化的存在。所以更別說(shuō)讓機(jī)器去生產(chǎn)情感從而進(jìn)行配音表演。配音演員和演員這兩種職業(yè)本就異曲同工,所以AI配音取代傳統(tǒng)配音演員獨(dú)立參與影視劇制作是不可能的。
不過(guò),AI配音代替游戲配音和讀書(shū)配音倒是不錯(cuò)的選擇。像四平八穩(wěn)的紀(jì)錄片一樣,這類(lèi)配音并不需要調(diào)動(dòng)太多的情感,就算人工智能配音需要存在幾種不同的感*彩,機(jī)器學(xué)習(xí)的量也在可控制的范圍之內(nèi),不會(huì)像影視劇那樣復(fù)雜。
在A(yíng)I配音這件事情上,有人拍案叫絕,有人憂(yōu)心忡忡。技術(shù)善論技術(shù)惡論的對(duì)峙不會(huì)停止,但是只要控制的閥門(mén)還掌握在人類(lèi)的手中,一切就不會(huì)那么糟。
【完】
智能相對(duì)論:深挖人工智能這口井,評(píng)出咸淡,講出黑白,道出vb深淺。重點(diǎn)關(guān)注領(lǐng)域:AI+醫(yī)療、機(jī)器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開(kāi)發(fā)者以及背后的芯片、算法、人機(jī)交互等。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專(zhuān)業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
個(gè)人創(chuàng)業(yè)需要啟動(dòng)成本低、無(wú)需龐大團(tuán)隊(duì)、可快速驗(yàn)證、能利用個(gè)人技能或資源。這里分享適合個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會(huì)一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個(gè)人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫(xiě)多語(yǔ)言產(chǎn)品描述,為小紅書(shū)博主生成爆款文案,為小公司制作營(yíng)銷(xiāo)
文/道哥美國(guó)設(shè)計(jì)軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價(jià)定每股33美元,開(kāi)盤(pán)報(bào)價(jià)85美元,較發(fā)行價(jià)翻倍。首日收?qǐng)?bào)115.50美元,較發(fā)行價(jià)大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來(lái)同等規(guī)模美股IPO的最大單日漲幅紀(jì)錄。然而,隨著短線(xiàn)資金獲利了結(jié),
文/一燈來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)在當(dāng)前無(wú)人敢缺席的AI軍備競(jìng)賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場(chǎng)勾勒著未來(lái)的宏偉藍(lán)圖。在各家動(dòng)輒千億級(jí)投入的背景下,市場(chǎng)迫切需要一份關(guān)于A(yíng)I回報(bào)價(jià)值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財(cái)報(bào)。盡管資本開(kāi)支同比劇增119%,達(dá)
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)2025年的硅谷,一場(chǎng)沒(méi)有硝煙的戰(zhàn)爭(zhēng)正以前所未有的烈度上演。這場(chǎng)戰(zhàn)爭(zhēng)的核心武器不是代碼或芯片,而是人——那些全球僅有數(shù)千名、能夠構(gòu)建未來(lái)人工智能基礎(chǔ)模型的頂尖大腦。在這場(chǎng)激烈的人才爭(zhēng)奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的
“養(yǎng)龍蝦”到底要花多少錢(qián)?這個(gè)問(wèn)題可能是大家最關(guān)心的。我們把成本拆成三部分:服務(wù)器租用費(fèi)+大模型API調(diào)用費(fèi)+雜項(xiàng)開(kāi)銷(xiāo)。第一部分:服務(wù)器租用費(fèi)。最省錢(qián)的方案當(dāng)然是本地舊電腦自托管——零新增成本,電費(fèi)忽略不計(jì)。但如前所述,你需要接受“不是7×24小時(shí)在線(xiàn)”的局限性。如果選擇云服務(wù)器,成本差異就很大了。
不少朋友第一次接觸OpenClaw時(shí),都會(huì)有一個(gè)相同的困惑:這玩意兒到底該裝在哪里?OpenClaw(社區(qū)戲稱(chēng)“養(yǎng)龍蝦”,因Logo為龍蝦鉗)不是普通的聊天機(jī)器人,而是一款本地優(yōu)先、可自主執(zhí)行、支持多Agent分工協(xié)作的AI執(zhí)行網(wǎng)關(guān)。說(shuō)白了,它讓大模型從“只會(huì)說(shuō)話(huà)”變成“會(huì)動(dòng)手做事”——幫你管理文件
01別相信“一鍵養(yǎng)蝦,躺平賺錢(qián)”的鬼話(huà)打開(kāi)社交媒體,你可能會(huì)看到這樣的標(biāo)題:“養(yǎng)只龍蝦自動(dòng)炒股,零代碼養(yǎng)出數(shù)字巴菲特!”信了,你就輸了。真實(shí)情況是:一個(gè)做跨境電商的小哥花了200元租服務(wù)器、訂閱API,指望龍蝦幫他炒股暴富。結(jié)果龍蝦開(kāi)始幾天還像模像樣,后來(lái)直接擺爛,生成個(gè)干癟的大綱就敷衍了事。AI是
一張證書(shū)引發(fā)的討論4月7日,北京嫣然天使兒童醫(yī)院給陳光標(biāo)發(fā)了一張感謝證書(shū),感謝他捐贈(zèng)1000萬(wàn)元。這事說(shuō)起來(lái)挺曲折的。此前陳光標(biāo)高調(diào)說(shuō)要贈(zèng)給張雪一臺(tái)價(jià)值1300萬(wàn)元的勞斯萊斯,張雪回應(yīng)“收了,八折賣(mài)掉捐給嫣然”,一番拉扯之后,陳光標(biāo)把車(chē)變現(xiàn),1000萬(wàn)元直接打到了嫣然醫(yī)院賬上。醫(yī)院發(fā)證書(shū)感謝,本來(lái)是
2026年4月7日,國(guó)家安全部就AI核心術(shù)語(yǔ)“詞元”(Token)發(fā)布安全警示,強(qiáng)調(diào)在日均調(diào)用量突破140萬(wàn)億規(guī)模的市場(chǎng)背景下,需高度警惕由此引發(fā)的數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)。據(jù)統(tǒng)計(jì),截至今年3月,我國(guó)日均詞元調(diào)用量已超過(guò)140萬(wàn)億,較2024年初增長(zhǎng)1000多倍。詞元作為大模型處理信息的最小單元,兼具
如今出門(mén),如果你還沒(méi)用過(guò)AI智能助手,可能真有點(diǎn)跟不上節(jié)奏了。無(wú)論是寫(xiě)作文、查資料,還是規(guī)劃出行路線(xiàn),越來(lái)越多的人已經(jīng)習(xí)慣隨手打開(kāi)AI問(wèn)一句。這股熱潮背后,中國(guó)AI大模型用實(shí)打?qū)嵉臄?shù)據(jù)交出了一份亮眼的成績(jī)單。根據(jù)全球知名AI模型聚合平臺(tái)OpenRouter的最新數(shù)據(jù),在3月30日至4月5日這一周,中
01別在主電腦上養(yǎng)!這是最最重要的一條“保命”建議。很多小白心血來(lái)潮,直接在自己存著畢業(yè)論文、工作文件、銀行卡信息的主力電腦上部署OpenClaw。然后悲劇發(fā)生了:讓龍蝦幫忙整理一下桌面文件,結(jié)果它把整臺(tái)電腦的文件全刪了。這不是段子,是真事。OpenClaw一旦被授予高權(quán)限,就能執(zhí)行刪除、修改等不可
01免費(fèi)領(lǐng)養(yǎng),但飼料要錢(qián)很多人第一次聽(tīng)說(shuō)OpenClaw時(shí),腦子里冒出的第一個(gè)念頭是:開(kāi)源軟件,那不免費(fèi)嗎?沒(méi)錯(cuò),OpenClaw本身確實(shí)是開(kāi)源的,下載安裝一分錢(qián)不收。但你很快就會(huì)發(fā)現(xiàn),真正的開(kāi)銷(xiāo)根本不在這里。養(yǎng)一只“龍蝦”,就像領(lǐng)養(yǎng)了一只寵物——領(lǐng)養(yǎng)免費(fèi),但“蝦缸”“蝦糧”“蝦保姆”都得自己掏錢(qián)。
一只“龍蝦”,火遍全網(wǎng)“今天你養(yǎng)龍蝦了嗎?”這句話(huà)在2026年初,迅速取代“吃了嗎”成為社交媒體上的新晉暗號(hào)。別誤會(huì),這不是什么水產(chǎn)養(yǎng)殖新風(fēng)口。這里說(shuō)的“龍蝦”,是一款名為OpenClaw的開(kāi)源AI智能體。因?yàn)樗膱D標(biāo)是一只紅色龍蝦,網(wǎng)友們便把部署、配置和使用它的過(guò)程,戲稱(chēng)為“養(yǎng)龍蝦”。一個(gè)開(kāi)源軟件
凌晨?jī)牲c(diǎn),小王合上筆記本,揉了揉酸脹的眼睛。花了一個(gè)月寫(xiě)出來(lái)的10萬(wàn)字短劇劇本躺在硬盤(pán)里,要真正把它拍成劇,得找演員、租場(chǎng)地、請(qǐng)攝像、做后期……粗算下來(lái)少說(shuō)要幾十萬(wàn),他只能把劇本繼續(xù)鎖在抽屜里。不過(guò),現(xiàn)在小王的劇本可以“見(jiàn)光”了。2026年3月19日,字節(jié)跳動(dòng)旗下的小云雀AI正式上線(xiàn)了短劇Agent