聲音鑒黃師飽受摧殘，AI聲音鑒黃師為何沒幫上忙？

2018-09-26 14:11 來源：A5專欄我來投稿撤稿糾錯

文|雷宇

來源|智能相對論(aixdlun)

人民對性的態(tài)度向來很奇怪，父母和長輩期待子女能無師自通，教育者三緘其口，最后少男少女通過其他渠道實現(xiàn)了對性的初級摸索，當然這個摸索過程就很曲折了，文字，圖片，視頻和音頻遍地開花，“學習資料”越來越方便傳播。

食也性也，但傳播色情內(nèi)容卻有極大的負外部效應，懵懂少男少女極易受其蠱惑，鑒黃師的重要性可想而知。在蘋果商店的社交App中，有超過1/10的應用主打聲音社交功能，由此催生出了一個新興職業(yè)——聲音鑒黃師。聲音鑒黃師是一個讓身心飽受摧殘的職業(yè)，一位女性聲音鑒黃師稱，“一個人平均一天需要鑒定4000條信息，24小時輪班監(jiān)控，各種葷段子、曖昧語音，有時(聽到)惡心想吐。”

聲音鑒黃師是一份不足以為外人道也的工作

由于這份工作實在是太過于枯燥，很多男生都受不了，因此聲音鑒黃師多為女性且離職率高。一般枯燥且重復率高的工作都是AI的拿手好戲，那么AI有沒有辦法實現(xiàn)聲音鑒黃呢?

聲音鑒黃之殤，AI難以克服雞尾酒效應

視頻，圖片和語音是色情內(nèi)容常見的三種形式，多數(shù)公司的鑒黃都是立足于視頻和圖片，比如阿里的阿里綠網(wǎng)、騰訊的萬象優(yōu)圖等等。有人可能會疑問，這幾年科大訊飛、百度、騰訊等公司先后對外公布語音識別準確率均達到“97%”，那為什么在AI語音鑒黃上那么難?

這是因為社交平臺的語音環(huán)境十分復雜，機器很難從龐大雜亂的語音中揪出涉黃涉暴人員，而這就不得不提雞尾酒效應了。所謂雞尾酒效應是指，在雞尾酒會嘈雜的人群中，盡管周圍噪聲很大，兩人可以順利交談，你們似乎聽不到談話內(nèi)容以外的各種噪音。這是因為我們的大腦對聲音都進行了某種程度的預判，然后才決定聽或不聽。

用特瑞斯曼的注意衰減理論來解釋就是，當人的聽覺注意集中于某一事物時，意識將一些無關聲音刺激排除在外，而無意識卻監(jiān)察外界的刺激，一旦一些特殊的刺激與己有關，就能立即引起注意的現(xiàn)象。

但是機器卻不具備這樣意識和無意識，因此難以實現(xiàn)在嘈雜環(huán)境下的語音識別，這樣看來AI語音鑒黃貌似已經(jīng)走進了死胡同。

實際上，已有公司在解決雞尾酒效應上做出了努力。今年4 月，Google曾在博客上發(fā)文稱，谷歌研究人員開發(fā)出了一種深度學習系統(tǒng)，可識別和分離出嘈雜環(huán)境中的個體聲音。

研究人員從YouTube上10萬段“講座和談話”視頻中提取了近2000小時的視頻片段，然后混合音頻與人工背景噪聲，創(chuàng)造“雞尾酒派對”。訓練技術人員將混合音頻進行拆分，谷歌的系統(tǒng)能夠分辨出哪個音頻源在給定的時間內(nèi)屬于哪張人臉，并為每個揚聲器創(chuàng)建單獨的語音軌跡。

但Google的技術集中在視頻處理上，主要是對數(shù)段聲音的分離，而人工聲音鑒黃僅僅依靠聲音，有所不同。前不久，阿里AI語音反垃圾服務上線公測，它可以通過聲紋識別技術，識別語音中存在的涉黃、廣告等違規(guī)信息，不管是中日英俄等語言，還是東北，四川，廣東的方言，甚至連無意義的呻吟聲都可以輕松判別。

具體辦法是，對那些有語義的內(nèi)容，系統(tǒng)先將語音識別轉(zhuǎn)成文字，然后再將這些文字跟文本反垃圾模型或關鍵詞庫比對，判斷是否涉黃，對那些無語義的聲音，通過聲紋也能識別出來。但有一點值得注意的是，在語音識別的過程中，識別是哪種語言比內(nèi)容更難，機器翻譯也存在這樣的問題，因此還需要大量數(shù)據(jù)來進行訓練學習。

做好嘈雜環(huán)境的語音識別，難點是如何將雜音與人聲分離。但對于聲音鑒黃而言，一開始并不知道哪一個音源涉黃，很難說誰是噪音，這需要機器具有全局觀。而上面提到的技術，聲音分離或者將語音識別轉(zhuǎn)成文字都只是基本，由于尚未在語音復雜的環(huán)境下試驗過，因此這個結(jié)果嘛……退一萬步講，社交黑話也并不是那么好破譯的。

社交黑話難解，語音識別障礙重重

時代要拋棄你，它只會讓你看不懂，而我們也不能指望人工智能聽懂。

就像你爹媽當初看不懂你的那句簽名：”ァ亊實證明，鱤綪桱淂起fеηɡ雨，卻桱囨起平啖;伖綪桱淂起平啖，卻桱囨起fеηɡ雨。ヤ”(沒亂碼)，新一代社交黑話崛起一般人也很難看懂，比如XSWL(笑死我了，相當于一連串哈哈哈)，NSS(暖說說，指幫點贊評論轉(zhuǎn)發(fā)說說，增進感情)，CQY(處Q友的縮寫，想在QQ上找朋友的意思)。

當然這也還算好的，無非就是縮寫。除了縮寫，還有一些只能強記的詞語。比如養(yǎng)火(互發(fā)消息三天出現(xiàn)小火花，互發(fā)消息超過三十天出現(xiàn)大火花，養(yǎng)火就是經(jīng)常聯(lián)系的意思)，歐洲(想要什么就得到什么的人)……

估計研究人員在錄入數(shù)據(jù)時就陣亡了，畢竟這玩意看上去也不算有章可循。值得注意的是，當人們在說話的時候，如果省略一兩個字不說，懂得的人自然也懂，但機器不一定能識別人們甚至為了混淆視聽，會多語夾雜，這就給機器識別增添了難度。

這種輸入標準的不統(tǒng)一，是導致語音識別錯誤率高的首要原因。我們常用的鼠標和鍵盤雖然看似簡單，但它具備統(tǒng)一的輸入標準和精準的視覺反饋這兩點，而這正是語音識別技術不具備的，也是困擾現(xiàn)階段AI鑒黃的一大挑戰(zhàn)。

毫不意外，現(xiàn)階段的聲音鑒黃師依然是以人為主。早在互聯(lián)網(wǎng)發(fā)展早期，黃色內(nèi)容主要是圖片和文字，靠人工就可以凈化網(wǎng)絡環(huán)境的目的，但是隨著互聯(lián)網(wǎng)帶來的數(shù)據(jù)爆炸，人工已經(jīng)遠遠不能勝任。

雖然聲音鑒黃以人為本，但這并不意味著AI鑒黃師沒有價值。它能在特定的場景實現(xiàn)鑒定也無疑算是一種進步，而現(xiàn)階段它所呈現(xiàn)的問題，也無疑是技術發(fā)展過程中難以避免的陣痛。

全球經(jīng)濟學家和咨詢公司的主流研究課題，總少不了人工智能會引發(fā)的失業(yè)規(guī)模，但是中國的互聯(lián)網(wǎng)已經(jīng)跑出了一條獨特的路線，因此針對中國的研究少之又少。聲音鑒黃師作為互聯(lián)網(wǎng)發(fā)展過程中的獨特產(chǎn)物，顯然會存在相當長一段時間，而現(xiàn)行的人工智能鑒黃也多為輔助人。

一句正確但無用的話是，可以想見未來AI鑒黃會占據(jù)主流，但這個未來應該以哪個時間節(jié)點為基準，誰也無法預料。

智能相對論(微信id:aixdlun)：深挖人工智能這口井，評出咸淡，講出黑白，道出vb深淺。重點關注領域：AI+醫(yī)療、機器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開發(fā)者以及背后的芯片、算法、人機交互等。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

相關標簽: ai技術; ai智能; 聲音鑒黃師審核

AI的邊界在哪里？科大訊飛“上天入地”

展望科大訊飛的2022，“訊飛超腦2030計劃”發(fā)布，科大訊飛全面錨定虛擬人、虛擬寵物，在雄厚的技術能力和豐富的場景經(jīng)驗支持下，持續(xù)驗證著其面向新場景、新領域的創(chuàng)新能力，也在加速轉(zhuǎn)化成為其未來5到10年的業(yè)績支撐點。

標簽：

ai技術

科大訊飛
AI智能賦能家居健身，GYMBOT宅家健身黑科技

如今，人們對不受空間、時間限制的智能化、科技化家庭健身服務需求日益迫切，AI智能健身已然成為大眾健身新訴求，廣東中科凱澤信息科技有限公司作為新興崛起的智能健身研發(fā)企業(yè)

標簽：

ai智能

智能家居
人工智能計算中心成AI熱詞，但你真的理解它嗎？

三大誤解盤亙，如何正確認識人工智能計算中心？

標簽：

ai智能
告別“古典時代”，AI開始擁抱接地氣的商業(yè)模式

1956年8月，以香農(nóng)為代表的一群科學家在達特茅斯學院，圍繞著“用機器來模仿人類學習以及其他方面的智能”這個主題，創(chuàng)造出人工智能（ArtificialIntelligence）這個影響深遠的概念。

標簽：

ai技術

ai智能
影譜科技姬曉晨入選2021年度人工智能創(chuàng)業(yè)領袖成唯一上榜女企業(yè)家

近日,人工智能學術與產(chǎn)業(yè)界的權威年度盛會“MEET2022智能未來大會”召開,會上公布年度人工智能領航企業(yè)、人工智能創(chuàng)業(yè)領袖等榜單。其中,影譜科技創(chuàng)始人姬曉晨女士入選2021年度人工智能創(chuàng)業(yè)領袖,成為唯一上榜的女性企業(yè)家,同時上榜的還有商湯、曠視、依圖、第四范式、地平線等企業(yè)領袖。

標簽：

人工智能

ai智能

全球AI巨頭正在賭：誰搞定MCP，誰就是未來老大

我不是危言聳聽，現(xiàn)在全球的AI巨頭都在做MCP，毫不夸張的說：誰能把MCP做起來，誰就擁有AI生態(tài)控制權，誰就是AI圈的老大。你們有沒有發(fā)現(xiàn)，MCP在2025年初開始特別火爆，互聯(lián)網(wǎng)技術大廠都在強推MCP。(1)阿里云百煉搞了個MCP平臺，提供50+預置MCP服務。不過大都只面向阿里系產(chǎn)品。(2)騰

標簽：

ai智能
對話李軍：人工智能是“第五范式革命”

2025國際人工智能程序設計精英挑戰(zhàn)賽（IAEPC）在香港中文大學成功舉辦。作為主辦方之一，歐美同學基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中，李軍認為IAEPC不僅是一場“冠軍中的冠軍”對決，更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港，更加推動和普
對話施韓原與杜瑜皓：與參賽選手一起改變世界

2025國際人工智能程序設計精英挑戰(zhàn)賽（IAEPC）在香港中文大學成功舉辦。作為大賽發(fā)起人方之一及裁判委員會負責人，施韓原與杜瑜皓接受了大賽主持人艾誠采訪。裁判委員會主席施韓原分享了此次大賽的亮點，IAEPC首次引入創(chuàng)新賽道，探索選手如何與AI合作進行答題。裁判委員會副主席杜瑜皓認為，選手最終目標并
吳林林專訪IAEPC冠軍：與全球參賽者交流是最重要的一課

2025國際人工智能程序設計精英挑戰(zhàn)賽（IAEPC）在香港中文大學成功舉辦。來自深圳的學生吳林林作為主辦方記者團成員，采訪了大賽冠軍選手之一。在吳林林的采訪中，選手認為與來自全球的參賽者交流是自己學到的最重要的一課。在科技與AI之前，選手們可以平等、開放、友好的交流。以下是采訪實錄（有刪節(jié)）：吳林林
吳林林專訪黃錦輝：年輕人要像懂中文一樣懂A

2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。來自深圳的學生吳林林作為主辦方記者團成員,采訪了大會嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會議員、香港中文大學工程學院副院長、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵年輕人要像懂中文和英語一樣懂AI,
本以為DeepSeek天下無敵了，沒想到Manus更猛

昨天新出了一個AI，據(jù)說比DeepSeek還牛，而截止到今早，已經(jīng)有10萬人在排隊申請Manus邀請碼了，而且它邀請碼已經(jīng)炒到10萬了。這是北京的一家人工智能公司蝴蝶科技，創(chuàng)始人是一名來自華中科技大學的90后畢業(yè)生肖弘，突然向全球宣布：世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了，名叫Manus

標簽：

ai智能

別讓DeepSeek成了造謠者的“白手套”

謠言肆虐，擦亮眼睛
庫克已納投名狀：蘋果AI沒得選，只能選百度

蘋果16弄了兩個版本，一個是專門給中國人用的，準備用百度的AI，還要交錢。第二個是全世界都可以用的，用了ChatGPT，包括臺灣、香港、澳門都可以用。以后都這樣了。好，問題就出在這，蘋果和百度的合作出現(xiàn)問題了，新聞連起來看，才能明白其中含義。新聞一：蘋果正在和騰訊、字節(jié)初步接洽，考慮將二者的AI模型

標簽：

蘋果AI

百度AI

庫克
AI加速時代的“進度條”，我們撥動了百分之幾？

“技術日新月異，人類生活方式正在快速轉(zhuǎn)變，這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切，都開始變得陌生?！庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。

標簽：

ai智能
AI視頻賽道，要變天了

“毀滅你，與你何干？”，這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

標簽：

ai智能

加載更多

聲音鑒黃師飽受摧殘，AI聲音鑒黃師為何沒幫上忙？

相關文章

AI的邊界在哪里？科大訊飛“上天入地”

AI智能賦能家居健身，GYMBOT宅家健身黑科技

人工智能計算中心成AI熱詞，但你真的理解它嗎？

告別“古典時代”，AI開始擁抱接地氣的商業(yè)模式

影譜科技姬曉晨入選2021年度人工智能創(chuàng)業(yè)領袖成唯一上榜女企業(yè)家

全球AI巨頭正在賭：誰搞定MCP，誰就是未來老大

對話李軍：人工智能是“第五范式革命”

對話施韓原與杜瑜皓：與參賽選手一起改變世界

吳林林專訪IAEPC冠軍：與全球參賽者交流是最重要的一課

吳林林專訪黃錦輝：年輕人要像懂中文一樣懂A

本以為DeepSeek天下無敵了，沒想到Manus更猛

別讓DeepSeek成了造謠者的“白手套”

庫克已納投名狀：蘋果AI沒得選，只能選百度

AI加速時代的“進度條”，我們撥動了百分之幾？

AI視頻賽道，要變天了

熱門排行

編輯推薦

聲音鑒黃師飽受摧殘，AI聲音鑒黃師為何沒幫上忙？

相關文章

熱門排行

編輯推薦

聲音鑒黃師飽受摧殘，AI聲音鑒黃師為何沒幫上忙？