當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

云知聲技術(shù)實(shí)力再獲認(rèn)可:2篇論文參展國(guó)際語(yǔ)音頂會(huì)INTERSPEECH 2022

 2022-09-22 11:35  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

2022年9月18日-22日,全球語(yǔ)音領(lǐng)域頂級(jí)會(huì)議INTERSPEECH 2022在韓國(guó)仁川舉辦。“云知聲-上師大自然人機(jī)交互”聯(lián)合實(shí)驗(yàn)室攜提出的關(guān)于聲音事件檢測(cè)、單通道語(yǔ)音增強(qiáng)方向的2篇論文參會(huì)。這是繼2022年6月亮相ICASSP2022(技術(shù)論文被收錄)之后,云知聲在2022年再一次獲得國(guó)際語(yǔ)音頂會(huì)的認(rèn)可。

INTERSPEECH在國(guó)際上享有極高盛譽(yù)并具有廣泛的學(xué)術(shù)影響力,是由國(guó)際語(yǔ)音通訊協(xié)會(huì)(ISCA)創(chuàng)辦的旗艦級(jí)國(guó)際會(huì)議,也是全球最大的綜合性語(yǔ)音領(lǐng)域的科技盛會(huì),對(duì)參會(huì)企業(yè)和單位有著嚴(yán)苛的準(zhǔn)入門檻,歷屆INTERSPEECH會(huì)議都倍受全球各地語(yǔ)音研究領(lǐng)域人士的廣泛關(guān)注。

本屆會(huì)議以“Human and humanizing speech technology”為主題,內(nèi)容涵蓋信號(hào)處理、語(yǔ)音識(shí)別、自然語(yǔ)言處理、神經(jīng)機(jī)器翻譯等領(lǐng)域,收到近萬(wàn)篇投稿論文。會(huì)議研究成果代表著語(yǔ)音相關(guān)領(lǐng)域的最新研究水平和未來(lái)的技術(shù)發(fā)展趨勢(shì)。此次論文入選,代表云知聲在語(yǔ)音交互領(lǐng)域持續(xù)的技術(shù)創(chuàng)新。

聲音事件檢測(cè)

在聲音事件檢測(cè)方向,研究團(tuán)隊(duì)提出了一個(gè)教師-學(xué)生(Teacher-Student)半監(jiān)督學(xué)習(xí)框架,充分利用強(qiáng)標(biāo)簽數(shù)據(jù)、弱標(biāo)簽數(shù)據(jù)與大量無(wú)標(biāo)簽數(shù)據(jù)訓(xùn)練模型,有效解決標(biāo)簽數(shù)據(jù)匱乏的問(wèn)題。為了提高模型的檢測(cè)能力,研究團(tuán)隊(duì)提出通過(guò)兩階段的訓(xùn)練策略并聚焦于難以分類的事件,以及利用一種深度特征蒸餾方法,更詳細(xì)地關(guān)注到時(shí)間軸上細(xì)致的聲學(xué)信息。

同時(shí),研究團(tuán)隊(duì)還提出語(yǔ)音分離技術(shù)輔助聲音事件檢測(cè)系統(tǒng)建模的方法,通過(guò)使用分離數(shù)據(jù)與混合數(shù)據(jù)聯(lián)合調(diào)整訓(xùn)練模型的方式,有效解決事件重疊與背景噪聲干擾對(duì)系統(tǒng)建模帶來(lái)的影響。在DCASE2019 Task4 數(shù)據(jù)集上,研究團(tuán)隊(duì)所提出的方案在F1, PSDS1 and PSDS2得分上分別達(dá)到了46.5%, 44.5%以及75.4%,相比baseline提高了2.2%, 7.2%以及20.5%,充分體現(xiàn)了所提出方案的優(yōu)勢(shì)。

單通道語(yǔ)音增強(qiáng):

在單通道實(shí)時(shí)語(yǔ)音增強(qiáng)方向,研究團(tuán)隊(duì)提出了一個(gè)基于PercepNet模型并感知語(yǔ)音相位與信噪比的實(shí)時(shí)語(yǔ)音增強(qiáng)方案(PercepNet+: A Phase and SNR Aware PercepNet for Real-Time Speech Enhancement),該方案提取多種聲學(xué)特征,以獲取語(yǔ)音包括幅度,相位,基音周期在內(nèi)的多種聲學(xué)屬性。這些特征被進(jìn)一步在模型中使用提取時(shí)間相關(guān)性和頻率相關(guān)性的GRU網(wǎng)絡(luò)層進(jìn)行融合,以提升該語(yǔ)音增強(qiáng)系統(tǒng)的性能。

同時(shí),研究團(tuán)隊(duì)還提出一種基于信噪比的后處理機(jī)制,旨在改善語(yǔ)音增強(qiáng)中的過(guò)度抑制問(wèn)題。該機(jī)制利用網(wǎng)絡(luò)估計(jì)得到的語(yǔ)音信噪比為閾值條件,決定基于MMSE-LSA的后處理方法是否被應(yīng)用于當(dāng)前輸入語(yǔ)音。研究團(tuán)隊(duì)的模型在VCTK測(cè)試集上達(dá)到了2.65 (PESQ) 的得分,相比原PercepNet模型的得分相對(duì)提升了8%,充分驗(yàn)證了所提出方案的有效性。

人工智能成功的關(guān)鍵在于應(yīng)用。為不斷拓寬自身基礎(chǔ)能力邊界,云知聲深入探究語(yǔ)音領(lǐng)域中的語(yǔ)音識(shí)別、語(yǔ)音增強(qiáng)、信號(hào)處理、聲紋識(shí)別、聲音事件檢測(cè)等諸多方向,形成豐富技術(shù)積累,并將相關(guān)技術(shù)在多個(gè)領(lǐng)域以及行業(yè)進(jìn)行應(yīng)用,取得諸多成功案例。比如云知聲的ASR技術(shù)被廣泛應(yīng)用于音視頻翻譯、會(huì)議系統(tǒng)、同聲傳譯、三代共6款專用AI語(yǔ)音交互芯片等相關(guān)產(chǎn)品與場(chǎng)景。

其中,云知聲輸出的軟硬一體的語(yǔ)音交互芯片產(chǎn)品,覆蓋各種形態(tài)的多品類產(chǎn)品,市占率領(lǐng)先,出貨量不斷增長(zhǎng)。為國(guó)內(nèi)傳統(tǒng)行業(yè)迅速實(shí)現(xiàn)智能化產(chǎn)品升級(jí)與改造,提供了技術(shù)保障。

本次在 INTERSPEECH 2022 大會(huì)上提出的原創(chuàng)技術(shù),也將進(jìn)一步夯實(shí)云知聲全棧+硬核的人工智能技術(shù)“底座”,提高云知聲在語(yǔ)音交互領(lǐng)域的技術(shù)領(lǐng)先性,推動(dòng)人工智能系統(tǒng)以更人性化、高效的方式服務(wù)于千行百業(yè),為用戶帶來(lái)更好的交互體驗(yàn)。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
人工智能
語(yǔ)音交互

相關(guān)文章

  • 世界人工智能大會(huì)(WAIC 2023)點(diǎn)燃魔都,博爾捷數(shù)字科技攜前沿技術(shù)產(chǎn)品亮相

    “投身自創(chuàng)見(jiàn)、創(chuàng)新,至創(chuàng)造、創(chuàng)想的“AI生成之路”,共同詮釋AI驅(qū)動(dòng)的高質(zhì)量發(fā)展,展望“智變”后的全新形態(tài),圍爐暢論光明的智能未來(lái)?!?023世界人工智能大會(huì)(簡(jiǎn)稱WAIC2023)于7月6日至7月8日在上海舉辦,本次大會(huì)由國(guó)家發(fā)展改革委、工業(yè)和信息化部、科學(xué)技術(shù)部、國(guó)家互聯(lián)網(wǎng)信息辦公室、中國(guó)科學(xué)院

    標(biāo)簽:
    人工智能
  • IoT開(kāi)發(fā)者為王,涂鴉智能硬核“靠邊站”

    IoT盛宴:涂鴉向下,產(chǎn)品向上

    標(biāo)簽:
    人工智能
  • IPO觀察丨黑芝麻智能遞表港交所,車芯行業(yè)已邁向量產(chǎn)決戰(zhàn)期?

    雖然我國(guó)汽車芯片行業(yè)還處在發(fā)展初期,但已經(jīng)迸發(fā)出無(wú)限潛力。一方面,智能汽車的發(fā)展不斷帶動(dòng)需求增長(zhǎng);另一方面,政策引導(dǎo)下,汽車芯片企業(yè)持續(xù)搶占高地。對(duì)此,在7月5日-7日舉辦的2023年中國(guó)汽車論壇上,中國(guó)汽車工業(yè)協(xié)會(huì)副秘書長(zhǎng)李邵華就做出表示,“中國(guó)將成為未來(lái)汽車芯片發(fā)展的集聚地”。車規(guī)芯片行業(yè)近日的

    標(biāo)簽:
    人工智能
  • 倒計(jì)時(shí)2天丨云天勵(lì)飛將亮相世界人工智能大會(huì)

    2023世界人工智能大會(huì)將于7月6日至8日在上海舉辦。云天勵(lì)飛將在大會(huì)上展示自主設(shè)計(jì)開(kāi)發(fā)的新一代邊緣計(jì)算芯片DeepEdge10系列SoC芯片,并公布“天書”大模型的最新動(dòng)態(tài)。歡迎蒞臨上海世博展覽館H1-C801展臺(tái)參觀交流!同時(shí),云天勵(lì)飛也將與中國(guó)電子、中國(guó)信通院、華為等合作伙伴,在WAIC的舞臺(tái)

    標(biāo)簽:
    人工智能
  • 酷學(xué)院智能產(chǎn)品發(fā)布會(huì):引領(lǐng)中大型企業(yè)學(xué)習(xí)新潮流

    近日,酷學(xué)院智能產(chǎn)品發(fā)布會(huì)在深圳閃亮登場(chǎng)。近200位現(xiàn)場(chǎng)觀眾和近萬(wàn)人次在線觀看,共同見(jiàn)證了這一激動(dòng)人心的時(shí)刻。發(fā)布會(huì)上,酷學(xué)院引領(lǐng)大家探索企業(yè)培訓(xùn)學(xué)習(xí)和人才發(fā)展領(lǐng)域的新高度,并揭幕其全新的產(chǎn)品智能升級(jí)和突破。酷學(xué)院產(chǎn)品負(fù)責(zé)人徐晨通過(guò)形象生動(dòng)、邏輯嚴(yán)謹(jǐn)?shù)闹v述,揭曉了全新的智能企業(yè)培訓(xùn)和人才發(fā)展平臺(tái),以

    標(biāo)簽:
    人工智能

熱門排行

信息推薦