2019年數(shù)字生態(tài)大會于5月21日—23日在昆明舉行,在AI分論壇上,騰訊優(yōu)圖實驗室聯(lián)合負責人、杰出科學家賈佳亞分享了優(yōu)圖近期在AI手語識別上取得的突破——推出基于自研算法的“優(yōu)圖AI手語翻譯機”。
據(jù)賈佳亞介紹,AI手語翻譯機以普通攝像頭作為手語采集裝置,依托高性能計算機進行后臺運算,用戶只要正對攝像頭完成手語表達,翻譯機就能快速運算出結果并把手語翻譯成為文字。未來有望在機場、民政窗口等公共場所部署和落地,助力信息無障礙城市建設。
(騰訊優(yōu)圖實驗室聯(lián)合負責人、騰訊杰出科學家 賈佳亞)
AI手語翻譯機:自研算法,實現(xiàn)手語識別“黑科技”
手語識別(SLR),就是指通過計算機算法,自動區(qū)分手語表達中的各類手勢、動作以及這些手勢和動作之間的切換,最后將表達的手語翻譯成文字。不過相比于其他AI視覺識別技術的研究,手語識別的研發(fā)卻存在更大的困難和挑戰(zhàn)。手語表達所特有的地域性、復雜性和多樣性極大地增加了數(shù)據(jù)采集與清洗的難度和成本,而受限于數(shù)據(jù)量的大小和人工設計特征的缺陷,很多傳統(tǒng)研究的研究方法在適應性、泛化性及魯棒性上都十分有限。

(優(yōu)圖AI手語翻譯機界面)
據(jù)賈佳亞介紹,此次騰訊優(yōu)圖推出的AI手語翻譯機,結合聽障人士手語表達的習慣采集手語數(shù)據(jù),參考先進的手勢識別、動作識別和序列翻譯等技術,通過自研算法實現(xiàn)了對復雜手語表達的識別技術突破。相較于其他方法,優(yōu)圖AI手語翻譯機的數(shù)據(jù)集覆蓋了近千句日常表達,900個常用詞匯,同時對數(shù)據(jù)進行進一步的分析和歸納,擁有目前最大的中文手語識別數(shù)據(jù)集,并支持整句手語表達的識別,可直接判斷用戶是否結束并完成實時翻譯。
應用探索:視覺AI,助力信息無障礙建設
據(jù)北京聽力協(xié)會2017年公開數(shù)據(jù),估計中國殘疾性聽力障礙人士已達7200萬,相當于北京市常住人口(約2200萬,2015年數(shù)據(jù))的3倍多。盡管我國在信息無障礙領域的投入逐漸增加,但目前國內的聽障人群需求依然得不到滿足。優(yōu)圖AI手語翻譯機的推出將一定程度地緩解聽障人士的交流障礙。
在演講中,賈佳亞表示,“未來,我們希望通過與聾啞人士或手語使用者的深入接觸,嘗試在公共事物場所為聽障者提供更好的服務,更好地助力信息無障礙的建設。”下一步,優(yōu)圖實驗室將對AI手語翻譯機展開優(yōu)化和升級,嘗試在日常服務窗口、手語教育等場景中落地,為聽障人士帶來實實在在的便利。
目前,優(yōu)圖實驗室已經(jīng)和深圳市信息無障礙研究會成立AI手語識別聯(lián)合項目組,就手語數(shù)據(jù)采集、產(chǎn)品算法優(yōu)化等方面展開長期深度合作,并通過與聽障者或手語使用者進一步接觸,擴充數(shù)據(jù)容量,完善數(shù)據(jù)規(guī)范,致力于推動后續(xù)的產(chǎn)品和服務部署,推動信息無障礙建設。
(優(yōu)圖和深圳信息無障礙研究會AI聽障無障礙聯(lián)合項目組)
此次的數(shù)字生態(tài)大會展示的優(yōu)圖AI手語翻譯機,并不是騰訊在信息無障礙建設上的首次嘗試。早在2009年騰訊便開始了信息無障礙方面的探索,截至目前,旗下QQ、QQ空間、微信、騰訊網(wǎng)、騰訊新聞、應用寶、企鵝FM等大部分產(chǎn)品已針對障礙用戶實現(xiàn)專門優(yōu)化,致力于為障礙人士構建信息友好社會。2013年,騰訊優(yōu)圖團隊和手機QQ一起打磨了OCR引擎技術,基于計算機視覺算法及自然語言處理能力,可將圖片上的文字直接轉換為可編輯的結構化文本,幫助視障群體實現(xiàn)信息溝通無障礙化。
與本次亮相數(shù)字生態(tài)大會AI分論壇的跨年齡人臉識別技術一樣,優(yōu)圖AI手語翻譯機同樣是騰訊踐行“科技向善”的重要體現(xiàn)。而優(yōu)圖實驗室也將繼續(xù)秉承“科技向善”這一理念,推動前沿技術在社會場景中的應用,切實讓更多的實際問題得以解決。做有溫度的AI,讓科技產(chǎn)生更大的社會價值。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
2025年10月25日,2025世界青年科學家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術學會、中科先進技術溫州研究院與溫州市電力工程學會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,
個人創(chuàng)業(yè)需要啟動成本低、無需龐大團隊、可快速驗證、能利用個人技能或資源。這里分享適合個人創(chuàng)業(yè)的十個機會一.AI內容優(yōu)化與本地化服務·做什么:幫助企業(yè)或個人利用AI工具(如GPT-4,Midjourney)優(yōu)化內容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷
文/道哥美國設計軟件公司Figma近期在紐約證券交易所掛牌上市,首日即上演“狂飆”行情——發(fā)行價定每股33美元,開盤報價85美元,較發(fā)行價翻倍。首日收報115.50美元,較發(fā)行價大漲約250%,市值飆升至近670億美元,創(chuàng)下近30年來同等規(guī)模美股IPO的最大單日漲幅紀錄。然而,隨著短線資金獲利了結,
文/一燈來源/節(jié)點財經(jīng)在當前無人敢缺席的AI軍備競賽中,巨頭們一面為巨額的資本支出焦慮,一面又向市場勾勒著未來的宏偉藍圖。在各家動輒千億級投入的背景下,市場迫切需要一份關于AI回報價值的有力證明。而騰訊,率先給出了答卷。8月13日,騰訊控股發(fā)布2025年第二季度財報。盡管資本開支同比劇增119%,達
文/二風來源/節(jié)點財經(jīng)2025年的硅谷,一場沒有硝煙的戰(zhàn)爭正以前所未有的烈度上演。這場戰(zhàn)爭的核心武器不是代碼或芯片,而是人——那些全球僅有數(shù)千名、能夠構建未來人工智能基礎模型的頂尖大腦。在這場激烈的人才爭奪戰(zhàn)中,Meta及其首席執(zhí)行官馬克·扎克伯格(MarkZuckerberg)正扮演著最具侵略性的
凌晨兩點,小王合上筆記本,揉了揉酸脹的眼睛?;艘粋€月寫出來的10萬字短劇劇本躺在硬盤里,要真正把它拍成劇,得找演員、租場地、請攝像、做后期……粗算下來少說要幾十萬,他只能把劇本繼續(xù)鎖在抽屜里。不過,現(xiàn)在小王的劇本可以“見光”了。2026年3月19日,字節(jié)跳動旗下的小云雀AI正式上線了短劇Agent
你一定遇到過這樣的場景:明明剛和AI助手聊了半個小時的項目細節(jié),退出會話后重新打開,它卻像個失憶患者一樣,連你上一輪說過什么背景信息都忘得一干二凈,你又得從頭把需求講一遍。這種“聊完就忘”的體驗,讓無數(shù)使用AI智能體的用戶深感頭疼。為了解決這一普遍困擾,騰訊云在4月3日正式推出了名為“龍蝦”的記憶服
4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸彈——全新一代開源大模型Gemma4正式發(fā)布,以極其寬松的Apache2.0協(xié)議向全球開發(fā)者免費開放。這是自2025年3月發(fā)布Gemma3以來,谷歌時隔整整一年的重大迭代。本次發(fā)布的Gemma4包含四個不同規(guī)格的版本:E2B(有效20億參數(shù))、E4
AI龍蝦也會生病。別怕,大部分病不是什么絕癥,自己在家就能治。我養(yǎng)OpenClaw一年多,總結出五種最常見的毛病,附上我的“土方子”,希望對你有用。病一:不吃食(完全不執(zhí)行任何任務)癥狀:你給了指令,它沒反應,日志里一片空白。就像龍蝦趴在塘底不動彈,碰它也不理。病因:通常是進程卡死了,或者依賴服務沒
養(yǎng)過真龍蝦的人都知道,投喂是個技術活。喂少了,龍蝦餓得互相殘殺;喂多了,剩餌壞水,整塘發(fā)病。OpenClaw這個AI龍蝦也一樣——你給它安排的任務太少,它會“閑得發(fā)慌”,反應遲鈍;你一次塞給它太多復雜任務,它會“消化不良”,要么報錯要么干一半就卡住。每天該喂幾次?我的經(jīng)驗是:每天喂兩次,早上一次簡單
養(yǎng)過真龍蝦的人都知道,苗種的好壞直接決定收成。養(yǎng)AI龍蝦也一樣——OpenClaw有不同版本,有的穩(wěn)定但功能少,有的功能多但愛“鬧脾氣”。新手該怎么選?我用自己的踩坑經(jīng)歷告訴你。版本怎么選?OpenClaw目前主要有三個分支:穩(wěn)定版(Stable)、測試版(Beta)和社區(qū)魔改版(Community
我第一次聽說OpenClaw,是在一個技術群里。有人發(fā)了一串代碼,說“這個AI龍蝦特別好養(yǎng),會自己找食吃”。我好奇點進去,結果對著終端發(fā)了一小時呆——連環(huán)境都沒搭起來。后來我才明白,養(yǎng)AI龍蝦跟養(yǎng)真龍蝦一樣,新手入門得先做足功課。第一問:我的電腦跑得動嗎?很多人以為AI龍蝦就是個聊天機器人,打開網(wǎng)頁
4月2日,字節(jié)跳動旗下火山引擎在武漢舉行的AI創(chuàng)新巡展上宣布,Seedance2.0API正式面向企業(yè)用戶開啟公測。同時,火山引擎總裁譚待在會上披露,截至今年3月,豆包大模型日均Token使用量已突破120萬億,在過去三個月內增長一倍,比2024年5月發(fā)布時增長1000倍。Seedance2.0:從
養(yǎng)AI小龍蝦的路上,坑不少。有人被代裝服務騙了錢,有人電腦中了毒,有人收到天價賬單,還有人發(fā)現(xiàn)AI“失控”了,開始亂刪文件。如果你也遇到這些糟心事,別慌。下面這份“養(yǎng)蝦應急包”,告訴你第一時間該做什么。場景一:代裝被騙,錢打水漂了花了300塊找人遠程裝OpenClaw,結果對方收了錢就拉黑,或者裝了
把AI智能體請進電腦,就像把家里所有的鑰匙交給了一個陌生人。它能幫你打掃房間、整理文件,但萬一它“起了壞心”,或者被壞人利用了,你的家就不再安全了。這不是危言聳聽。國家互聯(lián)網(wǎng)應急中心已經(jīng)發(fā)布風險提示,指出OpenClaw的默認配置“極為脆弱”,攻擊者一旦得手,能輕易獲取系統(tǒng)控制權。微軟安全團隊也警告