1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

小眾卻高端的“視頻新基建”:步態(tài)識別技術(shù)如何穿越萌芽期?

 2021-11-12 17:42  來源:A5用戶投稿  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

第四次工業(yè)革命下所誕生的技術(shù)及形式,不斷地向人類及社會賦能。

像AI、大數(shù)據(jù)、自動駕駛、云計算這些,都在賦予我們高效便捷的生活。

作為誕生于工業(yè)4.0下的AI識別技術(shù),已經(jīng)應(yīng)用到了社會各領(lǐng)域,例如在語言翻譯、面部識別等多個社會活動中,都能夠看到AI識別的參與。

近日,專注于步態(tài)識別的AI識別公司銀河水滴,完成近3億元B輪融資。

目前,AI識別技術(shù)已經(jīng)常用于各類身份認證場景,最為常見的莫過于人臉識別、指紋、虹膜等等,不過,

相較于這些識別技術(shù),步態(tài)識別作為近年來的新AI技術(shù)方向,不斷受到外界的關(guān)注。

那么,步態(tài)識別技術(shù)到底是什么?隨著人臉識別、指紋等AI技術(shù)得到廣泛運用,作為新型技術(shù)的步態(tài)識別,能否同樣得到廣泛運用?

“視頻新基建”下的新技術(shù)

想要弄明白AI識別技術(shù)是什么之前,先要了解什么是AI識別技術(shù)。

AI識別技術(shù)是指通過計算機、照相機、掃描儀等設(shè)備,自動獲取并識別出目標指令、數(shù)據(jù)等信息的技術(shù)手段,像是條形碼識別、智能卡技術(shù)、聲音識別技術(shù)、靜脈識別都屬于AI識別技術(shù)。

而根據(jù)識別對象是否具有生命特征,AI識別技術(shù)主要可以分為兩類:有生命識別和無生命識別。目前,人臉識別、指紋、虹膜等識別技術(shù)都是有生命特征識別,包括接下來所說的步態(tài)識別。

步態(tài)識別是指通過身體體型和行走姿態(tài)來實現(xiàn)自動身份識別的一種技術(shù)手段,是一項融合計算機視覺、模式識別與視頻/圖像序列處理的AI技術(shù)。

小眾卻高端的“視頻新基建”:步態(tài)識別技術(shù)如何穿越萌芽期?

簡單點來說,通過視頻及攝像頭等專業(yè)設(shè)備,對人的身體體型及走路的姿態(tài),做到自動識別,本質(zhì)上是同人臉識別、指紋、虹膜等等AI技術(shù)的工作原理相同,只不過識別的類型不同。

近些年,隨著AI技術(shù)的發(fā)展及成熟,國家相關(guān)部門對步態(tài)識別技術(shù)的興趣正在快速增長,尤其是今年以來,發(fā)布數(shù)項有關(guān)步態(tài)識別技術(shù)數(shù)項公告和規(guī)定,給予其支持的態(tài)度。今年7月,《信息安全技術(shù) 步態(tài)識別數(shù)據(jù)安全要求(征求意見稿)》試點在京啟動,加速步態(tài)識別技術(shù)的場景落地及應(yīng)用。

國家相關(guān)部門之所以,將步態(tài)識別技術(shù)的重視程度提升至如此層面,一部分原因在于其應(yīng)用場景的不同,相較于人臉識別、指紋及虹膜等識別技術(shù),步態(tài)識別技術(shù)的應(yīng)用場景更偏向于智能安防、智慧醫(yī)療、智慧交通、工業(yè)檢測、智能家居等專業(yè)領(lǐng)域,特別是從智能安防的角度,步態(tài)識別作為動態(tài)識別,相較傳統(tǒng)生物識別技術(shù)更加穩(wěn)定,具有更高級別的防偽性,只要人進行移動就可以準確記錄并識別目標的特征并進行追蹤,對于公安、交通部門來說,具有更特殊的意義。

其次,步態(tài)識別技術(shù)的距離上限更高,擺脫了傳統(tǒng)生物識別技術(shù)對于鏡頭距離的需求。目前,業(yè)內(nèi)領(lǐng)先的步態(tài)識別技術(shù),在普通環(huán)境下識別距離可達50米,在更專業(yè)的設(shè)備下識別距離甚至可達100米,能夠?qū)崿F(xiàn)360度全方位識別。

而目前市場上遠距離的虹膜識別技術(shù),距離上限僅在2-3米;人臉識別的距離上限也就在20米左右,無法和步態(tài)識別相比。

目前,銀河水滴、大華股份、盈力科技等,已經(jīng)實現(xiàn)了部分產(chǎn)品的落地。此前,銀河水滴上線了步態(tài)識別系列產(chǎn)品和解決方案,“水滴神鑒”,步態(tài)識別、步態(tài)智能盒子等;盈力科技也上線了盈力云,功能包含步態(tài)識別。

步態(tài)識別:“理想”中的那些“現(xiàn)實”

與人臉識別、指紋、虹膜等AI識別技術(shù)相同的是,步態(tài)識別技術(shù)對算法、訓(xùn)練庫和對象同樣有著較高的要求,特別是在算法和軟件上,由于步態(tài)識別技術(shù)的距離以及識別目標相對寬松,會要求其擁有更高的準確度以及辨別性。

這背后與訓(xùn)練底庫脫不開關(guān)系,人臉、指紋等識別技術(shù)能夠率先落地,和訓(xùn)練方法和對象密切相關(guān),這些特征的訓(xùn)練底庫是以圖像訓(xùn)練為主,手機等終端設(shè)備的快速發(fā)展讓獲取圖像/指紋極為普遍,樣本量巨大,但步態(tài)識別只能通過視頻識別,訓(xùn)練底庫的訓(xùn)練方法和對象多是通過算法對視頻進行解析和計算,背后的工作量更為巨大。

目前,市場上一款步態(tài)識別技術(shù)的初步形成,至少是基于百萬級的訓(xùn)練庫之上,而成熟可應(yīng)用的技術(shù)至少是要達到超百萬級別的訓(xùn)練量,這也是很多企業(yè)望而生畏的關(guān)鍵,對算法、訓(xùn)練庫的要求過高,使得這項技術(shù)的壁壘過高,當(dāng)前這項技術(shù)僅掌握在銀河水滴、大華股份、盈力等少數(shù)廠商手里,整體技術(shù)存在高度集中的現(xiàn)象。

另外,盡管目前國家工信部、公安部等相關(guān)部門都在大力推進步態(tài)識別的落地,但從市場競爭格局來看卻不利于步態(tài)識別的發(fā)展。

公開數(shù)據(jù)顯示,目前生物識別技術(shù)市場結(jié)構(gòu)中,指紋識別占比達到58%,人臉識別占比為 18%,虹膜識別占比 7%,此外掌紋識別以及聲音識別分別占比 7%及 5%,也就是說步態(tài)、靜脈、聲紋等新型識別技術(shù)共分不到5%的市場份額,步態(tài)識別的發(fā)展空間較小。

小眾卻高端的“視頻新基建”:步態(tài)識別技術(shù)如何穿越萌芽期?

而且,從當(dāng)前的市場環(huán)境來看,人臉識別無疑是現(xiàn)在資本及市場最熱門的“寵兒”,預(yù)計今年,人臉識別市場規(guī)模將達到530億元,復(fù)合增長率達到53%,國內(nèi)外市場都在大力普及人臉識別的應(yīng)用,進一步壓縮了其他AI識別技術(shù)的市場空間。

最后,由于步態(tài)識別技術(shù)的載體,同樣是攝像頭或是掃描設(shè)備,那么,就會同人臉識別、虹膜這些面臨同樣一個問題。

即便步態(tài)識別技術(shù)再先進、成熟,但硬件及載體處于落后階段,其識別效果也會大打折扣,這也是現(xiàn)在很多步態(tài)識別技術(shù),對攝像頭等掃描設(shè)備的清晰度有著較高要求的關(guān)鍵所在。另外,由于步態(tài)識別的“非強迫性”特性,還會受到天氣、人物著裝、人物角度等影響,同樣會降低識別的精準度。

技術(shù)和產(chǎn)品的落地,終歸不是一帆風(fēng)順,對于步態(tài)識別技術(shù)來說,這也是必須經(jīng)歷的階段,從小到大、從缺陷到完善,都是需要步態(tài)識別下的企業(yè)去一一解決。

行業(yè)遠未到商業(yè)化考量階段

一款產(chǎn)品、技術(shù)的研發(fā)或應(yīng)用,最終目的都是為了商業(yè)化落地,對于步態(tài)識別技術(shù)來說,也不例外。那么,在當(dāng)前情形下,步態(tài)識別技術(shù)要想實現(xiàn)商業(yè)化落地,還需要完善哪些方面?

一方面,解決技術(shù)本身所帶來的識別缺陷。目前,盡管部分步態(tài)識別頭部企業(yè)的試驗識別率已經(jīng)超過了90%,但從整體上來看,步態(tài)識別作為剛起步的技術(shù), 受天氣、場景、目標等特殊性的影響,試驗識別率只有80%,其可靠性不如人臉識別技術(shù),目前,人臉識別技術(shù)的普遍識別率已經(jīng)達到了98%以上,擁有領(lǐng)先算法及軟件的人臉識別技術(shù),識別率甚至超過99%。

對于步態(tài)識別技術(shù)來說,通過加強對步態(tài)識別軟件、算法的開發(fā)以及訓(xùn)練底庫的完善,包括增加對數(shù)千路高清攝像頭的并發(fā)量,以及提升產(chǎn)品芯片的算力,來降低這種識別缺陷幾率的出現(xiàn)。除此之外,步態(tài)識別還需要建立龐大的貼近實際場景的步態(tài)數(shù)據(jù)庫,包括各種形式的行走姿態(tài)以及不同體型的身形數(shù)據(jù)收等等,加強與攝像頭收集的步態(tài)數(shù)據(jù)的同步對比,保證對比和識別的準確性。

其次,就是通過頭部企業(yè)的算法的成熟及訓(xùn)練底庫、步態(tài)數(shù)據(jù)庫的完善,逐步削弱行業(yè)技術(shù)壁壘,降低中小企業(yè)的準入門檻。相比其他生物識別技術(shù),由于步態(tài)識別的技術(shù)特殊性,使得其技術(shù)壁壘較高,企業(yè)及行業(yè)需要不斷通過研發(fā)支出,來攻克技術(shù)壁壘,高昂的研發(fā)費用讓很多廠商望而卻步。

頭部企業(yè)對步態(tài)識別技術(shù)的部分算法及訓(xùn)練底庫、數(shù)據(jù)庫的開放,一定程度上能夠降低中小企業(yè)的技術(shù)研發(fā)壁壘,減少中小企業(yè)在這一過程中的研發(fā)費用支出,加快步態(tài)識別技術(shù)在行業(yè)之間的整體普及。

另一方面,要解決的就是實用性的問題,簡單點來說就是應(yīng)用場景是否廣泛,實用性是商業(yè)化落地的關(guān)鍵一步。對于任何一個技術(shù)或是產(chǎn)品來說,實用性的強與弱,往往就決定了能否在商業(yè)化的落地上走的更遠,就目前應(yīng)用場景以及實用性來看,步態(tài)識別技術(shù)的應(yīng)用場景更多是B端場景中,而人臉識別、指紋等則更貼近于C端用戶。

對于步態(tài)識別企業(yè)來說,或許可以繼續(xù)加強在B端應(yīng)用場景的開拓,包括港口、物流中心等大型應(yīng)用場景的應(yīng)用,以及運用步態(tài)識別技術(shù)開發(fā)更多貼近C端用戶的產(chǎn)品,比如說智能鞋墊等等,增強步態(tài)識別技術(shù)在不同場景的運用,同時,提升市場整體的認可度及步態(tài)識別技術(shù)認知的普及,也是提升商業(yè)化落地的因素之一。

受制于步態(tài)識別技術(shù)的特殊性,及應(yīng)用場景的短缺性,短時間內(nèi)或許并不能像人臉識別、指紋、虹膜那樣運用得如此廣泛。但能夠明確一點的是,隨著國家相關(guān)部門支持力度的加大、技術(shù)的不斷完善成熟,步態(tài)識別技術(shù)或許與當(dāng)初的指紋、人臉識別一樣,能夠賦能到整個人類及社會,帶來高效便捷的生活。

文章來源:新工業(yè)洞察

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
ai技術(shù)

相關(guān)文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標簽:
    ai技術(shù)
  • 王通:未來個人創(chuàng)業(yè)的十個機會

    個人創(chuàng)業(yè)需要啟動成本低、無需龐大團隊、可快速驗證、能利用個人技能或資源。這里分享適合個人創(chuàng)業(yè)的十個機會一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場

  • AI工具導(dǎo)航網(wǎng)站,未來的發(fā)展前景怎么樣?

    導(dǎo)航網(wǎng)站的崛起:從信息過載到精準觸達隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對工具篩選的場景需求,垂直化、場景化的AI導(dǎo)航網(wǎng)站應(yīng)運而生。這類平臺通過聚合、評測、分類與推薦四重機制,將分散的工具資源整合為結(jié)構(gòu)化入口。例

  • 微信AI搜索被指“強行開盒”:名字成了數(shù)據(jù)入口,騰訊回應(yīng)“僅用公開信息”

    當(dāng)微信公眾號文章中出現(xiàn)一個人的名字,它會自動變成藍色鏈接,點擊即可查看AI生成的“個人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當(dāng)微信公眾號推文中出現(xiàn)本人姓名時,名字會自動變?yōu)樗{色超鏈接,點擊即可瀏覽由

  • 看懂黃仁勛CES演講,就看懂 AI 接下來十年的走向

    2026年剛開年,全世界最狂的那個男人,穿著他的經(jīng)典黑皮衣,在CES舞臺上發(fā)出了未來十年的信號。他搞了個“能吃飽套餐”:6個包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買一個套餐就能吃飽了。(Rubin平臺)同時他們店里還免費提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開放10萬億語言

  • GDPS2025賽場直擊!開普勒大黃蜂助力華理斬獲搬運賽項桂冠

    12月12日-14日,2025全球開發(fā)者先鋒大會暨國際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會堂舉行,大會以具身智能競技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗,為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機器人有限公司(以下簡稱"開普勒機器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參

    標簽:
    GDPS
    2025
  • 弈動 Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標簽:
    弈動
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標是:從芯片設(shè)計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關(guān)鍵供應(yīng)商——包括負責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標簽:
    英偉達
  • 真正的「國產(chǎn)英偉達」來了

    文/二風(fēng)來源/節(jié)點財經(jīng)一場關(guān)于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產(chǎn)GPU領(lǐng)域取

    標簽:
    英偉達
  • AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

    AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

  • 數(shù)據(jù)庫進入“內(nèi)存自由”時代!阿里云PolarDB發(fā)布全球首個CXL數(shù)據(jù)庫服務(wù)器

    技術(shù)的進步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar