1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. AI智能
  4. 正文

垂直行業(yè)大模型“封神”背后,AI數(shù)據(jù)服務走入“深水區(qū)”

 2023-09-26 13:33  來源:A5專欄  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領券再下單

文 | 智能相對論

作者 | 沈浪

由ChatGPT掀起的這股大模型浪潮,從通用領域席卷垂直領域?,F(xiàn)階段,越來越多的行業(yè)都在開發(fā)專用垂直細分賽道的大模型產品,以加速AI應用的場景化落地進程。

譬如,在電商領域,平臺和商家正在利用大模型重塑各個零售環(huán)節(jié)。如智能導購,可基于消費者的海量消費數(shù)據(jù)為其提供商品推薦、商品挑選攻略、行程建議等。同時,大模型還能理解海量商品的詳情數(shù)據(jù),快速生成電商運營需要的商品主圖、營銷海報、詳情頁等等。

除此之外,電商垂類大模型在智能客服、供應鏈優(yōu)化等場景上也都能基于海量數(shù)據(jù)的深度學習,快速掌握特定的售前售后話術、供應鏈訂單處理等,全方位革新電商領域的零售模式和消費體驗。

隨著應用成果的落地,垂直行業(yè)大模型的價值正在釋放,數(shù)字生產力持續(xù)提升。而作為人工智能三駕馬車之一的數(shù)據(jù)要素也在這個時刻被提上新的戰(zhàn)略高度——不難發(fā)現(xiàn),垂直行業(yè)大模型的價值釋放離不開海量數(shù)據(jù)的支持。

對應的,上游的AI數(shù)據(jù)服務商已經針對數(shù)據(jù)層面提出了新的解決方案。在2023年中國國際服務貿易交易會期間,國內頭部AI數(shù)據(jù)服務廠商云測數(shù)據(jù)在去年發(fā)布的“AI工程化的數(shù)據(jù)解決方案”基礎上全面升級,重點面向垂直行業(yè)大模型提出了全生命周期的AI數(shù)據(jù)解決方案,為大模型應用落地提供關鍵支撐。

以大模型應用為支點,在大量市場場景需求的撬動下,人工智能產業(yè)鏈上下游的板塊正在迎來全新變革,數(shù)據(jù)層面的升級已經躍然紙上。

大模型應用“封神”的背后,是什么樣的AI數(shù)據(jù)服務在支持?

大模型的爆發(fā)加速了人工智能的應用進程,同時也對整個算法產業(yè)鏈帶來了新的挑戰(zhàn)。在數(shù)據(jù)層面,過去生產數(shù)據(jù)、收集數(shù)據(jù)、加工數(shù)據(jù)、存儲數(shù)據(jù)等流程就不再適用當前的市場需求,或者說無法高效地、很好地解決新出現(xiàn)的問題。

下游的AI應用融入大模型技術進行全新升級,上游的AI數(shù)據(jù)服務也同樣面臨著變革。那么,什么樣的AI數(shù)據(jù)服務才是垂直行業(yè)大模型場景下需要的、適用的?

一、標準化

垂直行業(yè)大模型技術成果涌現(xiàn)的背后,對應是AI數(shù)據(jù)需求大幅增長。如何滿足大幅增長的場景化數(shù)據(jù)需求,首要不是盲目擴大數(shù)據(jù)生產,而是提高AI數(shù)據(jù)的通用性、易用性,也就是標準化的問題,避免AI數(shù)據(jù)服務做“無用功”,保證數(shù)據(jù)的真實、有效、易用是滿足垂直行業(yè)大模型爆發(fā)式增長需求的關鍵。

譬如,在智能網聯(lián)汽車行業(yè),《智能網聯(lián)汽車激光雷達點云數(shù)據(jù)標注要求及方法》(T/CSAE 213-2021)、《智能網聯(lián)汽車場景數(shù)據(jù)圖像標注要求與方法》(T/CSAE 212-2021)等團體標準的發(fā)布,就為智能網聯(lián)汽車的研發(fā)和測試提供了一套切實可行的場景數(shù)據(jù)點云標注方法,很好地推動了智能網聯(lián)汽車的研發(fā)和測試。

其中最直觀的感受則在于,過去AI數(shù)據(jù)服務行業(yè)各企業(yè)對圖像標注的要求與方法都各不相同,標注結果文件各異,嚴重影響后續(xù)數(shù)據(jù)的統(tǒng)一使用。隨著相關標準的發(fā)布,對標注流程和標注結果的保存形式都進行了規(guī)范,進而提升標注數(shù)據(jù)的通用性。

而在這個過程中,行業(yè)TOP地位的廠商往往都是標準的引領者,促使其在接下來的市場規(guī)范中獲得了更大的話語權和主動權。譬如,以上智能網聯(lián)汽車場景數(shù)據(jù)的兩大標準,背后都有云測數(shù)據(jù)的參與。

這家頭部AI數(shù)據(jù)服務商在參與標準制定,為行業(yè)攻陷自家經驗和技術能力的同時,也更快、更好地掌握了數(shù)據(jù)標注相關場景的標準化,并應用到自家的產品和解決方案中。其中,基于對行業(yè)標準化的理解,云測數(shù)據(jù)發(fā)布的面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案不僅能提供大規(guī)模感知數(shù)據(jù)能力,還能智駕企業(yè)減少數(shù)據(jù)采集周期,提升數(shù)據(jù)標注效率,降本增效,助力相關企業(yè)在數(shù)據(jù)層面實現(xiàn)研發(fā)領跑。

二、工程化

隨著大模型技術的融入,人工智能應用進程正持續(xù)加速,而在供給端,AI數(shù)據(jù)服務也面臨著數(shù)據(jù)生產、收集、處理、加工、存儲等全生命周期流程的升級,從而才能滿足AI數(shù)據(jù)的大幅度增長需求。簡單來說,對應AI工程化的大趨勢,AI數(shù)據(jù)服務也迎來了工程化的深度升級。

這里,云測數(shù)據(jù)發(fā)布的“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”呈現(xiàn)出來的結果就是一條相對清晰的路徑——通過豐富的數(shù)據(jù)標注工具、成熟的API集成能力、高效的數(shù)據(jù)閉環(huán),加上人員管理及項目管理體系以及安全交付軟硬件支持的方式,云測數(shù)據(jù)在保證數(shù)據(jù)隱私安全的環(huán)境下,對垂直行業(yè)大模型所需的海量數(shù)據(jù)實現(xiàn)了全生命周期管理。

更直觀來說,對應AI數(shù)據(jù)服務的各個流程環(huán)節(jié),云測數(shù)據(jù)都能提供對應的工具、技術能力、管理體系,好似成熟的制造生產線一般,一步步地完成數(shù)據(jù)從無到有的生產,從粗糙到精細的加工等目標,以供下游的垂直行業(yè)大模型用于預訓練。

以基礎的數(shù)據(jù)標注為例,云測數(shù)據(jù)目前提供了相對全面的平臺工具模塊,包括了點云融合跟蹤、OCR文字轉寫、視頻標注、語音轉寫、語音切割、文本判斷、文本生成等等,充分滿足行業(yè)垂直大模型的多模態(tài)數(shù)據(jù)標注需求。

三、場景化

今年以來,市場的焦點從通用大模型轉向了垂直行業(yè)大模型,其背后是對技術應用落地的追求,同時也釋放了一個足以撬動整條人工智能產業(yè)鏈的趨勢——場景化。在AI數(shù)據(jù)服務領域,廠商不再盲目追求廣泛的海量數(shù)據(jù),而是針對某一特定領域或場景的有效數(shù)據(jù)。

場景的聚焦是加速垂直行業(yè)大模型落地的關鍵,同時也意味著更高要求的AI數(shù)據(jù)服務。以智能網聯(lián)汽車為例,云測數(shù)據(jù)為其提供的AI數(shù)據(jù)解決方案目前就包括三部分,分別為基礎數(shù)據(jù)庫、定制化數(shù)據(jù)采集和標注服務以及包括數(shù)據(jù)采集標注、數(shù)據(jù)管理的全方位數(shù)據(jù)工具鏈。

簡單來說,隨著場景化趨勢的發(fā)展,AI數(shù)據(jù)服務的定制化將越來越深入,不僅要針對某一特定行業(yè)或場景提供專業(yè)服務,還有可能聚焦某一公司或某一技術模塊提供高度定制化數(shù)據(jù)服務。

同時,基于場景化的AI數(shù)據(jù)需求也遠超常規(guī),隨著行業(yè)大模型的持續(xù)升級,場景的細分也會越來越精細,對應的數(shù)據(jù)需求更加嚴格。在與「智能相對論」的交流中,云測數(shù)據(jù)總經理賈宇航就提到,在智能網聯(lián)汽車領域,為滿足相關場景的豐富性,云測數(shù)據(jù)可以需要提供包含數(shù)據(jù)采集、數(shù)據(jù)生產、平臺工具在內的AI數(shù)據(jù)服務,從而滿足相關大模型的預訓練需求。

總的來說,對應人工智能產業(yè)鏈上下游的關系,AI數(shù)據(jù)服務需要服務于垂直行業(yè)大模型的需求。現(xiàn)階段,垂直行業(yè)大模型加速落地,需要更多、更有效、更精準的場景數(shù)據(jù),AI數(shù)據(jù)服務的升級有跡可循。

AI數(shù)據(jù)服務走入“深水區(qū)”,頭部廠商如何繼續(xù)保持引領?

市場趨勢的變化往往最先被行業(yè)TOP廠商所感知和反饋。在AI數(shù)據(jù)服務領域,云測數(shù)據(jù)提出“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”,站在下半年垂直行業(yè)大模型進一步爆發(fā)的節(jié)點上將繼續(xù)引領AI數(shù)據(jù)服務行業(yè)。

那么,只是純粹的進場快,就能實現(xiàn)行業(yè)引領嗎?顯然不是。

結合垂直行業(yè)大模型發(fā)展的市場需求,云測數(shù)據(jù)的“面向垂直行業(yè)大模型AI數(shù)據(jù)解決方案”所呈現(xiàn)出來的更關鍵的價值在于其背后三大思維。

一、聚焦賽道,重視價值回歸

垂直行業(yè)大模型的爆發(fā)式增長讓“百模大戰(zhàn)”愈演愈烈,各行各業(yè)都在做相應的大模型產品,呈現(xiàn)出來的市場機會很多,但是對應的AI數(shù)據(jù)服務需求也在升級。這就意味著不能用通用思維來做垂直行業(yè)大模型的AI數(shù)據(jù)服務,也很難有能力把所有行業(yè)都覆蓋。

那么,在這個過程,廠商就需要有所取舍。目前,云測數(shù)據(jù)“面向垂直行業(yè)大模型AI數(shù)據(jù)服務解決方案”主要落地在零售電商、金融保險、智能網聯(lián)汽車等領域。而這些都是云測數(shù)據(jù)從創(chuàng)立之初就聚焦深耕的行業(yè),具備相應的數(shù)據(jù)積累、行業(yè)知識、項目經驗以及客戶資源等。

在云測數(shù)據(jù)總經理賈宇航看來,云測數(shù)據(jù)做垂直行業(yè)大模型的AI數(shù)據(jù)服務,首要的關鍵點是價值考量。

一方面,要做就先做有積累、有基礎的領域——基于這個思路,云測數(shù)據(jù)在提供場景化數(shù)據(jù)采集方案的同時,也會在微調任務后對應行業(yè)需求提供專業(yè)的評測體系和服務,讓AI數(shù)據(jù)服務更有價值。

另一方面,盡管垂直行業(yè)大模型很火,但商業(yè)化落地程度仍具有局限性。對于云測數(shù)據(jù)而言,結合過去的服務經驗、項目經驗篩選有市場需求的領域深耕,是對企業(yè)自身發(fā)展的負責,避免在過熱的市場環(huán)境中迷失自我,失去發(fā)展價值。

二、縱橫升級,強化基本功

垂直行業(yè)大模型應用落地是一個縱橫能力協(xié)同的過程。云測數(shù)據(jù)總經理賈宇航將這一過程理解為“搭積木”,橫向強化底座能力,有一個穩(wěn)定的基礎,縱向深耕場景化,對應不同的行業(yè)進行微調、優(yōu)化,給出專業(yè)的解決方案。

具體來看,云測數(shù)據(jù)基于AI工程化的數(shù)據(jù)服務升級,在橫向上就構建了一套包括數(shù)據(jù)可視化、擴展工具模塊、數(shù)據(jù)權限管理體系等在內的AI數(shù)據(jù)服務解決方案,應對大模型預訓練本身所需要的數(shù)據(jù)需求。

縱向上則針對不同的場景,基于行業(yè)理解提供專精解決方案,比如對應智能網聯(lián)汽車研發(fā)與測試所需要的車外環(huán)境感知、車內智能座艙、人體動作識別等,滿足垂直行業(yè)大模型的進階需求。

三、堅守底線,規(guī)避行業(yè)敏感點

且不說數(shù)據(jù)領域本身就敏感,作為建立在海量數(shù)據(jù)之上的垂直行業(yè)大模型應用對數(shù)據(jù)的需求就非常嚴格,數(shù)據(jù)安全是一方面,數(shù)據(jù)的獨特性、權威性、有效性則是另一方面。

對此,云測數(shù)據(jù)作為行業(yè)TOP企業(yè)始終將數(shù)據(jù)隱私安全放在業(yè)務開展的首位。云測數(shù)據(jù)總經理賈宇航表示,為了確保垂直行業(yè)大模型用于訓練的數(shù)據(jù)合法合規(guī),云測數(shù)據(jù)都會與企業(yè)客戶簽訂數(shù)據(jù)授權協(xié)議。同時,云測數(shù)據(jù)在過去多年的發(fā)展中也會建立具備自由版權的數(shù)據(jù)集,以幫助更多行業(yè)客戶去獲取更多的高質量數(shù)據(jù)。此外,云測數(shù)據(jù)更是一家滿足ISO27001和ISO27701標準的AI數(shù)據(jù)服務廠商,并先后獲得ISO9001、ISO20000、CMMI3等相關認證。

結語

AI數(shù)據(jù)作為生產資料,是推動整個AI行業(yè)發(fā)展的必要一環(huán),也是人工智能商業(yè)化的主要驅動力之一。換句話來說,高質量的數(shù)據(jù)決定了AI的落地程度也不為過。云測數(shù)據(jù)總經理賈宇航曾提出類似的觀點。

而垂直行業(yè)大模型的爆發(fā)式增長,也就意味著AI數(shù)據(jù)需求的澎湃發(fā)展。圍繞高質量數(shù)據(jù)為需求,垂直行業(yè)大模型的落地才有真正意義的基礎。這是AI數(shù)據(jù)服務廠商的機會,也是人工智能產業(yè)突破發(fā)展的關鍵。

*本文圖片均來源于網絡

#智能相對論 Focusing on智能新產業(yè)新服務,這是智能的服務NO.239深度解讀

此內容為【智能相對論】原創(chuàng),

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。

•AI產業(yè)新媒體;

•澎湃新聞科技榜單月度top5;

•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能 十萬個為什么》

•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
大模型

相關文章

  • 大模型是下一代操作系統(tǒng)的未來,在這屆云棲大會上已經到來

    9月24日,2025云棲大會在杭州開幕,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘發(fā)表主旨演講,首次系統(tǒng)性地闡述通往ASI的三階段演進路線,包括智能涌現(xiàn)、自主行動以及自我迭代等,實現(xiàn)從學習人、輔助人到超越人的發(fā)展脈絡?;谏鲜龅陌l(fā)展路線,吳泳銘對外做出判斷,大模型是下一代的操作系統(tǒng)。“我

    標簽:
    大模型
  • 大模型搶灘高考志愿填報,能否頂替「張雪峰」們?

    文/二風來源/節(jié)點財經每年高考成績放榜后,數(shù)千萬考生和家長將迎來另一場硬仗——填報志愿。今年,這一領域迎來了AI的全面介入,多家互聯(lián)網大廠和教育公司紛紛推出智能志愿填報產品,為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國高考志愿填報市場付費規(guī)模約9.5億元,近九成考生愿意借助志愿填報服

    標簽:
    大模型
  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內大模型

    標簽:
    大模型
  • 兩分鐘“熟讀”《國史大綱》,大模型的下一個爆點是“書童”?

    年初大模型行業(yè)上演“長文本”大戰(zhàn)時,我們就萌生過做一個“讀書助理”的想法。測試了市面上主流的大模型后,發(fā)現(xiàn)普遍存在兩個不足:一種是可以處理的文本長度不夠,即使有些大模型將文本長度提升到了20萬字,像《紅樓夢》這樣近百萬字的名著,還是需要多次才能“讀”完。另一種是語言理解和生成能力不足,經常出現(xiàn)“幻覺

    標簽:
    大模型
  • 除了燒錢,互聯(lián)網留給大模型揮霍的“家底”不多了

    互聯(lián)網或許從未停止創(chuàng)新,只是對于創(chuàng)新的認知下降了。

    標簽:
    大模型
  • 看懂黃仁勛CES演講,就看懂 AI 接下來十年的走向

    2026年剛開年,全世界最狂的那個男人,穿著他的經典黑皮衣,在CES舞臺上發(fā)出了未來十年的信號。他搞了個“能吃飽套餐”:6個包子+一碟小菜+一碗粥=肉包子套餐,這樣以后你只要買一個套餐就能吃飽了。(Rubin平臺)同時他們店里還免費提供的筷子、勺子、蘸料、醬油、醋、水果、零食等等。(開放10萬億語言

  • GDPS2025賽場直擊!開普勒大黃蜂助力華理斬獲搬運賽項桂冠

    12月12日-14日,2025全球開發(fā)者先鋒大會暨國際具身智能技能大賽(GDPS2025)于上海張江科學會堂舉行,大會以具身智能競技為核心,融合了技術比拼、產業(yè)展示與科普體驗,為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機器人有限公司(以下簡稱"開普勒機器人")攜明星產品K2"大黃蜂"亮相,并參

    標簽:
    GDPS
    2025
  • 弈動 Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術的演進正引領產業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學者、高??蒲袡C構和企業(yè)的權威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標簽:
    弈動
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術學會、中科先進技術溫州研究院與溫州市電力工程學會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標簽:
    ai技術
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內循環(huán)”

    我覺得我們AI的目標是:從芯片設計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產開車26年國產芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓練和推理分開,訓練就

  • H20芯片開賣即叫停,英偉達如何解圍?

    文/道哥在深陷“后門”風波、接受網信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關鍵供應商——包括負責封裝的安靠科技、供應高帶寬內存的三星電子、以及承擔后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標簽:
    英偉達
  • 真正的「國產英偉達」來了

    文/二風來源/節(jié)點財經一場關于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產GPU領域取

    標簽:
    英偉達
  • AI視頻生成賽道“分野”:小廠重產品,大廠重生態(tài)

    AI視頻生成賽道“分野”:小廠重產品,大廠重生態(tài)

  • 數(shù)據(jù)庫進入“內存自由”時代!阿里云PolarDB發(fā)布全球首個CXL數(shù)據(jù)庫服務器

    技術的進步永無止境,繼創(chuàng)下TPC-C性能&性價比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫再度實現(xiàn)關鍵突破。9月24日杭州云棲大會上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術的PolarDB數(shù)據(jù)庫專用服務器。在原有RDMA網絡的基礎上,Polar