1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

谷歌 Gemma 4 正式開源,開源賽道迎來(lái)變局!

 2026-04-03 15:55  來(lái)源:互聯(lián)網(wǎng)  我來(lái)投稿 撤稿糾錯(cuò)

  一鍵部署OpenClaw

4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸彈——全新一代 開源大模型Gemma 4正式發(fā)布,以極其寬松的Apache 2.0協(xié)議向全球開發(fā)者免費(fèi)開放。這是自2025年3月發(fā)布Gemma 3以來(lái),谷歌時(shí)隔整整一年的重大迭代。

本次發(fā)布的Gemma 4包含四個(gè)不同規(guī)格的版本:E2B(有效20億參數(shù))、E4B(有效40億參數(shù))、26B混合專家模型(MoE)以及31B稠密模型(Dense),全面覆蓋從手機(jī)、樹莓派到工作站和服務(wù)器的全場(chǎng)景部署需求。谷歌DeepMind CEO Demis Hassabis在社交平臺(tái)上以四顆鉆石emoji暗示此次發(fā)布,并放話:“這是全球同等規(guī)模下最好的開源模型。”

Apache 2.0協(xié)議:一次遲到的誠(chéng)意釋放
Gemma 4最值得關(guān)注的變化并非參數(shù)或性能,而是它的開源協(xié)議。此前Gemma系列采用谷歌自有的定制化條款,開發(fā)者抱怨了一整年——可以用,但用途受限,再分發(fā)受限,修改了也不能隨便傳播,充其量只能算“開放模型”,遠(yuǎn)達(dá)不到AI圈真正的“開源”標(biāo)準(zhǔn)。相比之下,Gemma 4直接換成了Apache 2.0協(xié)議,這是業(yè)界最寬松、最成熟的開源協(xié)議之一,與Qwen、Mistral等主流開源模型采用相同的授權(quán)條款。沒(méi)有使用限制條款,沒(méi)有“禁止危害用途”等需要法律團(tuán)隊(duì)逐條解釋的灰色地帶,對(duì)再分發(fā)和商業(yè)部署沒(méi)有任何限制。

這一轉(zhuǎn)變意味著,企業(yè)和個(gè)人開發(fā)者現(xiàn)在可以無(wú)門檻地自由修改、分發(fā)和商業(yè)化使用Gemma 4,無(wú)需擔(dān)心谷歌中途收回授權(quán)。對(duì)于此前因許可證問(wèn)題轉(zhuǎn)向Mistral或Qwen的團(tuán)隊(duì)而言,這個(gè)堵點(diǎn)終于被消除了。

參數(shù)效率的顛覆性突破
如果說(shuō)許可證轉(zhuǎn)向是態(tài)度上的誠(chéng)意,那么性能表現(xiàn)則是技術(shù)上的硬實(shí)力。Gemma 4 31B Dense版本在Arena AI文本開源排行榜中沖到了全球第三,Elo評(píng)分1452,僅次于GLM-5和Kimi 2.5。排在前面的兩位,參數(shù)量分別是它的20倍和30倍。換句話說(shuō),谷歌用三十分之一的體量打出了同等水平的成績(jī),“參數(shù)效率”這個(gè)詞被重新定義了。

26B MoE版本同樣亮眼:260億總參數(shù),推理時(shí)僅激活38億,Elo達(dá)到1441,位列開源榜單第六。這意味著在手機(jī)上跑一個(gè)小模型,得到的響應(yīng)質(zhì)量可以堪比一年前千億級(jí)參數(shù)的云端模型。

具體數(shù)據(jù)更為直觀。相比上一代Gemma 3 27B,Gemma 4 31B在數(shù)學(xué)推理基準(zhǔn)AIME 2026上從20.8%跳升至89.2%;代碼能力基準(zhǔn)LiveCodeBench v6從29.1%漲到80.0%,Codeforces編程競(jìng)賽ELO評(píng)分從110拉到2150,相當(dāng)于人類編程競(jìng)賽“紫名”選手的水平。衡量智能體工具調(diào)用能力的τ2-bench從6.6%大幅躍升至86.4%。在研究生級(jí)科學(xué)問(wèn)答GPQA Diamond測(cè)試中,得分從42.4%升至84.3%,幾乎翻倍。

多模態(tài)能力同步補(bǔ)齊。所有版本均支持圖像和視頻輸入,小模型版本額外搭載了音頻編碼器,支持語(yǔ)音識(shí)別與翻譯。在MMMU Pro多模態(tài)推理測(cè)試中,31B版本達(dá)到76.9%,大幅領(lǐng)先前代的49.7%。長(zhǎng)上下文短板也被補(bǔ)齊,MRCR v2 128K測(cè)試從13.5%躍升至66.4%。此外,Gemma 4原生支持超過(guò)140種語(yǔ)言,多語(yǔ)言基準(zhǔn)MMMLU達(dá)88.4%。

值得注意的是,26B MoE與31B在大部分指標(biāo)上只差2到5個(gè)百分點(diǎn),但推理速度快得多。對(duì)于延遲敏感的應(yīng)用場(chǎng)景,26B MoE的性價(jià)比更高。

從口袋到數(shù)據(jù)中心的全場(chǎng)景覆蓋
Gemma 4的硬件適配范圍堪稱全面。31B Dense追求極致原始性能,未量化的bfloat16權(quán)重可放入單張80GB NVIDIA H100顯卡運(yùn)行,量化版本在消費(fèi)級(jí)顯卡上也能跑。26B MoE側(cè)重低延遲,推理時(shí)僅激活38億參數(shù),Token生成速度極快,適合實(shí)時(shí)語(yǔ)音助手、自動(dòng)化操作等需要快速響應(yīng)的智能體場(chǎng)景。

端側(cè)的E2B和E4B則與谷歌Pixel團(tuán)隊(duì)、高通、聯(lián)發(fā)科聯(lián)合優(yōu)化,可在手機(jī)、樹莓派、NVIDIA Jetson Orin Nano上完全離線運(yùn)行,延遲接近于零。E2B在部分設(shè)備上的內(nèi)存占用可壓至1.5GB以下,使得真正的端側(cè)AI部署成為現(xiàn)實(shí)。

此外,Gemma 4全系列內(nèi)置可開關(guān)的“思考模式”,模型在輸出答案前會(huì)先進(jìn)行內(nèi)部推理,極大提升了多步驟規(guī)劃類任務(wù)的準(zhǔn)確性。原生支持函數(shù)調(diào)用和結(jié)構(gòu)化JSON輸出,谷歌還同步發(fā)布了開源Agent開發(fā)工具包(ADK),讓端側(cè)模型也能變身“智能體”。

開源賽道迎來(lái)變局
自2024年2月Gemma首次發(fā)布以來(lái),開發(fā)者已下載Gemma系列超過(guò)4億次,構(gòu)建了擁有超過(guò)10萬(wàn)個(gè)變體的生態(tài)系統(tǒng)。在上一代Gemma 3發(fā)布后的一年里,國(guó)內(nèi)開源模型如DeepSeek、Qwen、GLM等迭代了好幾輪,谷歌在開源領(lǐng)域的存在感一度被削弱。此次Gemma 4的發(fā)布,不僅是技術(shù)上的代際飛躍,更是開源賽道的一次權(quán)力重組。

Gemma 4現(xiàn)已可在Hugging Face、Kaggle、Ollama、Google AI Studio等多個(gè)平臺(tái)免費(fèi)下載使用。對(duì)于全球數(shù)百萬(wàn)開發(fā)者而言,一個(gè)真正開源、性能頂尖且能在本地自由運(yùn)行的AI模型,正從云端落入每個(gè)人的口袋里。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
大模型

相關(guān)文章

  • 字節(jié)火山引擎Seedance 2.0正式面向普通API客戶開放申請(qǐng),豆包大模型日均Token使用量突破120萬(wàn)億

    4月2日,字節(jié)跳動(dòng)旗下火山引擎在武漢舉行的AI創(chuàng)新巡展上宣布,Seedance2.0API正式面向企業(yè)用戶開啟公測(cè)。同時(shí),火山引擎總裁譚待在會(huì)上披露,截至今年3月,豆包大模型日均Token使用量已突破120萬(wàn)億,在過(guò)去三個(gè)月內(nèi)增長(zhǎng)一倍,比2024年5月發(fā)布時(shí)增長(zhǎng)1000倍。Seedance2.0:從

    標(biāo)簽:
    大模型
    火山引擎
  • Claude Code意外泄露51萬(wàn)行核心源碼,全球開發(fā)者連夜“搶救式”備份

    3月31日,科技圈上演了一場(chǎng)現(xiàn)實(shí)版的“代碼大逃殺”。一向以“閉源”為傲的AI巨頭Anthropic,因一個(gè)低級(jí)打包失誤,將旗下明星產(chǎn)品ClaudeCode的完整源代碼拱手送給了全世界。一次59.8MB的“裸奔”事情始于一個(gè)普通的周二早晨。Web3安全公司FuzzLab的實(shí)習(xí)研究員ChaofanSho

    標(biāo)簽:
    大模型
    人工智能
  • 大模型是下一代操作系統(tǒng)的未來(lái),在這屆云棲大會(huì)上已經(jīng)到來(lái)

    9月24日,2025云棲大會(huì)在杭州開幕,阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長(zhǎng)兼CEO吳泳銘發(fā)表主旨演講,首次系統(tǒng)性地闡述通往ASI的三階段演進(jìn)路線,包括智能涌現(xiàn)、自主行動(dòng)以及自我迭代等,實(shí)現(xiàn)從學(xué)習(xí)人、輔助人到超越人的發(fā)展脈絡(luò)?;谏鲜龅陌l(fā)展路線,吳泳銘對(duì)外做出判斷,大模型是下一代的操作系統(tǒng)。“我

    標(biāo)簽:
    大模型
  • 大模型搶灘高考志愿填報(bào),能否頂替「張雪峰」們?

    文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)每年高考成績(jī)放榜后,數(shù)千萬(wàn)考生和家長(zhǎng)將迎來(lái)另一場(chǎng)硬仗——填報(bào)志愿。今年,這一領(lǐng)域迎來(lái)了AI的全面介入,多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報(bào)產(chǎn)品,為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國(guó)高考志愿填報(bào)市場(chǎng)付費(fèi)規(guī)模約9.5億元,近九成考生愿意借助志愿填報(bào)服

    標(biāo)簽:
    大模型
  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國(guó)內(nèi)大模型

    標(biāo)簽:
    大模型
  • 谷歌 Gemma 4 正式開源,開源賽道迎來(lái)變局!

    4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸彈——全新一代開源大模型Gemma4正式發(fā)布,以極其寬松的Apache2.0協(xié)議向全球開發(fā)者免費(fèi)開放。這是自2025年3月發(fā)布Gemma3以來(lái),谷歌時(shí)隔整整一年的重大迭代。本次發(fā)布的Gemma4包含四個(gè)不同規(guī)格的版本:E2B(有效20億參數(shù))、E4

    標(biāo)簽:
    大模型
  • OpenClaw常見的五種“病”,到底該怎么“治”?

    AI龍蝦也會(huì)生病。別怕,大部分病不是什么絕癥,自己在家就能治。我養(yǎng)OpenClaw一年多,總結(jié)出五種最常見的毛病,附上我的“土方子”,希望對(duì)你有用。病一:不吃食(完全不執(zhí)行任何任務(wù))癥狀:你給了指令,它沒(méi)反應(yīng),日志里一片空白。就像龍蝦趴在塘底不動(dòng)彈,碰它也不理。病因:通常是進(jìn)程卡死了,或者依賴服務(wù)沒(méi)

  • 普通人怎么養(yǎng)AI龍蝦,別讓你的AI龍蝦餓著或撐著

    養(yǎng)過(guò)真龍蝦的人都知道,投喂是個(gè)技術(shù)活。喂少了,龍蝦餓得互相殘殺;喂多了,剩餌壞水,整塘發(fā)病。OpenClaw這個(gè)AI龍蝦也一樣——你給它安排的任務(wù)太少,它會(huì)“閑得發(fā)慌”,反應(yīng)遲鈍;你一次塞給它太多復(fù)雜任務(wù),它會(huì)“消化不良”,要么報(bào)錯(cuò)要么干一半就卡住。每天該喂幾次?我的經(jīng)驗(yàn)是:每天喂兩次,早上一次簡(jiǎn)單

  • 選對(duì)版本和“飼料”,OpenClaw小龍蝦才能長(zhǎng)得壯

    養(yǎng)過(guò)真龍蝦的人都知道,苗種的好壞直接決定收成。養(yǎng)AI龍蝦也一樣——OpenClaw有不同版本,有的穩(wěn)定但功能少,有的功能多但愛“鬧脾氣”。新手該怎么選?我用自己的踩坑經(jīng)歷告訴你。版本怎么選?OpenClaw目前主要有三個(gè)分支:穩(wěn)定版(Stable)、測(cè)試版(Beta)和社區(qū)魔改版(Community

  • 入坑OpenClaw前,先問(wèn)問(wèn)自己這三件事

    我第一次聽說(shuō)OpenClaw,是在一個(gè)技術(shù)群里。有人發(fā)了一串代碼,說(shuō)“這個(gè)AI龍蝦特別好養(yǎng),會(huì)自己找食吃”。我好奇點(diǎn)進(jìn)去,結(jié)果對(duì)著終端發(fā)了一小時(shí)呆——連環(huán)境都沒(méi)搭起來(lái)。后來(lái)我才明白,養(yǎng)AI龍蝦跟養(yǎng)真龍蝦一樣,新手入門得先做足功課。第一問(wèn):我的電腦跑得動(dòng)嗎?很多人以為AI龍蝦就是個(gè)聊天機(jī)器人,打開網(wǎng)頁(yè)

  • 字節(jié)火山引擎Seedance 2.0正式面向普通API客戶開放申請(qǐng),豆包大模型日均Token使用量突破120萬(wàn)億

    4月2日,字節(jié)跳動(dòng)旗下火山引擎在武漢舉行的AI創(chuàng)新巡展上宣布,Seedance2.0API正式面向企業(yè)用戶開啟公測(cè)。同時(shí),火山引擎總裁譚待在會(huì)上披露,截至今年3月,豆包大模型日均Token使用量已突破120萬(wàn)億,在過(guò)去三個(gè)月內(nèi)增長(zhǎng)一倍,比2024年5月發(fā)布時(shí)增長(zhǎng)1000倍。Seedance2.0:從

    標(biāo)簽:
    大模型
    火山引擎

熱門排行

編輯推薦