最近的小米合作夥伴大會,絕對是科技圈的一場“AI真心話局”。新上任的小米MiMo團隊負責人羅福利,上來就捅破了一層窗戶紙——為啥現在的AI看著聰明絕頂,真讓它乾點家務、幫你開個車,就笨得像個新手?
答案特簡單:現在的AI就是個“語言模擬器”,是個讀了萬卷書卻從冇行過萬裡路的“書呆子”。它靠啃海量文字數據長大,能跟你聊哲學、寫代碼、編段子,但它壓根冇見過真實世界的樣子。你讓它“幫我把客廳的燈打開”,它可能不知道你家客廳的燈在哪;你讓它“提醒我開車轉彎減速”,它不懂什麼叫“轉彎”,什麼是“減速”的物理感覺。
而小米要乾的事,就是把這個“書呆子”從聊天框裡拽出來,扔進咱們的真實生活,讓它學會在人車家的生態裡摸爬滾打,變成一個能扛事、能乾活的“全能助手”。今天咱們就掰開揉碎了說,羅福利到底想怎麼乾?小米釋出的新模型有啥用?這事兒對咱們普通人到底意味著啥?
一、先把話說明白:AI為啥是“空中樓閣”?
羅福利上台第一句話就很炸:“AI正在以非線性的方式重演人類大腦6億年的進化史”。這話聽著玄乎,翻譯成人話就是:AI進化的速度,比人類大腦的生物進化快了成千上萬倍。人類花了幾億年才從單細胞生物的簡單反應,進化出能思考、能創造的大腦;而AI隻用了短短幾年,就從隻會識彆圖片的“小學生”,變成了能跟人對答如流的“大學霸”。
那為啥AI進化這麼快?核心原因就是語言是個“超級壓縮包”。羅福利說,語言是人類思維和物理世界在符號空間的投影。這句話咱們拆開看:你看到“蘋果”兩個字,腦子裡會浮現出蘋果的樣子、味道,知道它能吃、能榨汁;你看到“跑步”兩個字,會想到邁開腿、心跳加速的感覺。這些真實世界的體驗和想法,都被壓縮進了“蘋果”“跑步”這些文字元號裡。
大模型就是靠啃這些“壓縮包”長大的。它讀了億萬本書、億萬條聊天記錄、億萬篇文章,從這些文字裡還原出了人類的思維方式。你問它“天為什麼是藍的”,它能搬出大氣散射的原理;你讓它寫一篇“春天的作文”,它能給你整出花紅柳綠的句子。但問題的關鍵在於:它隻知道“文字裡的世界”,不知道“真實的世界”。
這就像一個人一輩子待在房間裡,隻靠看書瞭解外麵的世界。他知道“遊泳”是手腳劃水、身體漂浮,但他從冇下過水,真把他扔到泳池裡,他還是會嗆水;他知道“開車”是踩油門、打方向盤,但他從冇摸過方向盤,真讓他上路,他還是會手忙腳亂。
羅福利直接點出了當前大模型的致命缺陷:相比生物演化的穩固根基,AI的發展更像空中樓閣。生物的進化是跟真實世界互動出來的——長頸鹿為了吃高處的樹葉,脖子慢慢變長;人類為了適應環境,學會了製造工具。每一步進化都有真實的物理反饋。但AI不一樣,它的“進化”隻發生在數據和演算法的虛擬世界裡,跟真實的物理規律脫節了。
這就引出了一個業內吵翻天的話題:光靠語言,能不能實現通用人工智慧?有些大佬,比如OpenAI的伊利亞,覺得能——隻要把語言模型做到足夠大、足夠強,它就能理解整個世界。但羅福利不這麼認為。他的觀點很明確:下一代智慧體係統,不能隻是語言模擬器,而必須是真正理解世界並與之共存的智慧體。
這話啥意思?簡單說就是:好的AI不能隻會耍嘴皮子,還要會乾活。隻會聊天的AI,頂多是個“電子陪聊”;能操控你的智慧家居、輔助你開車、預判你需求的AI,纔是真正的“生活助手”。這個判斷太重要了——它直接決定了小米未來的產品會長什麼樣。
如果小米覺得“語言就夠了”,那它根本冇必要費勁巴拉搞什麼人車家生態,直接做個聊天機器人就完事了。但如果小米認定“AI必須懂物理世界”,那它就要把AI跟手機、汽車、家電、機器人這些硬體綁在一起,讓AI在真實的生活場景裡練手。這兩條路,差的可不是一星半點。
二、小米甩出真傢夥:Memo-V2-Flash到底是個啥?
基於“AI要融入物理世界”的判斷,小米在大會上甩出了自己的王牌——Memo-V2-Flash大模型。羅福利明確說了,小米做Agent模型(也就是能自主乾活的AI),就盯三個核心方向,每一個都衝著“讓AI落地乾活”去的。
第一個方向:超強的代碼和工具調用能力
這是AI從“聊天”到“乾活”的關鍵一步。咱們現在用的AI,大多是“你問我答”的模式——你問它“明天天氣怎麼樣”,它告訴你“晴轉多雲,20度”;你問它“怎麼訂外賣”,它給你講步驟。但小米的這個模型不一樣,它不是“告訴你答案”,而是“直接幫你辦事”。
舉個例子:你跟它說“幫我查一下明天的天氣,如果下雨就訂個外賣,順便叫個車上班”。正常的AI會給你一串文字:“明天有雨,外賣平台鏈接是XXX,打車軟件鏈接是XXX”。但小米的模型,會直接調用天氣API查天氣,發現下雨後,自動打開外賣平台幫你下單你愛吃的牛肉麪,再打開打車軟件幫你預約明天早上8點的車。全程不用你動手,它自己就能把一整套流程跑完。
為啥能做到這點?因為它會寫代碼、會調用工具。代碼是控製數字世界的“語言”,工具是連接數字世界和物理世界的“橋梁”。AI學會了寫代碼,就相當於拿到了操控各種App、設備的“鑰匙”;學會了調用工具,就相當於有了幫你辦事的“手腳”。這纔是Agent模型和普通聊天機器人的本質區彆——一個是“紙上談兵”,一個是“真刀真槍”。
第二個方向:極致的推理效率
光會乾活還不夠,還得乾得快。你想想,要是你跟AI說“幫我訂個外賣”,它吭哧吭哧思考十分鐘纔給你下單,你早就不耐煩了。咱們普通人用AI,要的就是“秒回”“秒辦”。
為了讓AI思考得又快又準,小米用了一個叫HybridSWA的架構,還搞了三層MTP推理加速。這些技術名詞咱們不用懂,隻要記住一個結果:在同等水平的模型裡,小米的這個模型速度能提升2到2.6倍。
啥概念?彆人的AI思考一個複雜問題要10秒,小米的AI隻要4秒左右。這個速度提升,看著是個技術細節,其實是AI落地的“剛需”。你開車的時候,讓AI幫你判斷前方路況,它要是慢半拍,可能就錯過了最佳的減速時機;你用AI控製智慧家居,它要是反應遲鈍,你說“關燈”,等它關完燈,你都已經走到臥室了。隻有推理效率提上來,AI才能真正融入咱們的日常生活,而不是變成一個“慢吞吞的累贅”。
第三個方向:全新的訓練方法
羅福利提到,他們用了一種叫DedetokenLevel強化學習的方法。這個名字聽著拗口,咱們還是說人話:這是一種讓AI更穩定、更高效學習的方法。
咱們可以把AI的訓練想象成“刷題”。普通的訓練方法,就是讓AI一遍遍地做同樣的題,錯了就改,但效率不高。而小米的這種方法,相當於給AI找了個“聰明的老師”——老師會根據AI的錯題,針對性地出練習題,讓AI在最短的時間內補上自己的短板。這樣一來,AI不用做那麼多無用功,就能更快地掌握乾活的技能,而且不容易出錯。
說完這三個核心方向,再回頭看Memo-V2-Flash這個模型本身。羅福利特彆強調:這個模型並不大。現在很多科技公司搞大模型,都在比“誰的參數量更大”——動不動就是幾千億、上萬億參數,彷彿參數越多,模型就越厲害。但小米反其道而行之,這個模型的參數量隻有幾百億,屬於“小而精”的類型。
但彆小看這個“小模型”,它已經能做很多酷炫的事了。比如,它能通過HTML代碼模擬一個完整的操作係統,你在這個模擬係統裡點鼠標、開軟件,跟真實的電腦冇啥區彆;它能模擬太陽係的運行,告訴你地球怎麼繞著太陽轉,月亮怎麼繞著地球轉;它還能畫一棵聖誕樹,從樹乾到樹枝,再到樹上的彩燈,都畫得有模有樣。
這些功能看著像是“炫技”,其實背後藏著小米的野心——這個模型已經初步具備了“模擬世界”的能力。它不再是隻知道文字的“書呆子”,而是能通過代碼和圖像,構建出一個虛擬的物理世界。有了這個基礎,它再去操控真實世界的設備,就容易多了。
三、最狠的一步棋:為啥小米要把模型開源?
更讓人意外的是,小米宣佈:Memo-V2-Flash釋出即開源,模型權重、技術報告、API全部公開,而且API限時免費。這個決定,在AI圈裡絕對是“重磅炸彈”。
現在很多科技公司搞大模型,都喜歡“閉源”——把模型藏起來,隻給用戶提供有限的介麵,想用就得花錢。小米為啥反著來?羅福利說了一句話:開源本質上是一種分散式的技術加速主義。這話翻譯過來,就是“一個人走得快,一群人走得遠”。
小米開源這個模型,有三個實實在在的好處。
好處一:降低自己的研發成本
搞大模型是個“燒錢”的活兒——要租算力、要雇工程師、要不斷優化模型。就算是小米這樣的大公司,單靠自己的團隊,也很難麵麵俱到。把模型開源之後,全世界的開發者都能免費使用這個模型,他們會在使用的過程中發現模型的bug,提出改進建議,甚至直接給模型寫優化代碼。
這些開發者相當於給小米免費打工,幫小米完善模型。小米不用花一分錢,就能得到成千上萬的“編外工程師”。這比自己關起門來搞研發,效率高多了。
好處二:迅速擴大技術影響力
開源就像“撒種子”。小米把Memo-V2-Flash這個“種子”撒出去,全世界的開發者都會用它來做各種各樣的產品——有的可能用它做一個智慧家電助手,有的可能用它做一個車載導航係統,有的可能用它做一個兒童教育機器人。
這些產品越多,就有越多的人知道“小米的模型好用”。久而久之,小米的AI技術就會滲透到各行各業,形成一個龐大的生態。到那個時候,就算彆的公司再搞類似的模型,也很難撼動小米的地位。
好處三:反哺小米的硬體生態
這纔是小米開源的終極目的。小米不是一家純軟件公司,它的核心業務是手機、汽車、智慧家居這些硬體。把AI模型開源之後,開發者們做出來的各種AI產品,都能很方便地跟小米的硬體對接。
比如,一個開發者用小米的模型做了一個智慧窗簾助手,這個助手就能直接控製小米的智慧窗簾;一個開發者用小米的模型做了一個車載語音係統,這個係統就能直接裝到小米的汽車上。這樣一來,小米的硬體就會變得越來越智慧,越來越好用,用戶也會越來越離不開小米的生態。
羅福利甚至說:開源是實現AGI(通用人工智慧)普惠化的唯一路徑。這話聽起來有點理想主義,但其實是小米的“戰略陽謀”。AGI不是一家公司能單獨搞出來的,它需要全人類的智慧共同推動。小米開源模型,就是想讓更多人蔘與到AGI的研發中來,同時也讓自己站在這場技術革命的最前沿。
四、反常識的觀點:AI的終極護城河不是算力和數據?
在AI圈裡,大家聊得最多的就是“算力”和“數據”。很多人覺得,誰的服務器多、誰的算力強,誰就能搞出更好的模型;誰的訓練數據多、誰的數據質量高,誰就能在AI競賽中領先。
但羅福利直接否定了這個觀點。他說:算力和數據不是最終的護城河。
這話一出,估計很多人都懵了——那啥纔是AI的終極護城河?羅福利的答案很簡單:科學的研究文化與方法,以及將未知問題轉化為可用產品的能力。
這個答案,真的很反常識。算力和數據是“硬通貨”,有錢就能買——你想買多少服務器,就能買多少;你想搞多少數據,就能搞多少。但研究文化和方法論,是“無形資產”,不是砸錢就能砸出來的。
這就像兩個學生考試:一個學生家裡有錢,買了一大堆輔導資料,請了最好的家教,但他自己不愛學習,方法也不對,成績照樣上不去;另一個學生家裡冇那麼多錢,但他愛鑽研,有一套自己的學習方法,成績反而能名列前茅。
小米的AI團隊,就是羅福利口中的“第二個學生”。他在演講裡特彆提到,小米的大模型團隊是一個“小而美”的團隊——人不多,但個個都是精兵強將。這個團隊最大的特點,就是“研究、產品與工程深度耦合”。簡單說就是:搞研究的人懂產品,搞產品的人懂工程,搞工程的人懂用戶。
這樣的團隊,能把一個看似虛無縹緲的技術概念,變成一個普通人能用、好用的產品。咱們普通人用過不少AI產品,有的功能很強,但操作複雜得要命,普通人根本不會用;有的操作簡單,但功能太雞肋,根本冇啥用。這些產品的問題,就出在“研究和產品脫節”——搞技術的人隻顧著炫技,根本冇考慮用戶的實際需求。
而小米的團隊,從一開始就把“用戶需求”放在第一位。他們搞AI技術,不是為了“比彆人厲害”,而是為了“讓用戶的生活更方便”。這種“技術服務於產品,產品服務於用戶”的文化,纔是小米AI真正的護城河。
羅福利還在現場公開招聘,說他們要找的是“真正熱愛技術,願意探索未知的人”。這話透露出的資訊很明確:小米不想走捷徑,不想靠砸錢買算力、買數據來搞AI,而是想沉下心來,建立自己的技術壁壘。
五、對普通人來說,這意味著什麼?
說了這麼多技術和戰略,咱們最關心的還是:小米的這些動作,到底能給咱們的生活帶來什麼改變?
羅福利在會上展示了小米的Memo係列大模型家族,一共五個模型,個個都衝著“落地乾活”去的。
1.推理大模型(Memo-V2-Flash):負責複雜推理任務,比如幫你規劃出行路線、處理工作文檔。
2.視覺推理大模型:不隻是能識彆圖片裡的物體,還能理解場景——比如它能看出你“在廚房做飯”,然後自動幫你打開抽油煙機。
3.原生端到端音頻生成模型:能生成自然的語音,不是那種機械的合成音——以後你的手機語音助手,說話會像真人一樣自然。
4.端側視覺語言大模型:能在手機、手錶這些設備本地運行,不用聯網也能用——就算你在冇信號的深山裡,也能讓AI幫你識彆植物、動物。
5.具身大模型:專門用來控製機器人和智慧硬體——以後你的掃地機器人,會自己規劃清掃路線,還能避開障礙物;你的智慧汽車,會自己判斷路況,幫你安全駕駛。
這五個模型,會分彆應用在小米的手機、PC、穿戴設備、IoT設備和汽車上。咱們可以想象一下未來的生活場景:
-早上起床,你的小米手機會根據你的睡眠數據,判斷你昨晚睡得好不好,然後用自然的語音叫醒你:“今天天氣不錯,要不要去公園跑個步?”
-你出門上班,你的小米汽車會自動幫你規劃最佳路線,避開擁堵路段;開到路口的時候,它會提醒你:“前方有行人,請注意減速。”
-你下班回家,你的小米智慧家居會提前幫你打開空調,調好溫度;你說“我想看電影”,它會自動幫你打開電視,拉上窗簾,關掉客廳的燈。
-你週末在家做飯,你的小米冰箱會根據裡麵的食材,給你推薦菜譜;你切菜的時候,它會提醒你:“小心刀手。”
這些場景,不是科幻電影裡的想象,而是小米正在努力實現的目標。羅福利說,他剛開始研究AI的時候,開源模型和頂尖模型的差距有三年;現在,這個差距已經縮短到幾個月了。技術迭代的速度,真的超出咱們的想象。
小米計劃2026年投入400億研發費用,很大一部分都會花在AI上。按照這個速度,兩三年後,咱們用的小米設備,會和現在完全不同——不再是一個個孤立的硬體,而是一個互聯互通、智慧貼心的“生活夥伴”。
六、最後想說的話
小米這次的釋出會,讓咱們看到了一個不一樣的AI方向。現在很多公司搞AI,都在比“誰的模型參數更大”“誰的算力更強”,但小米卻把目光投向了“讓AI落地乾活”。
這條路,可能比單純搞大模型更難——它需要AI和硬體深度融合,需要技術和用戶需求緊密結合,需要長期的投入和耐心。但這條路,也是最有價值的路。
畢竟,對咱們普通人來說,能幫我們乾活的AI,纔是好AI。一個隻會聊天的AI,頂多是個“電子玩具”;一個能融入我們生活、幫我們解決實際問題的AI,纔是真正的“生活助手”。
從“語言模擬器”到“理解物理世界的智慧體”,從“閉源壟斷”到“開源普惠”,從“比拚算力數據”到“深耕研究文化”,小米的這些選擇,正在為AI的未來指明一個新方向。
這條路能不能走通?時間會給出答案。但至少,小米已經邁出了最堅實的一步。而咱們普通人,隻需要靜靜等待——等待那個“懂你、幫你、陪你”的AI,真正走進咱們的生活。