掀開大陸具身智慧真實壓力測試,149元機器人保潔上門,外帶人類清潔工和工程師。(示意圖:shutterstock/達志)
近期,自變量與58同城合作推出「149元(人民幣,下同)、3小時」的智慧保潔服務,引發市場熱議。用戶下單後,家政阿姨、機器人和工程師一起上門。外界好奇:機器人到底做了多少活?為何還需要阿姨和工程師?何時才能真正取代人工?據《界面新聞》報導,這項服務並非單純「機器人替代人工」,而是一種「成熟家政服務+機器人場景參與」的組合。
149元對應的是一次完整的人工上門保潔服務,對許多城市家庭來說,這個價格已足以匹配家政阿姨的勞動。在服務流程中,機器人承擔部分可執行任務,工程師則負責現場支援與安全保障。值得注意的是,自變量與58同城從設計之初就保留用戶拒絕的權利:用戶不同意,機器人不開機。
方案採用視覺脫敏、透明授權與用途限定,原始數據完全脫敏,不共享給第三方。只有在用戶允許下,機器人才能進入家庭,並從一次次成功與失敗中持續迭代。這也代表中國機器人產業的一條新路徑:具身智慧正從資本、發布會與演示影音驅動的熱鬧,走向真實世界的壓力測試。
過去兩年,機器人行業最容易被看見的是「身體」——雙足行走、後空翻、跳舞、跑馬拉松。但在自變量創始人兼CEO王潛看來,那不是他要進入的賽道。王潛說:「跑馬拉松的機器人和我們是兩個完全不同的領域。我們和做語言模型的公司距離可能更近。」
自變量將自己定位為一家具身智慧基礎模型公司,不是單純做人形機器人本體,也不是做家政服務,而是要做機器人的「大腦」:讓機器人看懂環境、理解非結構化任務、規劃路徑,並在真實世界中完成複雜的閉環服務。
王潛認為,具身智慧必須先做基礎模型,再反過來適配具體任務與場景。自變量的優勢在於「以大模型團隊的方式做機器人」。他表示,全世界所有具身智慧公司中,自變量是少數以大模型團隊為核心來做具身智慧的公司。自變量同時推進三件事:基礎模型(Great Wall系列)、真實世界數據和機器人本體。
自變量的技術路線與創始團隊背景密切相關。王潛畢業於清華大學,後獲南加州大學博士,是神經網路注意力機制領域早期探索者之一;聯合創始人兼CTO王昊為北京大學計算物理博士,曾任IDEA研究院大模型團隊負責人。這使得自變量的基因天生偏向模型與算法。
資本也密集下注。從2025年初到2026年初,自變量以幾個月一輪的速度完成從A輪到Pre-B輪的密集融資,集齊紅杉中國、阿里雲、字節跳動、深創投等頂尖機構。2026年春季,小米在B輪入局,自變量成為大陸國內唯一同時獲得字節、美團、阿里、小米四大互聯網巨頭集體加持的具身智慧公司。王潛說:「投資人投我們的邏輯非常簡單,就是投技術的領先性。」大廠本身深度參與大模型競爭,具備技術判斷力,更關注長期壁壘而非短期回報。
今天的大模型在虛擬世界中已足夠聰明,但機器人不能靠語言完成任務。具身智慧的真正難點,在於把「幫我擦桌子」這句話轉化為一連串可在物理世界中執行的動作——看見桌子、判斷物品、決定手臂伸距與力度、規劃路徑。這就是VLA(視覺-語言-動作)模型受到重視的原因。
自變量第一代具身基礎模型WALL-A基於VLA架構,2024年底發布,2025年9月開源輕量化版本WALL-OSS。但真實家庭場景暴露了VLA的不足:場景不穩定、任務無法窮盡,傳統VLA像三個模塊拼接,數據在不同模塊間傳遞會產生損耗與延遲。
自變量CTO王昊將其類比為蘋果M1之前的電腦架構——CPU、GPU、記憶體各自獨立,數據來回搬運造成延遲。蘋果以統一記憶體架構解決問題,自變量則對VLA做類似升級。2026年4月,自變量推出新一代具身智慧基礎模型WALL-B,核心是WUM(World Unified Model)架構,將視覺、語言、動作、物理預測等能力放進同一個網路,從零開始聯合訓練,減少模塊邊界與數據搬運損耗。
WALL-B具備天生多模態能力、本體感(知道自己到哪裡、夠到什麼)、物理規律建模(理解杯子為何會倒、物體為何滑落)以及交互自適應能力——任務失敗後嘗試調整策略,並將成功或失敗沉澱為經驗。此外,WALL-B試圖克服Transformer架構難以長期記憶內化的問題,讓經驗以原生多模態記憶方式,透過類似人腦記憶機制實現自我更新。自變量想做的不只是「會看、會聽、會動」的機器人,更是能理解動作背後世界、能在真實環境中持續完成任務並遷移到不同家庭與任務的系統。
「機器人進入家庭,是這個時代最難的技術問題之一。」王潛說。自變量現階段最重要的目標,不是證明收入模型,而是先做出機器人的「Alpha moment」——讓用戶在某個具體場景中感受到機器人確實能理解任務、進入家庭,並完成部分過去只能由人完成的工作。選擇用上門服務進入家庭,是因為真實用戶付費下單帶來更接近未來日常使用的需求與反饋。
家庭場景的價值在於真實數據、真實反饋與真實約束。實驗室裡的機器人可以反覆調試,展廳裡的機器人可安排在可控環境中;但一旦進入家庭,就會遇到大量無法提前設計的問題:家具擺放、地面材質、光線變化、雜物位置、用戶指令方式,以及機器人會在哪裡失敗。這些問題不進入家庭就不會知道,它們會反過來影響硬件設計、數據採集與模型訓練。
對自變量而言,上門服務是技術走向成熟的一部分——機器人公司最終必須與一個足夠大、足夠複雜的世界交互,而真實訂單是最直接的交互方式。
過去,人們對機器人的想像來自科幻電影、發布會影音與短影音演示,塑造了一種期待:機器人一進家庭就該像人一樣理解環境、完成任務。但真實產業路徑不是這樣發生的。機器人進入家庭不會從完全替代人工開始,而會從人機協作開始;它不會一開始就是完美管家,而更像一個不斷學習的實習生。它可能需要遠程協助,可能把拖鞋放到廚房,也可能擦桌子擦到一半停下來「思考」。但它可以24小時工作,並把每一次真實任務的反饋變成下一輪系統迭代的材料。
公眾期待的是機器人「替代人」;產業正在經歷的,是讓機器人協助人、適應環境、建立信任、持續迭代。這不是消費者不懂機器人,只是過去機器人行業展示給公眾的更多是能力上限,而家庭場景暴露出來的是系統下限。149元3小時的智慧保潔服務,與過去常見的「人形本體、資本估值、發布會演示、短影音傳播」敘事不太一樣。
機器人行業下一階段的競爭,可能會變得更具體也更殘酷——真正拉開差距的,可能是誰能更早進入真實場景,並在真實場景中形成模型、反饋、服務與商業化閉環。而這道最殘酷、最真實的關口前,自變量成為第一個闖關者。
2026/06/06 07:35
轉載自中時新聞網: https://www.chinatimes.com/realtimenews/20260605004260-260409





