22/11/2024
AI︱當機械人懂得摺衣服:家務智能化是否已到來?Physical Intelligence如何重塑AI機械人市場?未來更多機械人負責汽車、電動車生產線?
在科幻電影中,AI 機械人能搬運貨物、駕駛飛船的畫面已經令人驚嘆不已。如果說機械人能夠熟練地摺衣服,是否更讓人覺得神乎奇技?近日美國初創Physical Intelligence 展示一款具備家務處理能力的機械人,並獲得包括 Amazon 創辦人貝佐斯與 OpenAI 在內的4億美元融資,引起市場關注。機械人現正是AI界的熱門研究方向,大量初創湧進此賽道,甚至連Tesla也想分一杯羹。在如此激烈的競爭環境下,Physical Intelligence 究竟憑藉甚麼技術優勢能從中脫穎而出?
研發所有機械人適用的AI模型
剛踏入11月,總部位於三藩市的AI機械人初創Physical Intelligence(簡稱 Pi)表示,在最新一輪融資中成功募得4億美元(約31.2億港元),投資者包括:亞馬遜(Amazon)創辦人傑夫·貝佐斯(Jeff Bezos)、OpenAI、以及紅杉資本(Sequoia Capital)等,令公司估值攀升至24億美元(約187.2億港元)。
Physical Intelligence能夠吸引到投資者青睞,只因不像其主要對手特斯拉(Tesla)般,同時兼顧機械人的軟件和硬件研發,而是另闢蹊徑,不造機械人硬件,而是專注於開發機械人軟件系統,目標是針對現實物理世界創建一個通用AI模型,可以套用到不同類型機械人之上。
Read More
AI+Robot始動!機械人初創Figure獲OpenAI投資,人形機械人成為AI競賽致勝新關鍵?
機械人要變成「人」?黃仁勳、馬斯克押寶人形機械人!拆解人形設計的優勢與市場潛力
創建世上最大規模機械人數據庫
譬如說,當機械人收到要把杯子放到盛水盤的指示,AI系統便會透過演算法,搜尋杯子與盛水盤之間的關聯性,繼而判斷下一步行動。可是,不同種類的機械人會以不同方式來完成這項任務,假如世上有10,000款不同型號的機械人,就會有10,000個不同設計的AI系統,採用10,000種不同方式來執行這項任務,可以想像這是多麽耗費成本與時間之事。Pi的通用AI模型正是為解決以上問題而生。
自2023年成立以來,Physical Intelligence就一直搭建大型語言模型,並採購不同款式機械人,供模型進行各種家務訓練;同時又會讓人類遠端操作機械人,讓模型學習難度較高的家務處理方法,藉此創建世上最大規模的機械人數據庫。目前Pi已成功建構名為「π0」(Pi-zero)的基礎模型。
機械人摺疊衣物是超高難度任務
2024年10月底,Physical Intelligence發布了多段家務機械人示範影片,顯示在π0模型控制下兩隻機械臂如同人類雙手般,互相配合完成各項家務,包括:組裝紙盒、將咖啡豆舀到磨豆機、甚至從乾衣機取出衣服並摺疊整齊。Pi執行長卡羅爾·豪斯曼(Karol Hausman)指出,摺疊衣物對機械人來說難度特別高,因為這不但要求機械人具備高精度的物理交互能力,還需充分理解柔性物品的特性。
在Physical Intelligence基礎模型「π0」控制下,兩隻機械臂如同人類雙手般互相配合,把衣物摺疊整齊。(圖片來源:翻攝Physical Intelligence官方影片)
家務機械人的實現,意味著未來能釋放人類更多的時間和精力去從事更具創意的經濟活動。從養老機構到日常家務,機械人有望成為生活中的「新助手」,為勞動密集型產業提供有效的人力解決方案。根據德意志銀行分析師Edison Yu的預測,到2030年全球人形機械人的數量將成長至25萬部,市場規模達到62.5億美元(約487.5億港元);到2035年更可望激增至150萬部,市場規模高達300億美元(約1,170億港元),可說是極具市場潛力。
Pi機械人模型存有不穩定狀況
雖然Physical Intelligence不設計和製造機械人硬件,貎似可以大幅減省研發成本,但要建構一個機械人專屬的AI模型,其實是一個時間漫長且昂貴的過程。ChatGPT背後的大型語言模型可以抓取網上豐富的文字資料進行訓練,而機械人模型的訓練數據則只能從現實世界中蒐集,當下數據規模仍非常有限,對模型的穩定性造成一定挑戰。譬如,有時機械人會把雞蛋硬塞進已擺滿東西的紙盒,或者誤將紙盒從枱面丟到地下。
Physical Intelligence機械人懂得自行組裝紙箱。(圖片來源:翻攝Physical Intelligence官方影片)
除Physical Intelligence以外,另一機械人初創Figure於2024年2月同樣從OpenAI、貝佐斯等投資者手上取得6.75億美元(約52.65億港元)融資。該公司的研發路向恰好與Pi相反,側重於機械人硬件設計,軟件系統則採用OpenAI的GPT大型語言模型。現時其機械人已進駐德國車廠BMW的生產線上,進行實作測試。
Figure機械人現已投放到BMW生產線,負責組裝汽車零件。(圖片來源:翻攝Figure官方影片)
技術處於實驗階段商業化滯後
另一對手特斯拉已發表第二代機械人「Optimus Gen 2」,並部署到Tesla美國超級工廠從事電動車生產。Tesla執行長伊隆·馬斯克(Elon Musk)揚言,2026年將大量製造、向外銷售Optimus機械人。相較之下,Pi 機械人技術仍停留在實驗階段,商業化進程遠比對手落後。
Tesla Optimus機械人已部署到Tesla廠房,輔助電動車生產。(圖片來源:翻攝Tesla官方影片)
如要急起直追,Physical Intelligence可以考慮尋找具備機械人硬件研發能力的合作夥伴,共同開發針對特定場景的軟硬件整合解決方案。除家務機械人外,Pi 可以探索將其AI模型應用於醫療、物流、工業製造等高附加值領域,以增加產品價值,吸引更多潛在客戶和合作伙伴。只有這樣,Pi 才可以在AI機械人領域站穩陣腳,讓市場形成百家爭鳴的多元競爭格局。
【與拍賣官看藝術】畢加索的市場潛能有多強?亞洲收藏家如何從新角度鑑賞?► 即睇