21/04/2023
AI市場邁向戰國時代!亞馬遜推Bedrock劍指OpenAI,馬斯克開發TruthGPT對撼ChatGPT!
當Google跟微軟、OpenAI在AI領域鬥得天昏地暗之際,亞馬遜終於按捺不住,正式宣告加入AI戰團,但不是發表像ChatGPT般的AI應用,而是推出AI開發雲端平台和大型語言模型,方便企業客戶製作自家AI軟件。另一邊廂,不斷公開反對OpenAI的科技狂人馬斯克,正在籌組新AI公司「X.AI」,更會開發名為「TruthGPT」的聊天機械人,看似有意跟OpenAI和ChatGPT一決雌雄。隨著亞馬遜、馬斯克相繼入局,會對生成式AI市場帶來甚麼衝擊呢?
Bedrock平台式服務簡化AI開發
2023年4月13日,亞馬遜(Amazon)旗下全球最大雲端服務供應商AWS宣布,針對企業客戶推出AI平台式開發服務「Bedrock」和自家基礎模型「Titan」,讓開發團隊能以較簡單而低成本的方式,部署生成式AI應用。
AWS發表Bedrock開發平台和Titan基礎模型,幫助企業客戶簡易地開發出聊天機械人或文生圖的服務。(圖片來源:Amazon官網)
AWS表示,客戶可視乎其開發取向而選擇合適的基礎模型,跟著用自家公司數據訓練出專屬的AI模型,然後透過AWS工具把模型整合到自有AI應用。至於AI市場龍頭OpenAI,亦有提供類似服務,容許企業客戶因應業務需要而微調模型。
在Bedrock平台上,客戶可通過API使用4個不同的基礎模型:由前OpenAI員工成立的美國AI初創Anthropic,旗下「Claude」模型可執行多種對話和文本處理任務,宣稱是誠實且負責任的AI系統。來自以色列初創AI21 Labs的「Jurassic-2」,能夠生成多國語言文案,包括:法語、德語、意大利語、荷蘭語、西班牙語、以及葡萄牙語。來自英國初創Stability AI 的「Stable Diffusion」,能夠產製高質圖像、商標和其他設計圖等。
OpenAI前研究副總裁達里奧·阿莫迪(Dario Amodei)因公司發展方向與其他同事有意見分歧,於是決定自立門戶,2021年創辦Anthropic,旗下主打產品「Claude」已被AWS納入為Bedrock平台上可供選擇的基礎模型之一。(圖片來源:Anthropic官網)
以色列AI初創AI21 Labs於2022年取得6,400萬美元(約4.99億港元)融資,並於2023年1月推出一款AI寫作工具,其背後模型也被納入Bedrock平台。(圖片來源:AI21 Labs官網)
英國AI初創Stability AI的估值高達40億美元(約312億港元),主要產品為「Stable Diffusion」圖像生成器,其AI模型亦已加入Bedrock基礎模型行列。(圖片來源:Stability AI官網)
至於亞馬遜自家的「Titan」,內含兩個大型語言模型,分別提供兩項功能:「文本生成」,適用於研發開放式問答、以及生成文案服務等;「文本嵌入」,可以將文字輸入轉換成包含語義的數值,適用於開發個人化服務、推薦、以及搜尋等。
客戶數據絕不用於AWS模型訓練
Bedrock客戶不用自建伺服器,便可以直接基於Titan或其他模型來創建AI應用,有助減省整體開發成本。AWS承諾,客戶輸入至Titan的數據,只會留在自家平台上,而不會充當Titan的訓練數據,避免公司機密外洩。此外,Titan可以偵測和移除數據中的有害內容,又可以拒絕用戶輸入不當或低俗內容,更可以過濾模型本身產出的仇恨言論、色情和暴力內容等。
亞馬遜新任執行長的安迪‧賈西(Andy Jassy)在寫給股東的信中,強調該公司現正積極投資大型語言模型和生成式AI技術,預期這項投資足以讓Amazon往後幾十年在各個業務領域均可進行創新。
盡管亞馬遜不像Google和Microsoft般,能夠搭配搜尋引擎和文書處理軟件來推展AI應用,但該公司作為電商和雲端服務龍頭,不僅掌握巨量的網購數據,在雲端運算方面也有很強的競爭力,故此AWS在這場AI競賽中仍是非常強勁的對手。
Twitter購1萬枚GPU供AI運算
不過,或許有一個更強的挑戰者即將登場——身兼特斯拉(Tesla)、SpaceX與Twitter執行長的伊隆‧馬斯克(Elon Musk),也有意投入生成式AI開發。網媒《Business Insider》報道指, Twitter已向輝達(NVIDIA)採購約10,000枚圖像處理器(GPU)供AI運算之用。據聞,Open AI為訓練GPT-4模型,花費了1億美元(約7.8億港元)購入10,000枚NVIDIA A100圖像處理器。
有報道指,Twitter已向NVIDIA購入10,000枚GPU,暫時還不清楚採購了哪個型號,但外界估計有可能是NVIDIA A100的後繼產品「H100」,在相同功率下運算速度能比上代快上好幾倍。(圖片來源:NVIDIA官網)
除此以外,Twitter也在招聘新的AI工程師。較早前,該公司從Google母公司Alphabet旗下 AI實驗室DeepMind挖走科學家巴布斯金(Igor Babuschkin),主掌新AI項目發展。外界預期,Twitter將利用自家社群平台上的數據來訓練模型,惟其發展AI的真正意圖尚未明朗,既有可能是改善Twitter搜尋功能,又有可能是幫助客戶生成廣告內容,以提振廣告業務。
馬斯克從2023年 2月以來一直找尋 AI人才,近日成功從DeepMind挖走科學家Igor Babuschkin與6名工程師,加入其AI開發團隊。圖中為DeepMind倫敦總部。(圖片來源:維基百科)
更叫人吃驚的是,作為OpenAI前創辦人之一的馬斯克有意另起爐灶,創立一家全新AI公司直接與OpenAI競爭;他已開始向特斯拉和SpaceX的投資者尋求更多資金,用作啟動新公司。
馬斯克新公司X.AI挑戰OpenAI
根據內華達州的企業記錄,一家名為X.AI 的新公司已於2023年3月9日註冊成立,馬斯克是公司唯一董事,負責營運馬斯克家族辦公室Excession的賈里德·伯查爾(Jared Birchall)則出任新公司秘書。馬斯克早前已將Twitter併入其私人公司X Corp.,現今再加上X.AI,似乎與傳聞中他欲創建萬能App(Everything App)「X」的願景一脈相承。
Twitter公司現已被合併到X Corp.,馬斯克直言他的最終目標是創建萬能App「X」,並重申 Twitter是實現此目標的催化劑。未知這個App日後跟X.AI公司與Twitter將會產生甚麼化學作用呢?(圖片來源:維基百科)
2023年4月17日,馬斯克接受《霍士新聞》(Fox News)專訪時首度承認,將會開發一個名為「TruthGPT」的AI聊天機械人。馬斯克形容,TruthGPT是致力於追求真相、試圖理解宇宙本質的AI。他認為,人類是宇宙中有趣的一部分,而一個了解宇宙的 AI 不太可能消滅人類,所以它會是一個安全的AI。
此外,馬斯克又狠批,OpenAI已從非牟利組織變成只顧圖利的企業,不再開放原始碼,並跟微軟(Microsoft)的商業關係過於緊密。事實上,馬斯克一直公開反對他有份創辦的OpenAI,早前更帶頭簽署公開信,呼籲全球AI實驗室暫停訓練比GPT-4更強大的模型起碼6個月,被視為針對OpenAI的舉措。如今馬斯克揚言要開發TruthGPT,更被外界認為這是向ChatGPT宣戰的新動作。
馬斯克一邊呼籲暫停生成式AI開發,一邊卻創辦 X.AI公司,進入生成式AI市場。究竟這是出於炒作,還是因為當初錯失OpenAI而現在心有不甘呢?(圖片來源:Twitter@elonmusk帳戶)
OpenAI擬落戶日本拓亞洲業務
面臨愈來愈多挑戰者湧現,OpenAI亦不敢怠慢,力求拓展業務版圖。該公司執行長山姆·奧特曼(Sam Altman)於2023年4月10日親赴日本,跟首相岸田文雄會面。他表示,看好ChatGPT在日本的發展前景,希望在當地開設辦公室,建立適合日本民眾、文化和語言的AI模型。
日本內閣官房長官松野博一表示,首相岸田文雄已就AI技術的優點,以及可能帶來的私隱、侵權等風險,與奧特曼交換意見;日本政府在衡量優點和風險後,將會評估引入OpenAI技術的可能性。
另一方面,奧特曼認為,未來推動AI科技進步需要有新的思路,不能只靠擴大AI模型和提供更多訓練數據的單一做法。OpenAI在GPT-4技術論文中指出,擴大模型規模的投資回報正在遞減,這是因為可以建設的數據中心數目、以及興建這些中心的速度,均存在物理限制。
未來AI模型規模重要性或下降
在麻省理工學院的一場活動上,奧特曼被問到GPT-4的訓練成本是否要1億美元,他的答案是「不止如此。」擴大模型規模,輸入更多訓練數據,採用更大運算力,可說是OpenAI過去幾年推動GPT模型演進的基本套路。不過,或許OpenAI也深感模型規模不能無止境擴大,不宜繼續將之視為改進AI的唯一重要因素,所以宣布推出GPT-4時,未有如往昔般披露AI模型規模有多大。
如不再依賴擴大模型規模來提高性能,那麼還有甚麼其他辦法可以增強AI能力呢?除研發新的AI模型設計或架構外,還可以使用「人類反饋強化學習」(Reinforcement Learning from Human Feedback)技術,透過人類的反饋來改進模型性能。
舉例來說,假設有一個機械人正在學習如何在一個迷宮中尋找出口。當機械人走錯路時,人類給予負面回饋;當機械人找到出口時,人類則給予正面反饋。通過這些反饋,機械人就可以學習如何更好地執行任務。
OpenAI技術上仍居領先位置
事實上,一家公司要在這場AI技術競賽中取得成功,有4項客觀條件非常重要:第一是運算能力,這需要巨額資金來採購大量GPU,以往只有大企業才能夠負擔,但隨著像Bedrock般的平台式雲端服務出現後,卻讓投資門檻大幅降低。第二是人才,就像馬斯克要啟動新AI項目,也要從DeepMind 挖角 AI 人才。
第三是訓練數據,這涉及如何在有效率、不侵權的情況下,取得訓練模型所需的大量數據;馬斯克揚言要控告微軟,理由是對方違法使用Twitter資料來訓練其AI模型。第四是用戶回饋,讓AI模型可基於這些反饋來不斷調整和改進,而ChatGPT現有逾1億用戶正在使用,在這點上已握有絕對領先優勢。
由是觀之,生成式AI市場將會邁向群雄並起的戰國時代,除微軟、Google、亞馬遜等既有科技巨頭外,後起之秀還有X.AI、Anthropic、AI21 Labs、Cohere和Character.AI等。然而,OpenAI現時手握GPT-4模型,預計2023年9月或10月更會釋出GPT-4.5,在技術上依然是一騎絕塵,其他對手唯有投入更多資源來建構更強大的演算法,以努力追上OpenAI的腳步。
延伸閱讀:
金融業對AI又愛又恨?彭博研發聊天機械人、高盛用AI輔助編程,但禁員工用ChatGPT?
AI搜尋未如理想!ChatGPT加Office軟件更有前途!微軟、Google搶捕辦公室應用AI化商機
AI文轉圖混戰!微軟、Adobe、Canva三雄並起,Midjourney生成效果逼真引發假圖泛濫
OpenAI惹上官非!Getty Images、程式開發者控告AI公司侵權,引發「合理使用」爭議
【香港好去處】etnet全新頻道盛大推出!全港最齊盛事活動資訊盡在掌握!► 即睇