5月17日消息,據(jù)報道,谷歌上周發(fā)布的最新大語言模型使用的訓(xùn)練數(shù)據(jù),幾乎是 2022 年的上一代模型的 5 倍。得益于此,該模型在編程、數(shù)學(xué)和創(chuàng)意寫作方面的表現(xiàn)更為優(yōu)秀。
據(jù)新浪科技援引外媒報道,谷歌是在其 I / O 開發(fā)者大會上發(fā)布最新通用大語言模型 PaLM2 的。內(nèi)部文件顯示,該模型采用了 3.6 萬億個令牌(token)進行訓(xùn)練。令牌指的是單詞串,這是訓(xùn)練大語言模型的重要基礎(chǔ),因為這可以教給模型如何預(yù)測字符串中可能出現(xiàn)的下一個單詞。
之前版本的 PaLM 發(fā)布于 2022 年,當(dāng)時使用的令牌為 7800 億個。
雖然谷歌很希望展示其人工智能技術(shù)的實力,以及嵌入搜索、電子郵件、字處理和電子表格后的效果,但該公司卻不愿發(fā)布其訓(xùn)練數(shù)據(jù)的規(guī)模和其他細(xì)節(jié)。微軟支持的 OpenAI 也對其最新的 GPT-4 大語言模型的細(xì)節(jié)信息保密。
這些公司表示,之所以不披露這些信息,是出于商業(yè)競爭考慮。谷歌和 OpenAI 都在努力吸引想要用聊天機器人代替?zhèn)鹘y(tǒng)搜索引擎,從而直接獲取答案的用戶。
但隨著人工智能軍備競賽日趨白熱化,相關(guān)研究人員也呼吁企業(yè)加大透明度。
自從發(fā)布 PaLM2 之后,谷歌一直表示新的模型比之前的大語言模型更小,這就意味著該公司的技術(shù)效率得以提升,但卻可以完成更加復(fù)雜的任務(wù)。內(nèi)部文件顯示,PaLM2 基于 3400 億個參數(shù)訓(xùn)練 —— 這項指標(biāo)可以說明該模型的復(fù)雜程度。最初的 PaLM 則基于 5400 億個參數(shù)訓(xùn)練。
目前,谷歌尚未對此置評。
谷歌在一篇關(guān)于 PaLM2 的博文中表示,該模型使用了一種名為“計算機優(yōu)化擴張”的新技術(shù)。這就讓大語言“更高效、整體性能更好,包括加快推理速度、減少參數(shù)調(diào)用和降低服務(wù)成本。”
在宣布 PaLM2 時,谷歌證實了此前的媒體報道,計該模型針對 100 種語言進行訓(xùn)練,可以執(zhí)行更廣泛的任務(wù)。它已經(jīng)被用于 25 項功能和產(chǎn)品,包括該公司的實驗性聊天機器人 Bard。按照從小到大的規(guī)模劃分,該模型共有 4 種,分別是壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨角獸(Unicorn)。
根據(jù)公開披露的信息,PaLM2 比現(xiàn)有的任何模型都更加強大。Facebook 在 2 月份宣布的的 LLaMA 大語言模型采用 1.4 萬億個令牌。OpenAI 上一次披露 GPT-3 的訓(xùn)練規(guī)模時表示,它當(dāng)時基于 3000 億個令牌。OpenAI 今年 3 月發(fā)布 GPT-4 時表示,它在許多專業(yè)測試中展示出“與人類媲美的表現(xiàn)”。
LaMDA 是谷歌兩年前推出的一個對話型大語言模型,在 2 月還與 Bard 一同對外宣傳。該模型基于 1.5 萬億個令牌訓(xùn)練。
隨著新的人工智能應(yīng)用快速進入主流,圍繞底層技術(shù)的爭議也越來越激烈。
谷歌高級研究科學(xué)家艾爾?邁赫迪?艾爾?麥哈麥迪(El Mahdi El Mhamdi)于、 2 月辭職,主要原因就是人工智能技術(shù)缺乏透明度。16日,OpenAI CEO 山姆?阿爾特曼(Sam Altman)出席美國國會針對隱私和技術(shù)舉行的聽證會,他也認(rèn)為需要設(shè)立一套新的制度來應(yīng)對人工智能的潛在問題。
“對于一種全新的技術(shù),我們需要一套全新的框架。”阿爾特曼說,“當(dāng)然,像我們這樣的公司應(yīng)當(dāng)為我們推出的工具承擔(dān)許多責(zé)任?!?/p>
- 美科技七巨頭遭特朗普關(guān)稅血洗 市值蒸發(fā)14萬億
- 特斯拉市值一夜蒸發(fā)超6400億元,美股科技“七巨頭”陷入調(diào)整區(qū)間
- 阿里巴巴于上海新設(shè)智信普惠科技公司,布局多領(lǐng)域技術(shù)服務(wù)
- 馬化騰短暫登頂中國富豪榜,騰訊科技與股價雙輪驅(qū)動成關(guān)鍵
- 本地生活賽道:2025年紅海變“血?!保脚_競逐白熱化
- 義烏哪吒小商品熱賣:緊跟《哪吒2》熱潮,一天賣幾百套
- 美恢復(fù)接收中國包裹,貿(mào)易政策突變引發(fā)物流界震蕩
- DeepSeek或再掀波瀾,可能對美股市場造成新一輪打擊
- 谷歌股價暴跌:收入增長放緩,人工智能支出引投資者擔(dān)憂
- 華為去年銷售收入超8600億元:ICT基礎(chǔ)設(shè)施穩(wěn)健,新業(yè)務(wù)快速發(fā)展
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。