深度求索于8月21日正式發(fā)布新一代大模型 DeepSeek-V3.1,該版本在架構(gòu)設(shè)計、推理效率、智能體能力等方面進行了多項重要升級,并同步開放了模型權(quán)重及API服務(wù)。這一發(fā)布再度引發(fā)行業(yè)對AI智能體發(fā)展階段的關(guān)注:DeepSeek-V3.1 所標(biāo)榜的“Agent能力增強”,究竟是技術(shù)突破,還是市場宣傳的又一概念包裝?
從技術(shù)架構(gòu)來看,DeepSeek-V3.1 提出“混合推理”機制,允許用戶在思考模式(think mode)與非思考模式間自由切換。在思考模式下,模型通過對思維鏈進行壓縮訓(xùn)練,顯著減少推理所需的token數(shù)量,官方稱在多項任務(wù)中token消耗降低20%至50%,而性能仍與前一版本R1-0528持平。這一改進不僅提升了響應(yīng)速度,也降低了推理成本,體現(xiàn)出工程優(yōu)化方面的實質(zhì)性進展。
在智能體任務(wù)支持方面,新模型強調(diào)了對工具調(diào)用與多步任務(wù)處理能力的增強。根據(jù)官方測評,V3.1在編程類任務(wù)(如SWE-bench、Terminal-Bench)和復(fù)雜搜索任務(wù)(如browsecomp、HLE)中表現(xiàn)顯著優(yōu)于前代模型。這類任務(wù)通常要求模型理解上下文、調(diào)用外部工具(如終端、搜索引擎)、并進行多輪規(guī)劃與驗證。從結(jié)果上看,V3.1確實在部分場景中縮短了任務(wù)完成所需輪數(shù),顯示出一定的流程控制與自我糾錯能力。
此外,該模型擴展上下文至128K,并增強了對Function Calling的strict模式支持,提升了API調(diào)用的規(guī)范性和穩(wěn)定性。同時,平臺也新增了對Anthropic API格式的兼容,降低了已有Claude Code框架用戶的遷移成本。這些改動雖屬漸進式優(yōu)化,但對開發(fā)者生態(tài)具有實際意義。
然而,是否因此就能斷言“AI Agent時代”已經(jīng)到來,仍需冷靜看待。當(dāng)前所謂“智能體”仍大多屬于定向任務(wù)自動化的范疇,其泛化能力、對真實環(huán)境的適應(yīng)力、以及長期規(guī)劃能力,與人類對“Agent”的預(yù)期仍有差距。盡管V3.1在特定測試集上表現(xiàn)提升,但尚未見到其在開放環(huán)境、多模態(tài)交互或高風(fēng)險決策等復(fù)雜場景中的驗證報告。
另一方面,模型的開源策略也值得關(guān)注。DeepSeek此次同時釋出了Base模型與經(jīng)過后訓(xùn)練(Post-Training)的模型權(quán)重,涵蓋Hugging Face與魔搭平臺,并采用FP8量化策略以降低部署門檻。這一做法有利于技術(shù)透明與社區(qū)共建,但也對使用者提出了更高的適配要求,因其分詞器與模板機制相較V3版本存在較大變更。
伴隨模型更新,深度求索也宣布自2025年9月6日起調(diào)整API定價結(jié)構(gòu)并取消夜間優(yōu)惠,這一商業(yè)決策可能對中小開發(fā)團隊及研究機構(gòu)的使用成本產(chǎn)生影響。在技術(shù)推進的同時,企業(yè)也需在普惠性與可持續(xù)經(jīng)營之間找到平衡。
總體而言,DeepSeek-V3.1 在推理效率、任務(wù)完成能力和工程可用性方面均實現(xiàn)了可衡量的進步,其“混合架構(gòu)”與“增強版Agent”并非空談。然而,是否稱得上“Agent時代的突破”,則取決于我們?nèi)绾味x“Agent”。若以工具調(diào)用與有限自動化為標(biāo)準(zhǔn),V3.1無疑向前邁進了一步;若以通用智能體為終局,則當(dāng)前成果仍處于量變積累階段。只有持續(xù)在真實場景中驗證其可靠性,技術(shù)演進才不至淪為營銷話語中的“噱頭”。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )