7月28日晚,清華系大模型明星企業(yè)智譜發(fā)布新一代旗艦?zāi)P虶LM-4.5,據(jù)悉,這一基礎(chǔ)模型專(zhuān)為智能體應(yīng)用打造,已在Hugging Face與ModelScope平臺(tái)同步開(kāi)源。

技術(shù)人員介紹,GLM-4.5 參數(shù)量為 DeepSeek-R1的二分之一、Kimi-K2 的三分之一,但在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更好,得益于模型更高的參數(shù)效率。在性能優(yōu)化之外,GLM-4.5系列也在成本和效率上實(shí)現(xiàn)突破:API 調(diào)用價(jià)格低至輸入價(jià)格為0.8元/百萬(wàn)tokens,輸出價(jià)格2元/百萬(wàn)tokens,大幅低于目前主流的模型定價(jià)。

 “衡量AGI(通用人工智能)的第一性原理,是在不損失原有能力的前提下融合更多通用智能能力,GLM-4.5 是我們對(duì)此理念的首次完整呈現(xiàn),并有幸取得技術(shù)突破。”智譜相關(guān)負(fù)責(zé)人介紹,GLM-4.5 首次在單個(gè)模型中實(shí)現(xiàn)將推理、編碼和智能體能力原生融合,以滿(mǎn)足智能體應(yīng)用的復(fù)雜需求。

為綜合衡量模型的通用能力,技術(shù)團(tuán)隊(duì)選擇了最具有代表性的12個(gè)評(píng)測(cè)基準(zhǔn),綜合平均分,GLM-4.5 取得了全球模型第三、國(guó)產(chǎn)模型第一,開(kāi)源模型第一。

真實(shí)場(chǎng)景表現(xiàn)比榜單更為重要。實(shí)測(cè)結(jié)果顯示,GLM-4.5 相對(duì)其他開(kāi)源模型展現(xiàn)出競(jìng)爭(zhēng)優(yōu)勢(shì),特別在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出。

“編程和智能體能力以后就是大模型標(biāo)配了。”一位業(yè)內(nèi)人士表示。近來(lái),編程能力正成為大模型的重要能力。然而過(guò)去,大模型編程也面臨著長(zhǎng)程邏輯鏈斷裂、動(dòng)態(tài)調(diào)試能力弱、交互與協(xié)作瓶頸等問(wèn)題。智譜團(tuán)隊(duì)介紹,GLM-4.5擅長(zhǎng)處理復(fù)雜代碼,能夠編寫(xiě)復(fù)雜的應(yīng)用、游戲、交互網(wǎng)頁(yè)。根據(jù)演示,基于GLM-4.5 ,使用者只需給出“做一個(gè) google搜索網(wǎng)站”“開(kāi)發(fā)一個(gè)B站風(fēng)格的網(wǎng)頁(yè)端Demo”這樣的提示詞,就能快速生成一個(gè)真正能搜索的網(wǎng)站或一個(gè)能發(fā)彈幕的類(lèi)B站網(wǎng)頁(yè)。“這主要得益于模型原生具備的在前端編寫(xiě)網(wǎng)站、在后端進(jìn)行數(shù)據(jù)庫(kù)管理,以及通過(guò)工具調(diào)用接口支持任意智能體應(yīng)用的能力。”技術(shù)人員說(shuō)。

據(jù)悉,GLM-4.5兼容Claude Code、Cline、Roo Code等主流代碼智能體,海內(nèi)外用戶(hù)可以在智譜開(kāi)放平臺(tái)體驗(yàn)。

來(lái)源:北京日?qǐng)?bào)客戶(hù)端

記者:孫奇茹

如遇作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)文章刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系。版權(quán)侵權(quán)聯(lián)系電話(huà):010-85202353