免费看成人哺乳视频网站,日韩美女一区二区三区在线观看,国产视频一区二区不卡

面向智能體應(yīng)用，智譜發(fā)布新一代基礎(chǔ)模型GLM-4.5

記者：孫奇茹

2025-07-29 10:36

7月28日晚，清華系大模型明星企業(yè)智譜發(fā)布新一代旗艦?zāi)Ｐ虶LM-4.5，據(jù)悉，這一基礎(chǔ)模型專(zhuān)為智能體應(yīng)用打造，已在Hugging Face與ModelScope平臺(tái)同步開(kāi)源。

技術(shù)人員介紹，GLM-4.5 參數(shù)量為 DeepSeek-R1的二分之一、Kimi-K2 的三分之一，但在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更好，得益于模型更高的參數(shù)效率。在性能優(yōu)化之外，GLM-4.5系列也在成本和效率上實(shí)現(xiàn)突破：API 調(diào)用價(jià)格低至輸入價(jià)格為0.8元/百萬(wàn)tokens，輸出價(jià)格2元/百萬(wàn)tokens，大幅低于目前主流的模型定價(jià)。

“衡量AGI（通用人工智能）的第一性原理，是在不損失原有能力的前提下融合更多通用智能能力，GLM-4.5 是我們對(duì)此理念的首次完整呈現(xiàn)，并有幸取得技術(shù)突破。”智譜相關(guān)負(fù)責(zé)人介紹，GLM-4.5 首次在單個(gè)模型中實(shí)現(xiàn)將推理、編碼和智能體能力原生融合，以滿(mǎn)足智能體應(yīng)用的復(fù)雜需求。

為綜合衡量模型的通用能力，技術(shù)團(tuán)隊(duì)選擇了最具有代表性的12個(gè)評(píng)測(cè)基準(zhǔn)，綜合平均分，GLM-4.5 取得了全球模型第三、國(guó)產(chǎn)模型第一，開(kāi)源模型第一。

真實(shí)場(chǎng)景表現(xiàn)比榜單更為重要。實(shí)測(cè)結(jié)果顯示，GLM-4.5 相對(duì)其他開(kāi)源模型展現(xiàn)出競(jìng)爭(zhēng)優(yōu)勢(shì)，特別在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出。

“編程和智能體能力以后就是大模型標(biāo)配了。”一位業(yè)內(nèi)人士表示。近來(lái)，編程能力正成為大模型的重要能力。然而過(guò)去，大模型編程也面臨著長(zhǎng)程邏輯鏈斷裂、動(dòng)態(tài)調(diào)試能力弱、交互與協(xié)作瓶頸等問(wèn)題。智譜團(tuán)隊(duì)介紹，GLM-4.5擅長(zhǎng)處理復(fù)雜代碼，能夠編寫(xiě)復(fù)雜的應(yīng)用、游戲、交互網(wǎng)頁(yè)。根據(jù)演示，基于GLM-4.5 ，使用者只需給出“做一個(gè) google搜索網(wǎng)站”“開(kāi)發(fā)一個(gè)B站風(fēng)格的網(wǎng)頁(yè)端Demo”這樣的提示詞，就能快速生成一個(gè)真正能搜索的網(wǎng)站或一個(gè)能發(fā)彈幕的類(lèi)B站網(wǎng)頁(yè)。“這主要得益于模型原生具備的在前端編寫(xiě)網(wǎng)站、在后端進(jìn)行數(shù)據(jù)庫(kù)管理，以及通過(guò)工具調(diào)用接口支持任意智能體應(yīng)用的能力。”技術(shù)人員說(shuō)。

據(jù)悉，GLM-4.5兼容Claude Code、Cline、Roo Code等主流代碼智能體，海內(nèi)外用戶(hù)可以在智譜開(kāi)放平臺(tái)體驗(yàn)。

來(lái)源：北京日?qǐng)?bào)客戶(hù)端

記者：孫奇茹

如遇作品內(nèi)容、版權(quán)等問(wèn)題，請(qǐng)?jiān)谙嚓P(guān)文章刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系。版權(quán)侵權(quán)聯(lián)系電話(huà)：010-85202353