(美通社頭條)《國際AI安全報(bào)告》(International AI Safety Report)第二版關(guān)鍵更新現(xiàn)已發(fā)布,及時(shí)更新了通用AI的風(fēng)險(xiǎn)管理與技術(shù)緩和措施。該報(bào)告由圖靈獎(jiǎng)得主、計(jì)算機(jī)科學(xué)家Yoshua Bengio主持,匯集了百余位國際專家的參與,并獲得包括歐盟、經(jīng)合組織和聯(lián)合國在內(nèi)的30多個(gè)國家和國際組織的支持。

第二版關(guān)鍵更新涵蓋了提升可靠性與防范濫用的技術(shù)方法概述,以及風(fēng)險(xiǎn)管理領(lǐng)域新興的制度化方法。其核心重點(diǎn)包括:在訓(xùn)練模型抵御惡意攻擊方面雖有所進(jìn)展,但仍存在不足。技術(shù)嫻熟的黑客仍能在約50%的案例中僅用10次嘗試即可突破防護(hù)。開源鴻溝正在縮小,開放權(quán)重模型如今與行業(yè)領(lǐng)先產(chǎn)品的差距已不足一年。行業(yè)在安全方面的承諾有所增加,但其成效仍不明確。