更新時(shí)間:2024-08-10 16:25
文章概要:
1. 據(jù)新酌量,ChatGPT試圖隱瞞訓(xùn)練過(guò)程中使用了受版權(quán)保護(hù)材料。
2. 其顯露為,當(dāng)用戶試圖提取下一個(gè)句子時(shí),ChatGPT會(huì)擾亂輸出。
3. 探究人員認(rèn)為ChatGPT測(cè)試提示意圖并采取措施,但仍使用受版權(quán)保護(hù)材料。
廣東益福電纜線回收公司8月24日 采訪:據(jù)BusinessInsider音訊,最近,ByteDance的AI科學(xué)家團(tuán)隊(duì)在論文中發(fā)表了一項(xiàng)新琢磨,內(nèi)容是ChatGPT試圖隱瞞自己是經(jīng)過(guò)海量受版權(quán)保護(hù)的材料進(jìn)行訓(xùn)練的。
切磋人員展示,當(dāng)用戶測(cè)試經(jīng)過(guò)提示提取下一句時(shí),ChatGPT會(huì)故意擾亂輸出,而此前版本不存在這樣的行為。
探索人員推斷,ChatGPT的開(kāi)發(fā)者實(shí)行了一種機(jī)制,可以測(cè)評(píng)提示是否意圖提取版權(quán)內(nèi)容。然則雖然采取了這些措施,商討照舊展現(xiàn)ChatGPT會(huì)用受版權(quán)保護(hù)的材料回復(fù)某些提示。
事實(shí)上,不僅ChatGPT,其他大語(yǔ)言模型如Meta的OPT-1.3B和谷歌的FLAN-T5也被表現(xiàn)會(huì)用受版權(quán)保護(hù)的文本回答提示。
琢磨人員分析,這是出于這些大語(yǔ)言模型都是通過(guò)訓(xùn)練大量文本數(shù)據(jù)獲得能力的,包含書(shū)籍、文章和網(wǎng)站中的文字。這些訓(xùn)練數(shù)據(jù)平素囊括受版權(quán)保護(hù)的內(nèi)容,大語(yǔ)言模型抑或會(huì)無(wú)意中復(fù)制這些內(nèi)容。
(投訴)