(資料圖片)
OpenAI推出了一種名為GPTBot的網(wǎng)絡(luò)爬蟲機(jī)器人,用于收集信息數(shù)據(jù)以改進(jìn)未來的AI模型。
據(jù)了解,GPTBot將嚴(yán)格遵守任何付費(fèi)墻的規(guī)則,不會抓取需要付費(fèi)的信息,并且也不會收集能追蹤到個人身份的數(shù)據(jù)。
不僅如此,OpenAI也把是否要把自己的網(wǎng)站數(shù)據(jù)供GPTBot抓取的選擇交到給網(wǎng)站所有者,他們可自行修改其robots.txt文件?;蛘咄ㄟ^屏蔽其IP地址,來阻止GPTBot從其網(wǎng)站上抓取數(shù)據(jù)。
這當(dāng)然仍不足夠,修改robots.txt是一種方式,但它可以更便利和更具透明度,也可進(jìn)一步告知數(shù)據(jù)將被用于什么用途等等。
此前,OpenAI抓取公開數(shù)據(jù)來訓(xùn)練專利AI模型的行為備受爭議。Reddit和Twitter等網(wǎng)站,已經(jīng)采取措施打擊AI公司免費(fèi)使用其用戶帖子的行為,而一些作者和其他創(chuàng)作者也因?yàn)樯嫦游唇?jīng)授權(quán)使用其作品而提起訴訟。
責(zé)任編輯:李楠
分享到:版權(quán)聲明:凡注明來源“流媒體網(wǎng)”的文章,版權(quán)均屬流媒體網(wǎng)所有,轉(zhuǎn)載需注明出處。非本站出處的文章為轉(zhuǎn)載,觀點(diǎn)供業(yè)內(nèi)參考,不代表本站觀點(diǎn)。文中圖片均來源于網(wǎng)絡(luò)收集整理,僅供學(xué)習(xí)交流,版權(quán)歸原作者所有。如涉及侵權(quán),請及時(shí)聯(lián)系我們刪除!關(guān)鍵詞: