国产91在线视频观看,欧美性猛交xxxx黑人猛交,色中色综合网,婷婷资源综合,国产色片在线观看,精品国产理论在线观看不卡,欧美亚洲国产人成aaa

您現(xiàn)在的位置:?臺(tái)海網(wǎng) >> 新聞中心 >> 天下 >> 國(guó)際聚焦  >> 正文

英國(guó)研究人員發(fā)現(xiàn):用AI訓(xùn)練AI,可能越練越“傻”

8037eee.com 來(lái)源: 新華網(wǎng) 用手持設(shè)備訪問(wèn)
二維碼

對(duì)于人工智能(AI)大語(yǔ)言模型來(lái)說(shuō),通常給予的訓(xùn)練數(shù)據(jù)越多,模型就會(huì)越“聰明”。但英國(guó)《自然》雜志新發(fā)表的一項(xiàng)關(guān)于大模型的研究顯示,如果只用AI生成的數(shù)據(jù)來(lái)訓(xùn)練大模型,會(huì)使模型性能下降、越練越“傻”。

  英國(guó)牛津大學(xué)、劍橋大學(xué)等機(jī)構(gòu)研究人員發(fā)現(xiàn),如果在訓(xùn)練大模型時(shí),只用AI生成的內(nèi)容,會(huì)導(dǎo)致大模型出現(xiàn)不可逆的缺陷,逐漸忘記真實(shí)數(shù)據(jù)的分布,這被稱(chēng)為“模型崩潰”。

  研究人員首先使用大語(yǔ)言模型創(chuàng)建類(lèi)似維基百科詞條的文本,然后利用這個(gè)內(nèi)容來(lái)訓(xùn)練該模型的新版本,并反復(fù)使用前代模型生成的文本訓(xùn)練更新的版本。隨著AI生成的信息“污染”訓(xùn)練集,模型的輸出逐漸失去意義。在模型的第九次迭代中,它完成了一篇關(guān)于英國(guó)教堂塔樓的文章,其中一段文字卻在講述野兔尾巴的多種顏色。

  研究發(fā)現(xiàn),導(dǎo)致“模型崩潰”的重要原因是,由于模型只能從其訓(xùn)練數(shù)據(jù)中采樣,一些在第一代數(shù)據(jù)中本就低頻出現(xiàn)的詞匯,在每次迭代后出現(xiàn)的頻率變得更低,而一些常見(jiàn)詞匯出現(xiàn)的頻率則逐漸增加。

  這種變化的結(jié)果就是,模型逐漸無(wú)法正確模擬真實(shí)世界的復(fù)雜性。隨著時(shí)間推移,這種錯(cuò)誤會(huì)在迭代中被層層累積、逐漸放大,最終導(dǎo)致“模型崩潰”。這有點(diǎn)像生物學(xué)中“近親繁殖”會(huì)導(dǎo)致后代缺陷,如果不能保證基因庫(kù)的多樣性,最終會(huì)導(dǎo)致一個(gè)物種的崩潰。

  研究人員還發(fā)現(xiàn),由于訓(xùn)練數(shù)據(jù)被“污染”而導(dǎo)致“模型崩潰”的情況不止發(fā)生在大語(yǔ)言模型中,高斯混合模型、圖片生成器等也可能出現(xiàn)類(lèi)似情況。

  不過(guò),應(yīng)對(duì)“模型崩潰”并非束手無(wú)策。研究人員發(fā)現(xiàn),如果能在模型微調(diào)過(guò)程中保留10%左右的真實(shí)數(shù)據(jù),崩潰就會(huì)發(fā)生得更緩慢。還可使用水印技術(shù),將AI生成的數(shù)據(jù)與真實(shí)數(shù)據(jù)區(qū)分開(kāi)來(lái),這需要大型科技公司的協(xié)作。此外,在AI生成的文本重新進(jìn)入數(shù)據(jù)池之前,可由人類(lèi)先篩選過(guò)濾。

(來(lái)源:新華網(wǎng))

相關(guān)新聞
龍巖AI盛宴:華為引爆人工智能革命,200位大咖現(xiàn)場(chǎng)揭秘產(chǎn)業(yè)升級(jí)秘籍!

7月22日,由龍巖市工業(yè)和信息化局、科學(xué)技術(shù)局、數(shù)據(jù)管理局指導(dǎo),華為技術(shù)有限公司主辦,龍巖市信息協(xié)會(huì)、龍巖市工業(yè)互聯(lián)網(wǎng)協(xié)會(huì)、龍巖市互聯(lián)網(wǎng)協(xié)會(huì)、龍巖市物聯(lián)網(wǎng)協(xié)會(huì)和龍巖市數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)工會(huì)協(xié)辦的人工智能技術(shù)創(chuàng)新交流活動(dòng)成功舉辦。本次活動(dòng)邀請(qǐng)了人工智能產(chǎn)業(yè)領(lǐng)域的專(zhuān)家學(xué)者、...

民企競(jìng)逐未來(lái)產(chǎn)業(yè)新賽道

人形機(jī)器人、量子計(jì)算機(jī)、腦機(jī)接口、超大規(guī)模新型智算中心……未來(lái)產(chǎn)業(yè)是帶動(dòng)產(chǎn)業(yè)升級(jí)、改變競(jìng)爭(zhēng)格局、催生增長(zhǎng)動(dòng)能的關(guān)鍵力量,吸引了一大批民營(yíng)企業(yè)布局。如何更好布局未來(lái)產(chǎn)業(yè)賽道,記者采訪了民營(yíng)企業(yè)和專(zhuān)家學(xué)者。   爭(zhēng)先,搶抓發(fā)展主動(dòng)權(quán)   “這根頭發(fā)絲粗細(xì)的微針上有64個(gè)通道,可以采集單個(gè)神經(jīng)元放電情況,把腦電信號(hào)轉(zhuǎn)化為數(shù)字信號(hào)并進(jìn)行解析,同時(shí)每個(gè)...

人工智能賦能新型工業(yè)化步伐提速

2024中國(guó)互聯(lián)網(wǎng)大會(huì)7月9日在京開(kāi)幕。記者從會(huì)上獲悉,當(dāng)前國(guó)產(chǎn)大模型產(chǎn)品不斷涌現(xiàn),相關(guān)部門(mén)將進(jìn)一步推動(dòng)人工智能賦能新型工業(yè)化,加快人工智能領(lǐng)域關(guān)鍵核心技術(shù)攻關(guān),加快培育行業(yè)大模型,面向工業(yè)領(lǐng)域大模型建設(shè)一批高質(zhì)量的工業(yè)數(shù)據(jù)庫(kù),同時(shí)圍繞重點(diǎn)領(lǐng)域推動(dòng)打造人工智能賦能新型工業(yè)化的應(yīng)用試驗(yàn)場(chǎng)。   當(dāng)前,我國(guó)人工智能發(fā)展取得積極進(jìn)展。來(lái)自工信部的信息顯...

泾阳县| 乌恰县| 新平| 彰化市| 莱州市| 苏州市| 合阳县| 绥化市| 洛隆县| 南召县| 宽甸| 乐陵市| 页游| 长治县| 福安市| 特克斯县| 治县。| 佛坪县| 清水河县| 湾仔区| 怀远县| 邮箱| 吴桥县| 枣强县| 黄大仙区| 博野县| 普格县| 横峰县| 常熟市| 宜阳县| 如东县| 广丰县| 读书| 会昌县| 白玉县| 无为县| 合水县| 班戈县| 霍州市| 双柏县| 佛坪县|