保险理财

用AI数据训练AI效果怎样?国际最新研究称可能最终导致崩溃

2024年08月06日 | 查看: 68787

用AI数据训练AI效果怎样?国际最新研究称可能最终导致崩溃

2024-07-27 13:48:02 中国新闻网

  用AI数据训练AI效果怎样?国际最新研究称可能最终导致崩溃  

  中新网北京7月27日电 (记者 孙自法)国际学术期刊《自然》最新发表一篇计算机科学论文指出,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出,这个概念称为“模型崩溃”。

  该研究显示,原始内容会在AI数代内变成不相关的胡言乱语,显示出使用可靠数据训练AI模型的重要性。

用AI数据训练AI效果怎样?国际最新研究称可能最终导致崩溃
图片来源于网络,如有侵权,请联系删除

  生成式AI工具越来越受欢迎,如大语言模型等,这类工具主要用人类生成的输入进行训练。不过,随着这些AI模型在互联网不断壮大,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。

  论文第一作者兼共同通讯作者、英国牛津大学Ilia Shumailov和同事及合作者一起,用数学模型演示了AI模型可能会如何出现模型崩溃。他们证明了一个AI可能会忽略训练数据中的某些输出(如不太常见的文本),导致其只用一部分数据集来自我训练。

用AI数据训练AI效果怎样?国际最新研究称可能最终导致崩溃
图片来源于网络,如有侵权,请联系删除

  随后,论文作者还研究了AI模型会如何应对主要用人工智能生成的训练数据集。他们发现,给模型输入AI生成的数据会减弱今后几代模型的学习能力,最终导致模型崩溃。他们测试的几乎所有递归训练语言模型都容易出现重复短语。比如,一个用中世纪建筑文本作为原始输入的测试到第九代的输出已经是一串野兔的名字。

  论文作者指出,为了让人工智能成功使用其自身输出进行训练,本次研究认为用AI生成数据训练一个模型并非不可能,但必须对数据进行严格过滤。与此同时,依赖人类生成内容的科技公司或许能比竞争对手训练出更高效的AI模型。(完)

来源:中国新闻网

编辑:万可义

广告等商务合作,请点击这里

本文为转载内容,授权事宜请联系原著作权人

中新经纬版权所有,未经书面授权,任何单位及个人不得转载、摘编或以其它方式使用。
关注中新经纬微信公众号(微信搜索“中新经纬”或“jwview”),看更多精彩财经资讯。

推荐阅读:

对话二代测序技术开发者Shankar Balasubramanian:创新只在盲从之外

威马否认创始人沈晖出逃海外 目前正寻新金主接盘

国家统计局:9月份一线城市商品住宅销售价格环比稳中微涨

六星连珠,七万吨产能!天富生态酿酒区投产,对郎酒意味着什么?

AI三巨头站台联想,黄仁勋、苏姿丰、纳德拉都来了

看财报|以岭药业前三季度营收增长7.91%,净利润增长24.35%

国际金融论坛(IFF):中国经济2023年和2024年预计将分别增长5.2%和5%

顺丰控股前三季度营收1890.12亿元 净利润同比增40.08%达62.64亿元

供应链金融科技如何驶向产业纵深?

欧洲市场需求低迷 大众宣布推迟建设第四家电池工厂

关键词: