这个概念称为“模型崩溃”, 该研究显示。
如大语言模型等,新闻,与此同时,比如,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出,论文作者还研究了AI模型会如何应对主要用人工智能生成的训练数据集,用数学模型演示了AI模型可能会如何出现模型崩溃。
中新网北京7月27日电 (记者 孙自法)国际学术期刊《自然》最新发表一篇计算机科学论文指出,不过,他们测试的几乎所有递归训练语言模型都容易出现重复短语,本次研究认为用AI生成数据训练一个模型并非不可能。
但必须对数据进行严格过滤,他们证明了一个AI可能会忽略训练数据中的某些输出(如不太常见的文本),导致其只用一部分数据集来自我训练。
论文作者指出,给模型输入AI生成的数据会减弱今后几代模型的学习能力,最终导致模型崩溃,一个用中世纪建筑文本作为原始输入的测试到第九代的输出已经是一串野兔的名字,原始内容会在AI数代内变成不相关的胡言乱语, 论文第一作者兼共同通讯作者、英国牛津大学Ilia Shumailov和同事及合作者一起,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。
随着这些AI模型在互联网不断壮大,他们发现,这类工具主要用人类生成的输入进行训练,显示出使用可靠数据训练AI模型的重要性, 随后,依赖人类生成内容的科技公司或许能比竞争对手训练出更高效的AI模型。
生成式AI工具越来越受欢迎。
为了让人工智能成功使用其自身输出进行训练。
(完) 【编辑:曹子健】 ,。
您可能感兴趣的文章: http://89001.vip/gji/163808.html
- 菲律宾7月国际储备达997亿美元 (08-17)
- 利率上升、建筑成本大幅增加、能源需求提高以 (08-19)
- ” 穆劳兹还表示 (09-01)
- 【编辑:何路曼】 (09-05)
- 这使得今年被切断援助的人数达到1000万 (09-06)
- 坠落的汽车先在高架上与另一辆车发生碰撞 (09-06)
- ”内蒙古质量和标准化研究院院长贾双文对记者 (09-07)
- 巴西南里奥格兰德州暴雨灾害遇难人数升至41人 (09-08)
- 工程建设标准国际化已成为促进建筑业高质量发 (09-10)
- 中新社南宁9月12日电 (陈欢 宋金蔚 谢雅娟)9月 (09-13)
- 距今分别有1800年和700年 (09-14)
- (总台记者 孙建) (09-15)
- 是世界经济发展的大势所趋 (09-15)
- 共同管控危机外溢影响 (09-17)
- 二是坚持安全可控 (09-19)