日期:
来源:经济学人集团收集编辑:经济学人·商论
* 后台回复“商论入群”即刻体验主编领读(订户专属全年服务)!
”
随着生成式AI的兴起,“数据中毒”的风险也在逐渐增加。由于类似ChatGPT和DALL-E 2的算法训练需要在开放式互联网上直接抓取数据,从理论上讲,任何能上网的人都可以在数据中注入“数字毒药”以攻击这些AI工具。有一些数据可能只是降低AI的工具性能,但有一些可能会有更特定的反应,例如在某个特定主题下提供虚假信息。虽然目前还没有数据中毒的重大案例出现,但随着直接联网的AI聊天机器人变得越来越普遍,未来对于数据的处理将会更严谨。在将数据集输入算法之前,生成式AI领域的巨头们会将从网络上抓取的数据集进行过滤。不过,更棘手的问题或许是该由谁来定义什么才算是数字毒药。订阅《经济学人·商论》APP,阅读本篇文章,了解更深入的“数据中毒”相关知识吧!
Digital poisons
让机器学习算法走偏不是很难
您已试读节选,订阅《经济学人·商论》解锁全文
《经济学人·商论》持续关注全球大趋势,欢迎订阅浏览。订阅商论,即可免费加入【主编领读社群】获取完整解读