服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

ChatGPT作弊成风引担忧,OpenAI:正在自研审核工具

日期: 来源:数据派THU收集编辑:数据派THU
来源:机器之心
本文约2200,建议阅读5分钟

本文介绍了OpenAl正在自研审核工具的情况。


「对学生有负面影响」,这么大责任 OpenAI 可担不起。


语言生成模型来了,学校的作业会不会从此变得形同虚设?近日,纽约市教育官员宣布禁止学生在公立学校使用 ChatGPT 的事件引发了争论。

语言模型自动生成的内容会「参照」现有作品,产出的速度又几乎无限,人们对其的担忧已经蔓延到了 AI 学界自身,全球知名机器学习会议之一的 ICML 最近也宣布禁止发表包含由 ChatGPT 和其他类似系统生成内容的论文,以免出现「意外后果」。

对于这样的情况,ChatGPT 的提出者 OpenAI 已宣布正在努力开发「缓解措施」,帮助人们检测由 AI 自动生成的文本。


「我们将 ChatGPT 作为新研究的预览技术,希望能从现实世界的应用中进行学习。我们认为这是开发和部署功能强大、安全的 AI 系统的关键部分。我们会不断吸取反馈和经验教训,」公司发言人表示。「OpenAI 一直呼吁在使用 AI 生成的文本时要保持透明。我们的使用条款要求用户在使用我们的 API 和创意工具时,首先对其面向的人群负责……我们期待与教育工作者合作制定有效的解决方案,帮助教师和学生等人群寻找从 AI 中受益的方法。」

如果出现了能够区分人类和机器产生内容的算法,生成模型在学术界的使用方式或许会出现改变。学校将能够更有效地限制人工智能生成的论文,而如果人们的态度发生转变,转而期待这些工具能够帮助学生,或许我们也可以逐渐接受使用 AI 进行辅助的方式,提高工作学习的效率。

现在看起来,眼前还有很长的一段路要走。尽管 AI 生成的文字内容在学术会议和学校禁止机器写论文作弊的新闻中看起来令人印象深刻,但你需要知道,与真正的人类写作相比,它们时常缺乏真正的理解与逻辑。

当像 GPT-3 或 ChatGPT 这样的工具通过给出令人震惊的详细答案而让人感到惊讶时,也有冷静的专家表示这证明了模型能够编码知识,但当它们无法正确处理事情时,给出的答案往往很离谱。波莫纳学院 (Pomona College) 经济学教授 Gary Smith 提醒我们,不要上当。

在一篇专栏文章中,Gary Smith 展示了几个 GPT-3 无法有效推理和回答问题的例子,「如果你尝试使用 GPT-3,你最初的反应可能是惊讶——似乎是在与一个非常聪明的人进行真正的对话。然而深入探究后,你很快就会发现虽然 GPT-3 可以用令人信服的方式将单词串在一起,但它并不知道单词的含义。」

「预测 down 这个词有可能跟在 fell 这个词后面,并不要求对这两个词的含义有任何理解。只是通过统计层面的计算,AI 就能认为这些词经常在一起。因此,GPT-3 很容易做出完全错误,但又武断的声明。」

OpenAI 在 2022 年 11 月发布了 ChatGPT,这是一个较新的模型,基于 GPT-3 进行了改进。尽管如此,它仍然存在着这些相同的问题,就像所有现有的语言模型一样。

如何用 AI 检测 AI 生成的文字?

曾几何时,AI 生成的文字内容还是「一眼假」,但自从 ChatGPT 横空出世以来,这种分辨工作是越来越难做了。

在教育领域,ChatGPT 的争论主要围绕作弊的可能性展开。在谷歌上搜索「ChatGPT 写论文」,你能发现大量教育工作者、记者和学生通过使用 ChatGPT 完成家庭作业和标准化论文测试来试水的例子。

《华尔街日报》的专栏作家曾使用 ChatGPT 撰写了一篇能拿及格分的 AP 英语论文,而《福布斯》记者则利用它在 20 分钟内完成了两篇大学论文。亚利桑那州立大学教授 Dan Gillmor 在接受卫报采访时回忆说,他尝试给 ChatGPT 布置一道给学生的作业,结果发现 AI 生成的论文也可以获得好成绩。

目前,已经有开发者制作了面向 ChatGPT 生成内容的检测工具——「GPTZero」,只需要将内容粘贴在输入框,就能在几秒钟之内得到分析结果,快速检测出一篇文章是 ChatGPT 还是人工撰写的。


网友评:世界各地的学生看到后都哭了。


作者是普林斯顿大学的学生 Edward Tian,他利用假期的一部分时间编写了 GPTZero。


让我们看看检测过程,先以一段《New Yorker》的报道内容为例(百分之百确定由人类写作):


再看一段由 ChatGPT 生成的内容接受检测:


GPTZero 应用程序的原理是借助一些文本属性进行分析。首先是困惑度(perplexity),即文本对模型的随机性,或语言模型对文本的「喜爱」程度;然后是突发度(burstiness),即机器写作的文本在一段时间内表现出的困惑度更均匀和恒定,而人类书写的文本则不会这样。

GPTZero:「同学们,对不起!教授们,不客气!」


据《卫报》报道,OpenAI 目前正在开发一项功能,用于统计 ChatGPT 输出结果的「水印」,以便阅读器可以在 AI 文本选择中发现隐藏模式。

在得克萨斯大学的一次演讲中,OpenAI 客座研究员 Scott Aaronson 表示,公司正在研究一种通过「对输出进行统计水印」来打击作弊的系统。Aaronson 说,这项技术将通过微妙地调整 ChatGPT 选择的特定单词选择来发挥作用,读者不会注意到这种方式,但对于任何寻找机器生成文本迹象的人来说,这在统计上都是可预测的。

「我们实际上有一个水印方案的工作原型了,」Aaronson 补充道。「它似乎表现很好——根据经验,几百个词似乎足以得到一个信号:是的,这段文本来自 GPT。」

虽然面临人们的担忧,但有关 ChatGPT 的应用也在快速铺开。在很多场景中,人们不想与无法理解简单查询的聊天机器人对话,什么都可以说上两句的 ChatGPT 可以解决这一问题。总部位于多伦多的 Ada 已与 OpenAI 合作把 GPT-3.5,ChatGPT 背后的大模型应用在了客服聊天机器人上,完成了 45 亿次客户服务交互。

据 The Information 报道,微软还与 OpenAI 签订了独家许可协议,并计划将该技术整合到 Bing 搜索引擎中。

ChatGPT 正在模拟真人的道路上加速前进,这场打假的战役还会继续下去。

参考内容:https://www.theregister.com/2023/01/09/in_brief_ai/https://techcrunch.com/2023/01/05/as-nyc-public-schools-block-chatgpt-openai-says-its-working-on-mitigations-to-help-spot-chatgpt-generated-text/https://www.forbes.com/sites/rashishrivastava/2023/01/09/chatgpt-is-coming-to-a-customer-service-chatbot-near-you/https://www.theguardian.com/technology/2022/dec/31/ai-assisted-plagiarism-chatgpt-bot-says-it-has-an-answer-for-that


编辑:王菁

校对:王欣

相关阅读

  • 找年味、拼爆款,长视频混战春节档

  • 作者|魏妮卡编辑|李春晖
    很多东西都要失而复得方知珍贵,很难想象有一天我们也会对春节产生这样的集体情绪。经过三年疫情,今年春节的年味显然超出以往。对很多人来说,这个春节
  • 【正月初三】用火用电要安全

  • 推荐阅读
    监 制丨 崔 楠 审 核丨崔 楠文 字丨 韩雨欣 编 辑丨闫 安发 布丨 天 水 消 防 全 媒 体 中 心
  • 量产拜年纪

  • 作者|刘小土编辑|李春晖
    如今的年轻人是越来越难懂了。除夕这样的年度关键时刻,爸妈在家严阵以待追春晚,年轻人却追了一场又一场拜年纪,都不带重样的。
    大众所熟知的拜年纪,是哔
  • 全面排查清理!

  • 全面排查清理以“刑满释放”为标签的搞笑、卖惨、博取流量的不良网络视听内容。
    截至1月21日晚,共排查处置违规账号222个,清理违规内容3345条,下架相关话题207个,主要涉及炫耀服
  • 2023新春主题活动火热出炉,等你来嗨~

  • 寻味汶川·无忧团圆虎越雄关,兔临春境鼎故辞旧,万象更新此时的无忧汶川张灯结彩、欢乐祥和、热闹非凡处处都散发着浓浓的年味儿在这喜气洋洋的日子里“寻味汶川·无忧团圆”系
  • 守岁围炉 共庆团圆

  • 编辑:张裹裹 特古苏声明:除原创内容特别说明外,推送稿件文字及图片和音视频均来源于网络及各大主流媒体。版权归原作者所有,如认为内容侵权,请在文章下方留言联系我们删除或支付

热门文章

  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 你听,家在呼唤

  • 家永远是最温馨的港湾在举家欢庆的团圆时刻消防员们选择坚守岗位每一次“云相聚”的机会都会产生一幕又一幕的幸福瞬间 汉口北站 三金潭站 “此心安处是吾乡。”武汉消防
  • 独家 | 9个可以显著优化代码的Python内置装饰器

  • 翻译:陈之炎 校对:赵茹萱本文约2000字,建议阅读8分钟本文介绍了精心挑选的9个函数装饰器,它将展示Python的优雅。函数装饰器有事半功倍的力量。Wallhaven 提供 图片“简胜于繁。
  • 春节年夜饭,一个人在云南过年:自己做饭不划算

  • 三年疫情结束,全国人民迎来了一个快乐的春节,今年春节可火爆了,很多北方人举家迁徙到南方过年,全国首选过年、气候最温和的不过云南跟海南两省。我是一个在路上六年旅行的背包客