服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

想和古籍对话?来找“荀子”! 全国首个“古籍版ChatGPT”发布

日期: 来源:扬子晚报收集编辑:扬子晚报

  12月11日,记者从南京农业大学获悉,该校信息管理学院王东波教授研究团队研发的“荀子”古籍大语言模型发布,这是国内首个专门应用于古籍处理与研究的智能工具,包含了《四库全书》在内的古籍文献超20亿字大型语料库,能够实现自然语言理解、自动翻译、诗歌生成、自动标引等多项功能,作为开源的、公益的研究成果,该模型已在GitHub、ModelScope等网站开源。

  输入指令即生成绝妙好诗  一键可将古汉语译成现代汉语

  为何取名“荀子”?据王东波介绍,荀子,不仅是我国先秦时期伟大的朴素唯物主义的思想家,也是一位散文大家。在对他作品的深入研讨中团队发现,他在语言学理论的阐述上也是一位开拓者,命名荀子是为了纪念这位中国历史上的语言学先驱。对于普通受众而言,想要走近繁体、竖版、未添加句读的古文不是一件容易的事,而“荀子”的上线意味着在智媒时代,和古籍对话成为可能。

  “咱们请它以金陵为主题,生成一首五言古诗。”王东波现场演示了“荀子”的智能写诗功能,指令一输入,系统便生成了一首堪称绝妙的原创古诗:“秦淮佳丽地,城阙望中迷。柳暗青丝发,花香碧玉衣。歌楼留夜色,画阁敛春晖。细雨轻舟去,双鱼梦泽飞。”

  除此之外,古文的阅读理解、标点添加,以及将古汉语翻译为现代汉语,这些让受众难啃的“硬骨头”,“荀子”可以轻松拿下。

  对于领域专家而言,可以借助“荀子”完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等专业古籍研究处理场景。同时发布的基座模型,还可以让用户根据自己的需求,使用本地的训练语料微调“荀子”基座模型,使其在古籍下游处理任务上取得更优越的处理性能。

  投喂40亿字大型混合语料数据  “荀子”算力强大“饱读经书”

  尽管目前有200多个通用模型在各领域得到应用,但古籍领域仍缺乏专业的大语言模型。功能强大的“荀子”到底是怎么做到化繁为简、通读古今的呢?“首先是‘算力充足’并且‘饱读经书’!”王东波介绍,“荀子”的顺利问世离不开南京农业大学提供的高性能算力基础设施支持,以及团队长期积累的大量标注、精加工语料库,团队给“荀子”投喂了40亿字大型混合语料数据。

  “模型的构建受算力、场景应用等多方影响,但精准度较高的优质数据,是最为关键的。”据王东波介绍,团队从2008年开始接触古籍,2013年至今一直专注于人工精标注数据的工作。“比如《岳阳楼记》,要训练机器标注该典籍中的形容词,就要首先训练相关人员标注形容词,在大量人工标注的基础上,再让机器学习。”这项坐冷板凳的基础标注工作一做就是10年之久。

  王东波表示,我们期待能将古籍的智能化研究与跨学科的人才培养相结合,让学生既有前瞻的科研视野,又能积累较为深厚的人文底蕴,同时让更多受众接触古籍、品读古籍、传播古籍,真正地唤活“故纸堆”,共同推动中华优秀传统文化创造性转化和创新性发展,赓续传承中华文脉。

  联合发布荀子古籍大语言模型的中华书局古联公司则主要致力于未来的场景应用和领域推广,荀子大模型除让大众用户能够顺畅利用古籍内容,在专业领域推动古籍整理、古籍数字化、古籍活化利用与传播之外,未来还可广泛应用于AI写作、AI教学、数字文娱等领域。

  古诗生成

  指令:请以金陵为主题,生成一首五言古诗。

  输出:秦淮佳丽地,城阙望中迷。柳暗青丝发,花香碧玉衣。歌楼留夜色,画阁敛春晖。细雨轻舟去,双鱼梦泽飞。

  添加标点

  指令:为下面给出的无标点的古汉语文本添加标点。

  输入:诸将皆曰敌闻太傅自来上岸必遁走奉独曰不然

  输出:诸将皆曰:“敌闻太傅自来,上岸必遁走。”奉独曰: “不然。”

  翻译古文

  指令:将下面给出的这段古汉语文本翻译为现代汉语。

  输入:大将军凤心不便共王在京师,会日蚀,凤因言“日蚀阴盛之象,为非常异。”

  输出:大将军王凤认为共王留在京师对自己不利,正赶上发生了日食,王凤就说:“日食是阴气太盛造成的现象,是不同寻常的灾异。”

  扬子晚报/紫牛新闻记者 王赟 通讯员 楠秾宣 

编辑 刘丽


相关阅读

  • 如何让生成式AI更环保

  • 了解生成式AI模型的碳足迹。编者按:生成式人工智能推动整个社会、技术和生产力的提升,但这些模型隐藏的环境成本和影响往往被忽视。本文分享八个步骤来使这些系统更环保:使用现
  • 让残卷从获“新生”,走进“古籍修复技艺”

  • 古籍凝聚着前人的心血和智慧,记载着中华民族过往的辉煌,是传承中华文明的重要载体。经历千百年的保存中许多古籍由于自然和非自然的原因,遭到损坏、如不及时修复,就不能阅读使用
  • 大模型,能给在线教育讲个新故事吗?

  • 记得ChatGPT刚刚推出的时候,我见到的第一个应用案例是这样的:一位IT工程师朋友发朋友圈,说要带孩子出去郊游,但老师布置了作文。于是他干脆让ChatGPT写了一篇替孩子交差,不仅没被
  • “AI寻亲”,靠谱吗?

  • 近日,“河北富豪找回丢失25年儿子”相关话题引发广泛关注,也使得“AI寻亲”技术走上前台。然而,事件背后提供了AI算法支持的格灵深瞳,今年前三季度公司仍呈亏损状态。格灵深瞳的

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 价格猛涨,“部分已售罄”!

  • 随着元旦、春节假期以及寒假临近不少市民正打算着出趟远门旅游记者在各大航司官网和旅游OTA平台注意到目前2024年春节期间杭州、衢州、上海、成都等周边出发机票价格已趋高
  • 金蝶获卡塔尔2亿美元投资,中东土豪不买车了?

  • 最近一段时间,关于中东土豪投资中国车企的消息可谓是层出不穷,不过就在最近一家非车企却也拿到了中东土豪的投资,这就是互联网企业金蝶,为啥中东土豪不买车了?一、金蝶获卡塔尔2
  • 低温降雪后,疾病怎么防?

  • 11日,北京、天津、山东、河南、新疆等多地普降瑞雪。这个冬天,流行性呼吸系统疾病的传播能否暂告一段落了?低温降雪之下,我们又该如何预防、应对这些疾病?低温降雪后,疾病怎么防?降