满文档案四十年:从满文干部培训班到满文图像识别系统

满语是清朝的国家通用语言,有清一代形成了数量庞大的满文档案,有独特的历史研究价值,也是中华民族历史文化遗产的重要组成部分。然而由于历史原因,清中叶以后满语文的使用每况愈下,到建国初期,满文专业人才已经十分罕见。

中国第一历史档案馆是世界上现存满文档案数量最多的机构。新中国成立后,为加速满文档案整理和研究,经周恩来总理批准于1975年8月正式举办“满文档案干部培训班”。这一届培训班学员后来成为我国满文档案工作的核心力量,为满文专业人才培养和传承打下了坚实的基础。

2018年是改革开放四十周年,也是“七五年满文干部培训班”结业四十周年。11月5日上午,中国第一历史档案馆(以下简称“一史馆”)在京举办“改革开放四十年满文档案工作回顾与展望”座谈会,国家档案局领导、各研究机构代表等七十余人与会,当年的满文档案干部培训班学员亦从四面八方赶来,在曾经共同学习的地方再聚首。

与会者合影

座谈会回顾了一史馆四十年来的满文档案工作,并特别介绍了近年来在满文档案信息化工作中的开拓性进展。会上正式发布了由一史馆与相关单位合作研发的满文图像识别软件系统——“满文识别通”、“满文输入通”,以及基于这两个软件开发的“满文朱批奏折全文检索数据库”。这一满文图像识别软件项目荣获“2018年度国家档案局优秀科技成果特等奖”,在会上也得到了学者专家的一致肯定。

中央档案馆副馆长、国家档案局副局长胡旺林,一史馆馆长孙森林,研发公司代表共同为满文图像识别软件揭幕。

中央档案馆副馆长、国家档案局副局长胡旺林出席座谈会并发表了讲话。他表示,一史馆满文档案工作者不断开拓创新、砥砺前行,开发出满文档案图像识别软件,不仅使满文档案数字化及利用方式产生了飞跃式变革,还为历史档案在“互联网+”时代如何弘扬中国历史文化提供了新思路,为满文档案这一中华民族文化遗产的传承提供了新途径。

他还提到,将OCR技术应用于满文档案图像,填补了满文档案信息化和数字化领域的技术和软件空白,同时也实现了国内少数民族手写体文字图像计算机识别的首次成功。

一史馆馆长孙森林在报告发言中总结了四十年来该馆在满文档案整理、著录、翻译、研究以及满文人才培养工作、满文档案信息化等方面的主要工作;并从“资源”“人才”“学术”“服务”四个方面介绍了未来满文档案工作的方向。

在人才培养方面,孙森林馆长指出,目前“七五年满文干部培训班”学员均已退休,满文档案人才面临着“青黄不接”的现状,人才培养刻不容缓。要在积极引进人才的同时,注重与高校、科研单位以及讲满语较为集中的地方合作探索培养人才的有效形式;要坚持在工作实践中“传帮带”,还要建立有效的激励机制。

“七五年满文干部培训班”学员毕业合影

他还表示,做好档案服务,包括进一步做好满文档案全文检索数据库建设,为满文档案利用提供更加方便快捷的平台;要做好满文识别通、满文输入通、满文档案全文检索数据库等科技成果的推广应用,提升满文档案服务社会需要的能力水平。同时,要继续加强与有关单位的合作,积极探索研发满文档案辅助翻译软件,让更多专家学者能够通过满文档案来研究历史,让普通大众认识和接触满文,为满语文的传承做出贡献。

七五年满文干部培训班

一史馆研究馆员吴元丰作为“七五年满文干部培训班”的学员代表之一,回顾了1970年代培训班开办的来龙去脉和当年的学习经历。

1976年满文干部培训班学员在上课

据他介绍,故宫博物院明清档案部(即现在的一史馆)开设满文干部培训班时,从新疆察布查尔锡伯自治县、黑龙江富裕县和北京市共招收21名学员,于1975年10月起在故宫内阁大堂西厢房开始授课。学制三年,开设满语文、现代汉语、古汉语、中国通史、明清史、中国近代史、清代文书制度、档案学基础、翻译学理论等课程。

当时在课堂教授正课的老师全部从故宫博物院业务人员内选派任教。满语的语音、语法、翻译,分别由明清档案部关孝廉、刘景宪、屈六生授课;现代汉语及中国通史、明清史、中国近代史,分别由明清档案部刘桂林、王树卿授课;古汉语由业务部王海芬授课……专题讲座的老师有中央民族学院赵展,北京师范大学清史组马汝珩、李华、张晋藩,北京大学陈宏天,承德文物局袁琛波及本院明清档案部宋秀元、刘子扬、李鹏年,业务部冯乐云等。

1978年7月,满文班学员毕业留下工作时,故宫博物院明清档案部满文组的工作人员猛增至29人;对总人数不到百人的档案馆来说,集中有29名满文专业人员,不失为一个奇迹,创造了新的历史纪录。即便近年来不断招收新人的满文档案专业队伍,迄今尚未打破之前的纪录。

满文档案图像识别软件系统

据一史馆巡视员吴红介绍,该馆馆藏明清档案1000余万件,其中满文档案有200多万件,占整个馆藏的五分之一。过去满文档案的整理、著录、编目和翻译等工作基本依靠专业人员纯人工操作,是一项颇费时日的工程;一史馆为加快满文档案信息化工作探索利用科技手段推动工作发展。

“满文档案图像识别软件系统”包括五个功能模块,即满文档案图像识别软件、满文档案数据管理软件、满文输入法软件、满文字库软件和拉丁字母与满文相互转换软件。

这一系统在2016年9月应用于一史馆“满文朱批奏折全文检索数据库建设项目”,将满文朱批扫描图像加工成文本信息,同时建立“满文朱批奏折全文检索数据库”和配套的应用平台。一年时间里,共识别满文朱批 13万件,70万画幅,4600万个满文单词,成品准确率高达99.79%。满文输入法和满文字库则应用于满文古籍编辑出版工作,在出版满文篆书《御制盛京赋》过程中,书籍的名称、附录中所有的满文均使用项目研发的输入法字库完成。

满文朱批奏折全文检索数据库界面

吴红指出,“满文档案图像识别软件系统”项目研发开拓了满文档案的工作思路,提高了满文档案文献信息化工作效率,同时在一定程度缓解了满文人才紧缺的难题。此外,这一项目为开发满文翻译等软件打下了基础。目前满文档案利用的最大难题仍然是翻译问题,单纯依靠人工翻译是十分困难的。同时,这一项目还为其他少数民族文字的文献数字化项目提供了参考。

吴红在座谈会上宣布“满文档案图像识别软件系统”即日起正式向社会公布。会后,“满文输入通”软件将免费向社会各界发放100套,应用“满文识别通”及“满文输入通”开发的13万余件“满文朱批奏折全文检索数据库”,将于12月的第一个工作日在中国第一历史档案馆利用平台向社会开放利用。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();