日期:
来源:爱图说图收集编辑:档案
"据MSN报道,作为世界十大禁地之一,梵蒂冈机密档案馆相信大家都听说过,它是罗马天主教的档案保管机构,而且其中有不少档案都没怎么被人查阅过。即使有人看了,也看不太懂。
这座档案馆体量不小,光是档案架加起来就有8400多米长,而且年年都在加长。档案所记载的内容可以追溯到公元8世纪,其中既有历代教皇的一切事务记录、信件往来、也有他们的账册,许多都是高度机密。
为了更好地保存和解密,这些档案中有部分被扫描或录入电脑中,但由于档案数量太大,要想完成这项工作,单凭人工加电脑的方式几乎是不现实的。
目前有项名为“编码系统”(In Codice Ratio)的项目启动,运用人工智能中的视觉识别来帮助录入并分析档案内容。如果这个项目成功实施,将会为世人揭开这些海量秘密文件中隐藏多年的谜团。
中世纪文本的手稿字迹风格各异,存在连笔和特殊缩略语,传统的视觉识别算法无法胜任转录工作。为此,项目组研发了训练文字视觉识别系统的新方法:将单词拆分为笔划,再像拼图一样将笔划组合起来的方法。
比如这个,是aimo, amio, aniio还是 aiino,人工智能分辨出这是anno,拉丁语中“年”的意思,它靠的就是整组联想以及学习经验累积的方式。
项目团队称:“我们能够准确转录数据集中65%的字母图像。”这一成果对转录中世纪的文章、信件等很有意义,能帮助历史学家对这些材料进行更深入的研究。
但是项目也还有更多的挑战,如小写字母、缩略语等。但现在是个好的开始,希望他们的工作为我们了解历史带来更多的信息。在高科技的时代,连神学著作都要靠人工智能来破译了。"