撰文 | 小溪
如果你与高能物理研究沾点边,就一定知道INSPIRE——那个历史悠久、颇有名气的文献信息开放获取平台。它是一个文摘型的索引库,不仅集结并管理了海量的粒子物理等领域的论文及引用数据资源,还贴心地列出了论文作者的单位、参与实验的机构及合作组、相关实验、相关期刊、相关会议的信息,甚至包括了职位和博士后的招聘等,总之你想了解的应有尽有,令人更惊喜的是它还具备了分析与统计信息数据的强大功能。
为何INSPIRE能被高能物理领域研究者们高度认可和信赖?它是怎样建立的?在好奇心的驱使下仔细追溯了INSPIRE的发展历程,发现它竟然有那样不凡的身世,有那么多动人的故事。最初的探索来自好几条初始脉络,来自一些具有惊人奉献精神的有识之士,随着科技的发展引出了多个有趣的发明,它的功能越来越强大,最终强手联袂成就了一个硬核的“王者”INSPIRE!
(INSPIRE几十年发展历程中的故事分为三个部分介绍)
1 原来它有那样不凡的身世
对INSPIRE的身世追根溯源,需对高能物理的研究模式有些初步了解。高能物理的实验研究很大程度上依托于相关的实验装置,20世纪50年代初,随着粒子加速器技术、粒子探测器技术、海量实验数据获取及处理技术的迅猛发展,高能物理的实验装置规模越来越大,但有能力开展大型实验项目的研究机构相对较少且散布在相隔距离较远的世界各地。
高能物理研究的精髓是对微观世界的探索,每一点新的思路与进展都可能对研究者有重要的启示,相关研究者的苦恼是:想在期刊上发表一篇论文需要经历繁杂的同行评审,冗长的修改过程,最后还有可能被拒稿,在长达数月甚至更漫长的评审过程中很有可能失去某些极有价值的机遇,这对于新研究思路的初期交流与探讨十分不利。为解决这个急切而重要的问题,早在20世纪50年代初,身处不同研究机构的一些有识之士几乎是同时开始了对解决高能物理研究领域信息交流问题的探索,设法让研究者在论文正式发表之前能尽早在本领域内分享、交流自己的研究成果。
在之后的几十年中,最初的探索已逐步发展成为被国际高能物理领域研究者们高度认可和信赖的数据信息平台,而那些发生在多年前的动人故事依然使人难以忘怀,从中可以得到不少深刻的启迪。
2 CERN的克莱蒙特
1954年,毕业于比利时布鲁塞尔大学的戈德施密特·克莱蒙特(Luisella Goldschmidt-Clermont)来到欧洲核子研究中心(CERN)科学信息服务处工作。克莱蒙特具有社会科学博士学位,她的研究领域本应是社会学,本来与高能物理研究并无交集,但她来到CERN之后,却以自己特有的视角敏锐地看到了当时高能物理研究领域信息交流方面存在的问题:在这样的背景下如何才能解决该领域重要而急切的信息交流需求呢?在克莱蒙特的积极倡议和推动下,CERN最早开展了在世界各高能物理研究中心之间交换文章预印本以及建立文件信息库的工作。
戈德施密特·克莱蒙特(Luisella Goldschmidt-Clermont)(图片来自网络)
这并不仅仅是一项收集及整理一些资料那类简单的工作,而是极为繁琐、细致、艰辛。高能物理领域的资料内容太丰富了,除了拟发表的论文预印本,还包括各类学术讨论会上的内部报告、会议记录、研究进展过程中的笔记、甚至是研究者私人之间的交流讨论的书信、记录等。最初,这些浩如烟海的资料只能靠人工进行收集、分类、编目并标注上识别码,若预印本在期刊上正式刊出,还需根据识别码及时删去目录中该预印本的信息。能想象当时那些工作人员的辛苦么?但这项工作很快就显示出其独特的意义,它能帮助相关的研究者尽早了解研究中的新发现(唯一的要求是未经作者允许不得引用或复制),这对许多研究者的工作产生了巨大影响。
需要整理的资料堆积成山(图片来自网络)
作为一位社会学学者,克莱蒙特为何能在物理领域作出如此重要的贡献?在她写于1965年的文章“Communication Patterns in High-Energy Physics”中有一段相关的表述。她说:头脑正常的社会学学者一般不会愿意离开自己熟悉的专业基础投入陌生的物理学领域,但命运的安排却使自己以旁观者的身份投入了为这个群体解困的服务。社会学学者的研究结果并不是纯科学性的,而正应是服务于社会。
克莱蒙特1965年撰写的文章(图片来自网络)
3 DESY的乌斯特、梅伦汀
1962年,拥有德国科隆大学博士学位的汉斯·奥托·乌斯特(Hans Otto Wuster)来到德国电子同步加速器研究所(DESY)工作。面对日益增多的高能物理论文分类与录入需求,他有远见地提出应该建立一个信息和文献的管理系统。乌斯特想到了自己既是计算机迷又是图书馆专家的好友库尔特·梅伦汀(Kurt Mellentin)。正是在乌斯特的热情邀请下,梅伦汀从美国来到DESY担任图书馆馆长并承担了高能物理索引和科学检索系统(HEP-Index)的设计。
汉斯·奥托·乌斯特(Hans-Otto Wuster)(图片来自网络)
梅伦汀的工作团队刚开始时只能使用穿孔卡片来录入每份收录文献的分类号、关键词等相关数据,随着技术的发展,后来终于可以在计算机终端上进行这项工作了。在梅伦汀团队的努力下,从1963年起,DESY开始印发高能物理索引的小册子“HEP Index”(每两周一期),其内容既包括预印本,也包括已发表的论文,每年收到的文章约9000份。HEP Index提供文章的标题、作者和日期,为每篇文章分配23个关键字(或关键短语),但当时没列入参考文献。全世界500多个研究所都能定期收到这种小册子。与此同时,DESY还将保存相关数据的磁带提供给各高能物理研究机构作为他们数据库的一部分来使用。
DESY存储数据的矩形孔打孔卡片(图片来自网络)
DESY印发的高能物理检索小册子HEP Index
(图片来自网络)
4 SLAC的潘诺夫斯基、阿迪斯
20世纪60年代初,美国斯坦福直线加速器中心(SLAC)刚成立不久,首任所长是沃尔夫冈·潘诺夫斯基(Wolfgang Panofsky)。潘诺夫斯基深知高能物理学者之间及时的信息交流极为重要,正式发表研究成果所需的繁琐审核过程使他们难以忍受,他们只得将自己的论文预印本寄给自己所了解的研究机构或者干脆直接寄给所认识的研究者。由于高能物理研究的发展迅速,预印本的数量急速增长,在某种程度上研究者之间的交流受到了影响。
1962年,毕业于斯坦福大学拥有国际关系学士学位的露易丝·阿迪斯(Louise Addis)来到正在建设中的SLAC图书馆工作。按照潘诺夫斯基所长提出的要求,阿迪斯投入了尽力收集高能物理领域新预印本的工作,最初是从录入几箱物理学者们捐赠的CERN工作报告开始的,他们将每份预印本的细节输入穿孔卡片,包括预印本列出的每一位作者名单(仅这一项的工作量就够大的,某些大实验组的文章很可能列出数百甚至上千名作者)。当时,因SLAC处于高能物理领域的中心地位,每年收集的预印本约有3000余份(用卡片进行分类)。
沃尔夫冈·潘诺夫斯基(Wolfgang Panofsky)、露易丝·阿迪斯(Louise Addis)(图片来自网络)
5 一个极好的机遇
1967年,正当阿迪斯思考着怎样才能提高预印本的检索效率之时,斯坦福大学开始研制一种计算机化的数据库系统,目的是为各类研究者提供一个面向用户的、交互式的计算机联机检索系统,并同时可用于支持高校图书馆的自动化管理工作。该项目后定名为斯坦福公共信息检索系统(Stanford Public Information Retrieval System,简称SPIRES),首席研究员是斯坦福大学的埃德温·帕克(Edwin Parker)。
一个极好的机遇来了!SLAC图书馆的预印本卡片目录作为一个大型数据库正是SPIRES项目极为合适的测试对象。从1968年3月开始的测试结果充分表明:该数据库用于预印本的目录管理可大大提高研究者的检索效率。
埃德温·帕克(Edwin Parker)(图片来自网络)
5 SLAC与DESY的联手
SLAC与DESY的团队都认识到双方搜集的文献有很大程度重合,SLAC从1966年起加入了DESY的HEP-Index数据库,分担数据库的建立和更新。为了更好地进行资源共享,他们共同对如何统一文献检索的格式进行了研究。
在美国原子能委员会的资助及美国物理学会的赞助下,SLAC图书馆利用HEP-Index数据库生成每周的新预印本清单。从1969年1月起SLAC图书馆向1000余名订阅者每周发送一期“预印本目录”(Preprints in Particles and Fields,简称PPF)。每期的PPF列出SLAC图书馆前一周收到的高能物理预印本论文列表,包括论文发布日期、论文标题、报告编号、所有作者的清单、作者所在机构、论文的关键词或关键短语(由DESY给出),并列出了论文的参考文献和已在期刊上发表的论文引用情况。更贴心的是每期PPF还附上一份“已取消预印本目录”(Anti-Preprints In Particles and Fields,简称PPA),内容是列入PPF预印本目录之后在某期刊上正式发表的论文清单,使研究者能及时、准确地了解论文的状况。
1969年6月,SLAC图书馆完成了将DESY的HEP-Index数据转换为SPIRES所需格式的规范标准。此时,SLAC图书馆可利用SPIRES系统方便地生成每周的预印本目录并发送出去。研究者想展示自己的工作进展,只需将相关论文发往SLAC图书馆,并可通过浏览SPIRES每周发布的预印本目录便捷地选择自己所关注的其它论文,避免了被大量不必要的预印本信件打扰。
SLAC图书馆每周发布的PPF(Preprints in Particles and Fields)
(图片来自网络)
随着DESY与SLAC团队合作的深入,双方决定将各自收集的高能物理领域论文预印本编入同一个高能物理信息检索系统,称为“SPIRES-HEP”,该系统于1974年正式投入使用,由SLAC与DESY共同负责运营,在双方的努力下SPIRES-HEP不断克服技术、财务等方面的问题,不断补充内容更新版本而功能越来越强。
6 结语
以上介绍的是数位身处不同研究机构的有识之士创建高能物理信息检索系统初期的探索。经他们及团队的艰辛努力,高能物理信息检索系统SPIRES-HEP终于建立起来并在高能物理研究的发展过程中发挥了重要作用。我们向这些具有惊人奉献精神的探索者表达深深的敬佩!
编辑:瑾岫