比较视野下的写本编目:在编目中该如何描述写本

冯婧
2018-06-03 09:41
来源:澎湃新闻

写本(manuscript),顾名思义,是指人力手写而非印刷制成的文本。我们熟悉的简牍帛书、敦煌写本,以及埃及的莎草纸手稿、欧洲中世纪宗教题材的手抄本等,都可被称为“写本”。近年来,写本的页面设计、装订方式、装饰风格、材质、字体等非文本因素,被视作还原写本生产、流传和使用的重要线索,引起了诸多研究者的兴趣。这一新趋势也对写本的编目工作提出了更高要求。

写本编目的传统由来已久,较早出现的是纸质目录。在新的学术潮流下,这些目录已经不足以准确呈现写本的物质形式和写本历史的复杂性。同时,信息技术飞速发展,电子数据库成为写本编目的新形式。这使得我们有机会采用更为灵活的方式描述写本,同时也引发我们对这种新式写本呈现方式的反思,乃至对其质量和发展前景的隐忧。

“在编目中该如何描述写本?”为更好地应对这一问题,德国汉堡大学写本文化研究中心联合慕尼黑大学、意大利卡西诺大学于5月7日至10日举办了主题为“比较视野下的写本编目:现状、共同挑战和未来方向(Manuscript Cataloguing in a Comparative Perspective: State of the Art, Common Challenges, Future Directions)”的国际会议。此次会议聚集了来自写本学各分领域的三十余位学者,讨论范围涵盖西欧中世纪和近代早期写本、中国早期和中古写本、古希伯来语写本、古希腊语写本、埃塞俄比亚写本、加许尼文写本、沙希地语写本、泰米尔语写本、阿拉伯语写本等来自不同文化传统的写本,和近二十种已投入使用的写本数据库,以及描述写本的前沿技术手段。在长达四日的会议中,与会学者总结了欧洲、亚洲和非洲写本的编目现状、成就和不足,尝试在跨文化视角下解决面临的共同问题。

部分与会学者(来源:The Centre for the Study of Manuscript Cultures,Universität Hamburg)

比较视野下的写本编目

此次会议的关键词可归纳为“编目”与“比较”。来自不同文化传统的写本,其产生的时间、地点,使用的语言、文字,物质载体和传播历史不尽相同。在承认各个写本系统具有独特性的前提下,能否设计出一套编目的统一规范,以促进不同写本文化之间编目描述的一致性,是这场会议关注的主要议题之一。

瑞士弗里堡大学的Patrick Andrist和意大利卡西诺大学的Marilena Maniaci,以拉丁语册子本(codex)的册页结构和页面分割为例,探索系统科学地描述写本的可能性。Patrick Andrist介绍了描述册页结构的三种方式:列举式描述(discursive description/enumeration)、图像式描述(graphic coding devices/tables) 和字母数字组合式描述(and alphanumeric formula)。他认为目前没有一种描述方式可以全面涵盖册页结构的各个方面,学界需更加注重写本描述在理念、实践层次的标准化。Marilena Maniaci则介绍了描述页面分割不同方式,总结其优势与缺陷。在结论部分,她提出理想的写本描述必须完整、一致、清晰,并具有开放性。

来自法国艾克斯-马赛大学的Élodie Attia-Kay更关注对于卷轴形式写本的描述。她集中讨论了西欧中世纪摩西五经卷轴的研究现状,介绍了柏林、巴黎等馆藏机构的编目现状和存在问题。她指出,相比册子本,目前学界对中世纪卷轴的研究较少,编目中卷轴的物质形式信息也多有缺失。目前用于描述卷轴的一些维度,如页面尺寸、页面分割、分栏、行数等,来自册子本的描述传统,并不适用于卷轴。她认为今后的编目应添加卷轴特有的描述维度,如轴的长度和卷子的长度。在条件允许的情况下,可以通过3D技术可视化卷轴的结构。

然而,并非所有写本都是完整的册子本或卷轴。历史上,大量写本被损毁或拆分,流散至世界各地,如今以零散残片的形式重新呈现在研究者面前。如何在编目中描述写本残片,尤其是残片的物质形式,也是编目者面临的现实问题之一。瑞士弗里堡大学的Christoph Flüeler将残片区分为文本残片(text fragment)和写本残片(manuscript fragment),并系统介绍了中世纪写本残片数据库Fragmentarium。他指出,残片的破碎性增加了辨识和描述残片原本面貌的难度。目前,对于写本残片的描述,同样缺乏统一规范。

奥地利蒙德塞修道院中世纪写本残片(来源:Fragmentarium)

此次会议有三位学者集中探讨了如何描述中国写本。来自德国海德堡大学的史达(Thies Staack)认为,现有的简牍帛书数据库更重视文本内容,对于写本的物质形式关注不足,缺失了排版、抄手的相关信息,也无法体现写本复杂的生产过程和流传历史。他以北大简《老子上经》为例,展示了他所设想的最佳描述方案。这份写本的背部刻划线将写本划分为8个物质单元(material support unit);正面的黑点标识符号和留白,又将写本划分为44个内容单元(content unit);两者相合处构成的边界(boundary),最终将《老子上经》划分为6个生产、流传单元(block)。这些信息都应添入目录。在结论部分,他提出对于保存完整、易于重构的写本,要进一步划分其不同层次的单元,关注其生产、流传与使用;对于损毁严重、不易重构的写本,也需尽力探索其可能存在的单元划分。

来自英国剑桥大学的高奕睿(Imre Galambos)围绕敦煌写本,阐述了他对写本编目的看法。他认为敦煌写本的编目可追溯至二十世纪初斯坦因所雇用的中国秘书在敦煌写本上留下的简短描述,如敦煌写本S.1286《佛名经》背面的红字“破烂佛名经一块”。敦煌写本流散至各国后,英国、法国、俄国、日本陆续开始了整理工作,并出版目录。其中,记载法国国家图书馆藏敦煌汉文文书的《敦煌汉文写本目录》(Catalogue des manuscrits chinois de Touen-houang)对于写本物质形态的描述较为完善,有写本尺幅长短、纸质、红字、朱印等信息,对研究者有很大帮助。他还指出,写本的整理过程也应纳入目录的记载范围,以便研究者回溯写本的原本面貌。他以英国图书馆藏一份册子本为例,早期照片显示其页角为圆弧,如今藏本的页角却变为了直角。这有可能是整理者为了让这份册子本的外貌形态更接近西方意义上的册子本,刻意裁剪所致。若这份写本的旧照片没有偶然保留下来,现在的研究者恐怕将误会现存藏本的形式是其原本的中古面貌。

敦煌写本S.1286《佛名经》(来源:International DunHuang Project)

德国汉堡大学的傅敏怡(Michael Friedrich)则介绍了瑶族文书编目的基本情况和存在问题。他指出中国传统的编目缺乏对写本物质形态、语言学特征的关注;瑶族文书本身复杂的性质,如语言文字上的混杂多样,以及写本的损毁等因素都造成了编目的障碍。他认为目前的编目缺乏对于写本装订方式、页面布置、标识符号、写本的拥有者与使用者的描述。描述写本时术语的混乱也亟待改善,有必要统一术语的使用。

信息时代的写本描述

信息技术的发展为写本数字化开拓了无限空间,也催生了写本描述的全新特征。区别于纸质目录中写本与描述之间“一对一”的关系,电子数据库建立的是“一对多”的关系,建立的是写本与描述、图像、录文、元数据等要素之间的多边关系。打通诸要素之间屏障的前提,是将它们转化为机器可读的形式。这要求编目者不仅有扎实的写本学基础,同时也要熟悉数字人文的前沿技术。

来自英国剑桥大学的Yasmin Faghihi介绍了如何运用TEI Guidelines(Text Encoding Initiative Guidelines)描述写本。TEI Guidelines是一套机器可读的文本数字化编码,主要应用在人文科学和社会科学领域,目前已被广泛运用于文本的保存、研究与教学工作。她指出,数字化编目不能仅仅满足于数字化的外观,更重要的是数字化的内在,利用数据建立目录的内部联系与结构。TEI Guidelines便是构建真正意义上的电子数据库的途径之一。

法国国家科学研究中心的Matthieu Cassin则以希腊语写本数字化为例,阐释了赋予每份写本独有的数字辨识码(numeric identifier)的重要性。传统的编目依赖标签号(shelfmark)区别写本。但标签号不适用于电子环境,无法被机器识读。来自多份目录的标准不一的标签号,还容易造成混淆。为应对标签号带来的不便,项目ISMI(International Standard Manuscript Identifier)正致力于建立一套稳定的、机器可读的数字辨识码,并建设可供各馆藏机构注册写本的数据库。

而最引人注目的,是美国国会图书馆Alberto Campagnolo所介绍的VisColl。在展示中,他将电子数据库呈现写本的主要方式归纳为四种:图像视图(Image View)、页面视图(Book View)、滚动视图(Scroll View)和略缩视图(Gallery View)。通过这四种视图,研究者可以知晓写本的内容和页面的排序,却无法得知页面的接合方式和写本的册页结构。针对这一缺陷,VisColl建立了一套数据模型以描述写本的物质形式和内部结构,并最终以图像的形式呈现。其原理是将写本从理念上拆分成若干基本构成要素,然后搭建积木般从视觉上重构写本样貌。目前,VisColl提供的模型能够细致而灵活地描述写本中的折页、单页、护页、原初页、遗失页、替换页、插入页,以及各种页面接合方式,如缝合、全部粘合、部分粘合等,足以应对各类结构复杂的写本。

利用Viscoll可视化写本结构(来源:https://github.com/leoba/VisColl)

数据库与写本的保藏、研究

写本目录是写本信息的主要来源,长期以来服务于该领域的研究者。在纸质目录与电子数据库并行的今天,电子数据库在写本保藏、研究方面的优势逐渐显现,昭示了未来写本编目发展的主流。在这次会议上,不少学者提及写本数据库对于写本残片缀合的重要意义。历史上诸多因素造成了写本的破损与流散,给现今的写本研究造成一定障碍。于中国读者而言,较为熟悉的例子是敦煌写本。敦煌学学者姜亮夫先生曾说:“敦煌卷子往往有一卷损裂为三卷、五卷、十卷之情况,而所破裂之碎卷又往往散处各地:或在中土、或于巴黎、或存伦敦、或藏日本,故惟有设法将其收集一处,方可使卷子复原。而此事至难,欲成不易。”而如今依靠联合数字目录,写本数据库之间的信息逐渐实现共享。即使写本残片流散世界各地,研究者也可以依据电子图像复原写本的原貌。

美国圣本尼迪克和圣约翰学院的Columba Stewart所展示的vHMML(Virtual Hill Museum and Manuscript Library)令人印象深刻。从1965年至今,vHMML与全世界超过20个国家550个图书馆合作,扫描了超过250000份写本。他们的团队甚至深入政局动荡的地区,搜寻处境危险、濒临损毁的写本,与写本的保藏组织与个人建立合作关系,开展写本数字化工作。目前,vHMML已通过图像的形式存留了分布在黎巴嫩、叙利亚、伊拉克、土耳其、耶路撒冷和埃及的基督教写本20000余份,分布在埃塞俄比亚、耶路撒冷和廷巴克图地区的伊斯兰教写本近90000份。这些写本的原本仍存留当地,现今已有部分写本被损毁,或是遗失。vHMML的图像资料成为了它们的唯一记录。

黎巴嫩十八世纪阿拉伯语圣经(来源:vHMML Reading Room)

来自美国乔治福克斯大学的Steve Delamarter,则通过埃塞俄比亚《诗篇》写本,探讨如何运用量化写本学开展研究。他统计了《诗篇》写本的长宽比、每一单册的平均纸张数、标示文本中间位置的各种方式的出现频次、计算诗节的各种方式的出现频次、用红墨水突出单词“玛丽”和“上帝”的频次,并以时间为主轴呈现数据,展现上述非文本因素长时段的变化趋势。他强调非文本因素的特殊性需放置在大量数据构成的大背景下才能得到凸显。这种统计不仅能增进我们对于书籍文化的整体性认识,还能定位非文本因素转变的关键时间节点,启发研究问题的生成:这些转变背后的历史动因是什么?是观念性的还是经济性的?推动变革的是抄手、书匠,还是艺术家?最后,他提出有必要尽快建设可供数据比对的写本数据库,以提高处理数据的效率。

写本编目具有悠久的传统,在编目中该如何描述写本也是反复萦绕编目者和研究者的重要问题。此次会议总结和反思了现有的写本编目工作,尝试在跨文化的视野下追寻编目描述的一致性,并介绍了相关前沿技术手段,为未来的写本研究提示了诸多可能性。然而,这一切只是开始。对写本的共同兴趣,将不断驱使来自不同领域的学者相互合作、共享资源、解决问题,为写本的描述开拓新的思路。

    责任编辑:钟源
    校对:栾梦