中韩数字人文论文选集(第一辑)
上QQ阅读APP看书,第一时间看更新

一、基本面的重合

数字人文定义纷繁,学者们对其内涵外延的表述各有方圆,口径不尽相同。美国国家人文基金会布雷特·博布利(Brett Bobley)的观点影响比较广泛,2011年他在Taporwiki论坛提出“我们使用‘数字人文’作为一种伞状概念(Umbrella Term)以指代一系列围绕在技术和人文学术研究周围的不同活动”。[6]维基百科在“数字人文争鸣”(Debates in the Digital Humanities)中进一步指出:“在这样一个巨大无边的大帐篷式(Big Tent)的数字人文定义中,有时候很难确定数字人文到底需要做什么。”[7]李点在考察了20多种定义后,把数字人文的“灵魂”归结为数字媒介与传统人文的交叉,也就是使用数字媒介的工具和方法来重新考察人文学科的问题,同时又用人文学科的范式来探索数字媒介的功能与意义。[8]其他有关表述林林总总,大多无外乎数字方法在人文领域的应用,认同“伞”或“帐篷”式概念的宽大容量。按照上述界定和分析,数字记忆有理由成为数字人文大家族的成员。

(一)领域对象的人文属性

这里的关键是辨析数字人文中“人文”的含义。无论是西方的人文主义传统,还是我国的“观乎人文,以化成天下”的思想,其“人文”均涉及人事、思想、信仰、道德、伦理等与人相关的宽厚涵义。记忆是人类最为普遍的精神现象,无论是个体记忆还是集体记忆,与心理学、社会学、人类学、媒介理论等都有密切关系,是以人为核心的跨学科领域。数字记忆是对文化记忆的数字构建,而文化记忆是对脱离了人脑、进入“外部存储器”的过去经验的一种建构,以某种信息符号,诸如文字、图像、声音以及各种隐喻,寄居在一定的媒介上。“如果我们不想让时代证人的经验记忆消失,就必须把它转化成后世的文化记忆,这样,鲜活的记忆将会让位于一种由媒介支撑的记忆,这种记忆有赖于像纪念碑、纪念场所、博物馆和档案馆等物质的载体。”[9]档案、图书、图画、照片、电影、音乐、器物等记录物是人类追溯过往、认知自我、实现身份认同的重要依据,文化记忆是人类精神生活的基础和重要组成,记忆现象的人文属性是顺理成章的。

从早期的人文计算到数字人文,大多数项目针对语言、文学、历史、宗教等传统人文学科知识,然而在数字人文的发展过程中,人们所理解和阐释的“人文”内涵却逐步超出人文学科的范畴,项目选题和资源类型逐步扩展,有的波及多学科知识,有的面向某种具有人文内涵的社会现象,比如对于历史或现实社会议题、人物、事件的语义分析、知识构建等。数字记忆大多以记忆主体为核心,围绕个体或社会群体,涉及大量与人文学术及社会文化现象相关的议题,这就使得二者在所涉范畴上有了重合基础。例如,在全球颇有影响的“威尼斯时光机”项目,旨在利用千年历史档案呈现自公元900年至2000年城市建筑与文化的宏大发展史,“这些庞大的历史资料可能涵盖了100亿个事件”“详细记录了历史上威尼斯城市生活的所有细节”[10],包括政治、经济、金融、贸易、医疗、税务、地理、建筑、航海、市民居住网络与生活等。项目主持人弗雷德里克·卡普兰(Frederic Kaplan)形象地称“威尼斯时光机”将打造一个“中世纪威尼斯Facebook”和“历史倒带纽”。显然,这个典型的数字人文项目大大超出了人文学科范畴,立足“人文”的宽厚之意,同时带有显著的记忆建构性质。与此同时,不少以记忆命名的项目直触人文学科内容,包括地理区划、历史人物、历史事件、历史场景等相关典籍资料的汇聚和分析,如“中国记忆”“佛罗里达记忆”“北京城门”“孔庙”“燕南园”“老舍”等。而每一个记忆项目都饱含人文意象,因为记忆主体都是个体或群体的人,记忆内容都是以人为中心和原点的多方面知识。

(二)数字资源的多样性

无论是数字人文还是数字记忆项目,基础都是资源的数字化汇聚,大多数成果形式为一个库。数字人文项目比较多地围绕主题内容、资源类型展开,比如“中国历代人物传记资料库”主要收集中国历史人物的传记资料,“中国历史地理信息系统”旨在汇总地点和行政区划的空间数据,“民国时期期刊全文数据库”“中国历代墓志数据库”“中国家谱数据库”“中国地方历史文献数据库”“中国数字方志库”等都有特定的学术内容和资源种类。根据项目性质的不同,有些数字人文项目的资源比较广泛,仍以“威尼斯时光机”为例,其资源来自威尼斯档案馆所藏丰富的档案,包括手稿、专著、画作、信函、文件、海量地图等,内容涉及出生和死亡记录、医疗记录、纳税记录、公正记录、专利登记簿、地图、建筑设计图、城市规划方案、旅游导览图及和平条约等。不少数字人文学者认为,从人文计算到数字人文,“进化”的诱因和特征之一就是超越文本的单一性,接受包括网页、影像在内的多种媒介资源的并存与互补。事实上,随着数字环境的复杂化、数字技术和数字信息生产能力的提升,数字人文项目的资源不断趋向多样化和复合化。而数字记忆项目历来需要以来源广泛、媒介多样的资源作为记忆的基础素材和支撑,如“中国记忆”“新加坡记忆”“北京记忆”“记忆四川”等,均为图文声像并用,形式繁多。其中“中国记忆”项目实验网站使用和存储了来自文献机构、民间、现场采集和专题制作的图书、档案、地图、照片、口述、音频、视频等多种记忆资源,这种资源特点恰巧应和了数字人文资源的多元变化趋势。

(三)数字方法的近似性

数字方法是数字资源的点金术,对于数字人文和数字记忆项目莫不如此。按照数字人文创建者之一约翰·昂斯沃斯(John Unsworth)的观点,数字人文的主要范畴是改变人文知识的探索、标注、比较、引用、取样、阐释与呈现。[11]为了实现这些改变,数字人文从资源采集识别到组织分析采用了大量的数字技术和方法,开发了许多实用平台与工具,智能水平不断提升。数字记忆生成、保存、传播的全生命周期都处于数字环境中,包括昂斯沃斯所述范畴在内的各种数字资源处理技术方法都要使用。从以下三个案例中可以大致看出数字记忆项目在资源组织上与数字人文项目的相似路径。

案例之一,芬兰国家集体记忆平台“CultureSampo”把因战争分散的记忆资源汇集整合,划分为67类,以此再现19世纪芬兰的国家集体记忆。在对这些纷繁复杂的资源进行管理时,“CultureSampo”利用包含80万个地理信息的芬兰地理信息注册表、芬兰1865—2007年县域时空本体、人物和机构本体,以及其他一些国际本体,如“艺术家联合名录”(ULAN)等,来定义和解释资源中有关位置、时间、人物和机构的概念及其关系;利用农业、林业、艺术、摄影等领域本体为不同类型的资源进行本体建模,根据本体模型使用18种元数据模型、204个基本属性对所有资源进行著录。最终以270万个三元组的形式将13.4万个记忆资源以及28.5万个相关文化要素(人物、位置、机构、时间等)存入“CultureSampo”知识库,支持“CultureSampo”门户在前端各类应用,包括地图可视化、深度检索、时间轴、传记浏览,等等。[12]

案例之二是浙江省仙居县高迁古村的数字记忆“记忆高迁”。高迁是一个千年古村,资源分散多样,该项目以“前站后库”架构同步建设“记忆高迁”门户网站和“高迁数字资源库”。项目组将采集和制作的大约240G、超过3,500份的数字资源,以文本、图像、音频、视频、三维文件五类格式上传至“高迁数字资源库”,以文献遗产、建筑空间、家族先贤、精神文化、口述采访、数字产品等不同主题分类管理,对所有文本资源进行了人物、位置、时间、事件和实物五类实体标注,形成了高迁古村数字资源实体库,并以关联实体方式对文本资源进行深度标签化,为更深层次的文本挖掘和关联数据开发奠定了基础。对于图像资源、音视频资源等,则以“特色标签”方式增加相关人、地、时、事、物的标注。基于“古村落文化本体”和所有已标注实体,利用protégé软件创建了高迁古村文脉图谱,可视化呈现高迁古村数字资源的历史文化内涵与联系。

案例之三是上海市图书馆的“上海年华”。该项目定位为城市记忆,设有“图片上海”“电影记忆”“上海与世博”“从武康路出发”等板块。为了真实再现上海的历史变迁,“图片上海”发掘和整理上海图书馆馆藏地方文献中的图片资源,对其数字化后,将图片解析成时间、地点、人物、机构、关键词等各类元数据信息,形成各种穿插关联,实现对图片多角度、多层次的解读,并采用图文并茂的形式展示给读者。“从武康路出发”通过AR导览,介绍武康路历史人文建筑信息,这些信息来自上海图书馆的馆藏资源,包括第一手资料和经专家深度加工的专题库、知识库资源,将不可移动的历史文化建筑与文化记忆资源深度整合,具有旅游文化导航功能。上述数字记忆项目的资源汇聚和加工与大多数数字人文项目在目标、原则、方法上的重合性显而易见。

(四)项目成果的复合性

数字人文界对于“伞”或“大帐篷”的形象诠释有很高的认同度,而对于其下究竟罩住了什么则是见仁见智,各有视角。布雷特·博布利“倾向于将材料开放、知识产权、工具开发、数字图书馆、数据挖掘、原生数字资源储存、多媒体出版、可视化、地理信息系统(GIS)、数字重建、技术对多领域影响的研究、教育与学习技术、可持续模式等议题”囊括其中。[13]后来出版的《数字人文争论(2016)》又将“大型图像集可视化、历史文物3D建模、原生数字资源传播、标签行动主义及其分析研究、AR游戏、移动创客空间”扩充进了数字人文的研究对象中。[14]美国国家人文基金会(National Endowment for the Humanities,NEH)设置“数字人文奖项”,近年来重点关注和资助的数字人文方向包括电子出版与编辑、电子文学、沉浸式与虚拟环境、人文领域的计算机游戏与模拟等。[15]张耀铭将国外数字人文项目归纳为GIS历史地理可视化、语料库建设、历史数据库建设、社会及历史场景重建、档案数字化五类;[16]王晓光则归纳为历史地理可视化、文本挖掘与TEI标准、语料库语言学、虚拟实境实现、图像分析与数字重建等六类。[17]相关列举不尽相同,并未引起实质性的争议。

很多数字记忆项目是上述多种形态的混合体。比如“北京记忆”数字资源平台,针对不同的记忆对象和记忆场景分别采用多种方式呈现,包括数字叙事、数字重建、地理信息系统、可视化、3D建模、数据建模、VR/AR、动漫游戏等,同时对原生和再生的数字资源进行存储和整合。如此多种数字人文形态的合成并用,自然使数字记忆与数字人文产生多面重合。

综合上述四个方面,数字记忆在使用数字方法处理多样化的数字资源,实现记忆资源的整合、知识呈现与发掘等方面,与数字人文所追求的提高人文研究效率和深度、变革知识生产方式、带动人类文化认知进阶的深层目的和实现路径具有明显的吻合度。