武陵山区少数民族口述历史数据库的功能与建设

所属栏目: 图书馆学论文 论文作者:/
论文摘要

  1、 引言

  口述历史作为一种独立的历史方法学诞生于 1948 年的美国,随后在世界各国得到了蓬勃发展。20 世纪 90 年代以来,世界各国开始将口述历史数字化项目作为发展互联网文化信息资源的主要策略。1992 年,联合国教科文组织(UNESCO)开始启动“世界的记忆”项目,目的是保存口述历史的记录以及图书馆和档案馆的珍贵文件,在世界范围内推动历史文化的数字化保护。如:“日本记忆”中,日本国立国会图书馆将口述历史文化数字化,建立了口述历史文化数据库,该库基于 UBLIN CORE 格式建成,上载速度快,图像质量优良,说明文字简明扼要,适合大众浏览。

  20 世纪末,口述历史研究波及国内,并日益受到大陆大众媒介和学术界的关注,渐渐取得发展。如:汕头大学图书馆非常注意口述历史资源采集、开发工作,设立了潮汕特藏馆,初步建立了口述历史数据库;2012 年中国国家图书馆也启动了“中国记忆”项目并公开发函,征集非正式出版文献,将口述历史列入征集范围;2012 年 2 月 27 日,中国传媒大学与著名主持人崔永元签署协议,成立口述历史研究中心及口述历史博物馆,并建立口述历史的数字化系统。

  少数民族口述史作为中华民族文化的重要组成部分,是研究少数民族文化不可缺少的资料,具有不可再生性。因此,在研究口述历史这个大框架中,将少数民族作为一个特殊群体剥离出来,运用现代化信息技术建立口述历史数据库是当前少数民族口述历史保存的重要发展趋势,也是目前大环境下图书馆亟待拓展的新领域与热点。

  2、 少数民族口述历史数据库建设目的

  2. 1 挖掘与保存民族口述历史

  在信息化、全球化的时代背景下,少数民族口述史正逐渐失去其传承与发展的土壤,面临着前所未有的生存危机,许多宝贵的口述资源已经失传、或濒临失传。以武陵山区少数民族为例:武陵山区地处湘鄂渝黔四省市的交界处,聚集了以土家族、苗族、侗族等为主体的 30 多个少数民族,有着悠久的历史和灿烂的文化。由于历史原因,该地区少数民族虽有自己的语言体系,却没有自己的文字,因而各民族的历史与文化长期以来都是靠口传身授方式世代流传下来,随着岁月的流逝,致使部分口述资源已经失传、或濒于失传。

  因此,为了及时挖掘与保存濒于失传的少数民族口述史,笔者对武陵山区进行了实地调研。将采访、收集到的口述资料整合并进行数字化处理,建成一个远程搜索、资源丰富的口述历史数据库,从而建立了适应数字时代的少数民族口述历史永久性保护机制。

  2. 2 图书馆特色资源的有力补充

  随着数字化手段在图书馆的深入应用和图书馆对地方文献开发力度的不断加强,数据库作为以一定方式储存在一起、能为多个用户共享、应用程序彼此独立的数据集合,以其显著的优势和特征在图书馆管理中得到广泛的应用。目前,我国许多具有馆藏特色的大学图书馆先后建立了一批特色数据库。比如:中国农业大学图书馆的“棉花文献数据库”、西南民族大学图书馆的“羌族文献信息资源数据库”等,这些专题数据库都实现了全文检索及浏览等功能。

  随着全国特色数据库建设的大力开展,吉首大学作为武陵山区唯一一所具有地方性、民族性特色的综合性大学,在武陵山区少数民族信息资源建设中起着核心和主导作用。

  吉首大学图书馆自 1959 年建馆以来,一直致力于民族文献的收藏,已经形成了以民族学、地方文献、口述历史等为特色的馆藏体系。相继建立了“民族地方文献信息中心”、“民族文化博物馆”、“沈从文专题数据库”

  等信息资源中心,收藏有武陵山区少数民族地方文献和其他民族文献近 20000册。利用这些信息资源建立武陵山区少数民族口述历史数据库,将会大大提高文献使用效率,是对图书馆馆藏特色资源的有力补充。同时,也为少数民族地区经济、科研、旅游、文化等方面提供重要而独具特色的文献资源。

  2. 3 形成项目研究重要支撑

  吉首大学图书馆拥有一支学科背景合理、专业技术强、学历层次高的优秀人才队伍,先后获得 4 项国家社科基金课题立项,居全国图书馆前列;获得 16 项省级课题,位列湖南省内图书馆之首,其地方民族研究方向尤为突出。

  2011 年吉首大学图书馆少数民族口述历史研究,获教育部人文社会科学研究青年基金项目与湖南省高等学校科学研究项目立项。项目组将以武陵山区少数民族口述资源为主要研究对象,在充分调查研究的基础上,剖析影响少数民族口述历史挖掘和保存的各种因素,并提出了相应的措施,规划新的分析模型,构建出一套科学可行的少数民族口述历史资源挖掘和永久保存方法体系,建立武陵山区少数民族口述历史数据库。

  3 武陵山区少数民族口述历史数据库的功能与建设思路

  武陵山区少数民族口述历史数据库将遵循实用性、安全性、规范性、可扩展性和开放性等原则。利用数字存储、多媒体等先进技术,将各民族的语言、风俗习惯等口述资源用数字化的形式进行保存,从而推动少数民族口述资源的传播利用,促进少数民族地区经济的快速发展。

  该数据库下设“论文资源库”、“音视频资源库”、“照片资源”、“传承人物资源库”四个子库,这种分层分级结构设计能系统、完整、真实地记录和再现武陵山区少数民族悠久的口述历史。各子库之间、口述历史资料与其他数字资源库之间能实现关联检索与跨库连接,最终形成数字资源丰富、检索便捷、连接广泛、便于研究的数字系统。这样既能实现全文检索,又能保存“历史记忆”原版风貌,完整地再现少数民族发展轨迹。

  整个系统建设以武陵山区主体少数民族为主,周期分 4期 4 年完成,第一期完成“土家族口述历史”部分建设,第二期完成“苗族口述历史”部分建设,第三期完成“侗族口述历史”部分建设,第四期完成“其它民族口述历史”部分建设。

  经粗略预算,目前武陵山区主体少数民族为土家族、苗族、侗族 3 个,白族等其它民族 20 多个。由于该地区蕴藏的口述资源极其丰富,内容涉及族源族称、历史演变、宗教信仰、音乐舞蹈等各个领域。因此,需要收集的材料必须进行实地调查、深入访谈,再将所形成的相关原始资料,整理成有形的档案才能建立数据库。

  4、 数据库的规划与设计

  武陵山区少数民族口述历史数据库建设技术路线应遵循技术进步、经济效益、社会效益、因地、因时、因人、因事制宜等原则。

  在结合吉首大学图书馆现有硬件设备及各种信息资源平台的基础上,选用稳定、可靠、易扩展的先进技术与产品进行建设。

  在系统建设过程中,选择 Apache 作为网站后台程序运行服务器,Apache 以其迅速的普及和用户接受度的日渐增长,已成为当前最流行的 Web 服务器应用程序。基于其可自定义的模块化架构、可扩展、高效率运行、跨多操作系统平台等优越的性能确保数据在稳定性和安全性上无可挑剔。

  本系统将采用 B/S(浏览器/服务器)模式进行开发。用户无需安装客户端系统软件,免去了繁琐的安装步骤和应用升级的烦恼。用户只需打开浏览器输入网址通过互联网即可访问资源。在此基础上采用“LAMP 黄金组合(是指 Linux操作系统,王牌 Web 服务器 Apache,MySQL 数据库以及脚本语言 PHP”技术来编写后台程序,该技术性能稳定、数据安全、运行速度超快、不涉及版权问题。LAMP 是一种使用相对简单、方便但功能强大的应用服务平台,广泛应用于网站建设、办公自动化、电子政务等 Web 应用系统。

  系统架构与功能实现上,选用 Zend Studio for Eclipse 作为系统开发工具,以 Thinkphp 作为系统开发框架,采用面向组件的 MVC(模型、视图及控制器)三层架构,在快速有效开发的同时,实现用户界面与用户交互的控制以及数据存取的分离,使系统具有安全性高、易维护、可扩展等特性。系统还为网站的访问做 SEO 优化和缓存优化,基于 Thinkphp 的页面静态化效果,有利于网站的推广和宣传,其页面自动缓存更是提高了系统的访问速度。

  5、 系统架构

  5. 1 总体结构

  在信息服务的方式上,本系统为了满足不同人群日益增长的信息获取、信息处理及传递的需要,通过 B/S 模式即可快速访问武陵山区少数民族口述历史数据库。从资源建设方面,整个系统可分为资源采集、资源分类展示、资源统计、系统管理及资源信息检索平台等五个部分组成。

  5. 2 资源采集

  信息加工处理系统主要实现对不同来源、不同类型(纸质文献、照片、录音、视频等)的少数民族口述历史资料进行数字化收集,资源采集功能包括资源信息的添加、编辑及删除。根据资源的属性分别填写标题、简介、来源、关键字及主题内容等元素,其中包括多媒体文件的上传与数据处理,图片上传允许单图上传缩略图、多图同时上传,采用 AJAX 异步处理,这种无刷新的形式提高了采集效率。此外,还可上传各种格式(包括 SWF、FLV、MP3、WAV、AVI、MPG、MP4 等多数主流媒体格式)的音视频文件,上传之后以 HTML 格式保存在数据库中,前台页面即可直接在线播放影音视频。

  5. 3 数据分类展示

  根据“论文资源库”、“音视频资源库”、“照片资源”、“传承人物资源库”四个子库的类型作为前台页面资源展示的类别,每个类别中将根据该分类的类型从数据库中查找出符合条件的资源,再以列表的形式分页展示,列表页主要显示资源的标题、简介、缩略图等,依据资源类型的不同而造成页面展示效果也不尽相同。论文以文字简介辅以图片做导向;照片则以瀑布流的形式通过 AJAX 动态增加页面数据,极大提高的数据预览的协和度与亲和度;详细内容页则以较大篇幅进行资源信息的详细显示,页面设计简单、整洁,阅读起来感觉会很舒适。通过 JavaScript 控制页面内容不可复制,这保证了文档数据的安全性,使其不会轻易的被非法利用。

  5. 4 资源统计

  对数据库中收集的资源信息可以根据分类进行数量统计、点击量统计等。所有统计工作由程序后台自动完成,管理员只要选择统计条件即可,选择相关操作后,即可自动生成各类报表数据和统计报告。实现统计数据的电子一体化操作,可生成折线图、竖状图、饼状图等报表图像,并可以将数据批量导出。

  5. 5 系统管理

  包括有资源库类型管理、资源库设置、网站信息配置、管理员权限管理等,实现资源库展示类型自由转换,展示类型包括论文形式、瀑布流形式、音视频形式。资源库设置可设定首页导航栏中各个子库的显示状态及其显示排序值。网站可配置站点的名称、简要介绍、网站备案信息及联系信息等。管理员权限管理是超级管理员才拥有的功能,超级管理可以对网站的所有管理员信息进行添加、编辑、删除等操作。

  5. 6 资源信息检索

  资源信息检索主要包括口述历史资料的展示及资源检索两个功能。当用户访问武陵山区少数民族口述历史数据库时,系统会自动向用户展示一部分热门的搜索数据结果列表,同时用户可以通过搜索输入框和搜索限制关联条件进行联动查询,系统会将符合条件的结果更新到列表中。

  口述历史资源检索提供多种检索手段,实现对资源内容、类型、时间、来源等信息的组合检索,并可对检索内容进行二次检索,支持近似查找及关联查找,浏览器版提供网页内容的检索。

  6、 数据库的亮点与特色

  吉首大学图书馆少数民族口述历史研究项目组选择了容易被学术界忽视却又实际意义重大的少数民族口述历史资源作为建库对象,解决了适合武陵山区域中口述历史资源挖掘和保存的核心问题,其特色主要体现在以下几个方面:

  6. 1 民族历史的再现

  将武陵山区少数民族的语言、服饰、手工技艺、音乐与舞蹈等口述资源展现的淋漓尽致,为我们提供了原生态的的历史文化信息,完整的再现了民族发展轨迹。该数据库采用彩色扫描方式对收集到的口述资料进行数字化处理,能快速、真实的将图片、录音、视频等加工成数字资源格式,通过模拟纸本版式使读者可以欣赏到原汁原味电子版的少数民族口述资源。为少数民族口述历史数字化采集、组织、传播、展示等活动提供了广阔的平台,提升了少数民族口述历史数字化保护工作的整体水平。

  6. 2 个性化的推荐平台

  系统本着“以用户为中心”的原则,利用读者注册的个人信息、访问系统的历史信息,结合系统中的热门信息以及系统新发布信息,使用聚类、系统过滤等相关技术,为每位读者推荐其最感兴趣、最新、最关注的口述历史资料。此外,系统还提供智能检索、分类表辅助检索、多知识点链接检索等功能,让读者在面对大量类型各异的资料时,能够得心应手,顺利获取所需信息,真正地拥有自己的信息检索平台。

  武陵山区少数民族口述历史数据库是采用数字方式,整理加工少数民族口述历史资源,并通过网络传播的数字资源信息系统。它借鉴并吸取了其他图书馆特色数据库建设的方法和思路,并结合少数民族地方特色,采用当前口述历史研究主流方法,建立了武陵山区少数民族口述历史资源管理系统。通过该数据库的建设,可以更系统、更完整、更真实地记录和再现武陵山区少数民族悠久的历史文化,对我国口述历史数字化的发展,对少数民族口述历史文化的保护、开发都具有重要的理论价值和实践意义。

  参考文献:
  1. 张志清. 日本国立国会图书馆的古籍建设和服务. [2011 - 11- 26].
  2. 刘晓莉. 图书馆开展口述历史工作的意义及其方法. 图书馆论坛,2005(4):59 -61
  3. 朱玲. 国家图书馆启动“中国记忆”工程.[2012 - 02 - 25].
  4. 宋宇. 中国传媒大学成立口述历史博物馆. [2011 - 02 - 29].http
  5. 彭燕,朱慧玲. 少数民族口述历史的挖掘与数字化保存模式研究———以武陵山区土家族为例. 图书馆学研究,2012(10):43 -49.
  6. 张筠. 名人专题数据库建设的理论与实践探索. 吉首大学学报,2012(1):150 -152.
  7. 王尧,黎黎. 高校图书馆在学校转型中的定位与策略 - 以吉首大学图书馆为例. 图书馆学刊,2013(11):22 -24.

'); })();