历史档案文本转化中众包的实施模式研究

研究论文代写 本研究论文分为两条研究主线,第一条,通过国外档案馆、图书馆众包项目实施的相关案例,总结和提炼出国外众包项目实施的成功经验,给予我国档案馆众包项目提供理论研究基础;第二条,笔者基于对上海市盛宣怀图书馆众包项目实施情况和广东省档案馆未来引入众包项目的情况进行了实地调研。

研究论文代写
研究论文代写

专业:

硕士生:

指导教师:

摘  要

       历史档案文本转化将纸质档案转化为数字形式的文本,比如Docx、Text格式,将历史档案转化为文本,可以保证档案使用的安全性,通过档案的数字化处理后,防止了档案被不怀好意者肆意篡改。但历史档案转化为文本之后会出现不能编辑,不能方便识别等问题。不仅如此,档案馆的历史档案数量浩如烟海,想要通过档案馆自身进行历史档案的整理需要消耗极大的人力资源。正是基于这种背景下,笔者提出了一种新模式的解决途径,在历史档案文本转化后,可以入众包的概念。通过众包模式的建立,极大的“扩充”档案馆的劳动力数量,有效的解决档案馆在整理历史档案中人力数量不足的问题。研究论文代写

此外,笔者调研大量国内外文献了解到,目前众包的概念被引入到许多领域,比如考古学、历史学、档案学等领域,但因众包概念的新颖化,导致各国在引入众包时出现了成果的参差不齐,有的众包项目成功了,有的众包项目实施效果不够理想,原因在于并没有一套基于历史档案文本转化的众包模式,对于如何建设一套可行性强的众包模式,国内开展的研究极少。本文采用了采访法和案例分析法,在研究国内外和实际调研的基础上,提出了基于历史档案文本转化引入众包概念,分别分别从三大主体要素(接包方发包方平台)入手,并包含了众包模式任务设计、众包模式激励机制设计、众包模式质量审核机制设计、众包模式反馈设计等五个环节,系统完整的提出了基于档案馆历史文本转化的众包模式设计思路。

         本研究论文分为两条研究主线,第一条,通过国外档案馆、图书馆众包项目实施的相关案例,总结和提炼出国外众包项目实施的成功经验给予我国档案馆众包项目提供理论研究基础;第二条,笔者基于对上海市盛宣怀图书馆众包项目实施情况和广东省档案馆未来引众包项目的情况进行了实地调研。

本研究论文分为六部分,第一部分,绪论——主要是对研究课题的背景范畴目的意义内容技术路线进行了解释和阐述,以及本论文各章节内容概况和课题研究的创新之处;第二部分,国内外学者关于众包的研究综述——主要包括众包概念的提出和界定,众包模式的定义和应用情况以及众包引入档案学中学者的研究综述和经验不足;第三部分,历史档案文本转化引入众包模式的可行性与必要性,以广东省档案馆未来引入众包项目的实际调研结果为例,分别从政策层面、技术层面、人力层面、执行层面分析历史档案文本转化引入众包模式的必要性与可行性。研究论文代写

第四部分,国内外档案、图书馆的部分历史档案文本引入众包概念的调查分析案例——以美国、英国、荷兰、芬兰和澳大利亚、档案、图书馆众包项目以及上海市图书馆盛怀档案众包项目为案例为基础,分析它们在众包项目实施过程中不同环节,为笔者提出设计我国众包模式提供理论基础;第五部分,基于研究结果提出我国历史档案文本转化引入众包模式的设计——分别三大要素主体(接包方发包方平台)入手,并包含了众包模式任务设计、众包模式激励机制设计、众包模式质量审核机制设计、众包模式反馈设计等五个环节第一次完整系统化的设计符合国国情的档案馆历史档案文本转化的众包模式;第六部分,我国档案馆未来实施众包模式的展望——从政策维度、经济维度、技术维度、人力资源维度等四方面维度提出我国档案馆未来实施众包模式的展望。

关键词:众包模式设计;历史档案文本转化;众包概念;档案馆

 

Research on the Implementation Mode of Crowdsourcing in the Transformation of Historical Archives

Major:

Master Student:

Supervisor:

Abstract

Historical archive text conversion is the conversion of paper files into digital form of text, such as Docx, Text format.

The conversion of historical files can ensure the safety and security in the use of files into text. Digital processing of files had to prevent files from being ignored the compassionate person is prepared to tamper with it. However, after the historical archive is converted into text, there will be problems such as not being editable and not easy to identify.

Not only that the archives have a vast array of historical archives, and it does get a lot of human resources to organize historical archives through the archives themselves.

It is based on this background that the author proposes a new mode of solution, which can introduce the concept of crowdsourcing after the transformation of historical archives. Through the establishment of the crowdsourcing model, the number of labors in the archives is greatly expanded. The problem of insufficient manpower in the archives is effectively solved.研究论文代写

In addition, the author has researched a large number of domestic and foreign literatures and learned that the concept of Crowdsourcing has been introduced in many fields, such as archaeology, history, archival science, etc., but because of the novelization of crowdsourcing concepts, countries have introduced Crowdsourcing. There have been mixed results, some crowdsourcing projects have been successful, and some crowdsourcing projects have not achieved satisfactory results because there is no crowdsourcing model based on the transformation of historical archives. The crowdsourcing model has few studies carried out in China.

This paper adopts the interview method and the case analysis method.

Based on the research at home and abroad and the actual research,this paper proposes the concept of crowdsourcing based on the transformation of historical archives text, which is respectively from the three main elements (subcontractor, contractor, platform). Start with, including the crowdsourcing mode task design, Crowdsourcing mode incentive mechanism designcrowdsourcing mode quality review mechanism design, crowdsourcing mode feedback design, etc., the system completes the Crowdsourcing based on the historical text conversion of the archives pattern design ideas.研究论文代写

 

This research paper is divided into 2 main lines of research. The first article, through the relevant cases of foreign archives and library crowdsourcing projects, summarizes and defines the successful experience of the implementation of foreign crowdsourcing projects, and provides the crowdsourcing project of the archives of China. The basis of theoretical research; Article 2, based on the implementation of the crowdsourcing project of Shanghai Sheng Xuanhuai Library and the introduction of crowdsourcing projects in Guangdong Province Archives in the future and conducted on-the-spot investigation.

 

This research paper is structured in six parts.

The first part, the introduction, mainly explains and develops the background, scope, purpose, content, technical route and significance of the research topic, as well as the content of each chapter of the thesis and the innovation of the research.

The second part is a review of research on crowdsourcing by domestic and foreign scholars. It mainly includes the formulation and definition of crowdsourcing concept, the definition and application of crowdsourcing model, and the research and lack of experience of crowdsourcing scholars.研究论文代写

The third part, the feasibility and necessity of introducing the crowdsourcing model into the transformation of historical archives, takes the actual survey results of the Guangdong Provincial Archives’ introduction of crowdsourcing projects in the future as examples, from the policy level, technical level, management level and implementation level. It analyzes the necessity and feasibility of introducing the crowdsourcing model into the transformation of historical archive texts.

The fourth part is the investigation and analysis of the concept of crowdsourcing in some historical archives of archives and libraries at home and abroad. The United States, the United Kingdom, the Netherlands, Finland and Australia, archives, library crowdsourcing projects and the Shanghai Library Sheng Xuanhuai file. Crowdsourcing projects are based on cases, analyzing their different links in the implementation process of crowdsourcing projects, and have provided the theoretical basis for the author to propose the design of China’s crowdsourcing model.

The fifth part, based on the research results, proposes the transformation of Chinese historical archives into crowdsourcing mode. The design – the three main elements (including the package party, the contractor, the platform), and includes the crowdsourcing mode task design, crowdsourcing mode incentive mechanism design, crowdsourcing mode quality review mechanism design, crowdsourcing mode feedback design In the five links, the first complete systematic design conforms to the crowdsourcing model of the transformation of the historical archives of archives in China’s national conditions;研究论文代写

the sixth part is the prospect of the future implementation of the crowdsourcing model in China’s archives – from the policy dimension to the economic dimension Four dimensions of technology dimension and human resource dimension, the future of China’s archives Looking packet mode of public facilities.

Keywords: Crowdsourcing Model Design; Historical Archive Text Conversion; Crowdsourcing Concept; Archives

 

目录

1 绪论 7

1.1研究背景 7

1.2研究范畴 8

1.3研究目的 8

1.4 研究意义 9

1.5研究内容 9

1.6技术路线 9

1.7各章节内容概况 10

1.8研究方法 11

1.9创新之处 12

  1. 国内外学者关于“众包”的研究综述 14

2.1众包概念的提出和界定 14

2.2众包模式的定义和应用 16

2.3众包在档案学的研究综述 17

2.4国内外档案众包的研究不足 22

  1. 我国引入众包模式的可行性与必要性 23

3.1我国开展众包项目的优先案例 25

3.2档案馆开展众包项目的可行性 26

  1. 国内外档案、图书馆的部分历史档案文本引入众包概念的调查分析案例 30

4.1案例介绍 30

4.2档案众包项目开展过程中存在的问题 32

  1. 基于调研的档案众包实施模式设计 35

图1 历史档案众包模式主体要素 37

图2历史档案众包文本转化众包模式设计图 37

5.1任务设计 37

5.2要素主体之一——接包方 40

5.3要素主体之二——发包方 43

5.4要素主体之三——平台 45

5.5 众包模式中,各主体要素与任务设计的关系 49

6.我国实施档案众包模式的未来展望 51

6.1法规政策 51

6.2 专项经费 53

6.3科学技术 54

6.4人才培养 56

7.结语 57

8.参考文献 59

附录1上海图书馆盛宣怀档案项目访谈实录 65

A.平台建设方面 65

B.团队建设方面 66

C.项目开展原因 66

D.任务设计方面 66

附录2:广东省档案馆访谈实录 69

A 馆内数字化情况 69

B 开展众包可行性 69

C 开展众包必要性 69

D 任务选择 69

E 平台建设 70

F 激励机制 70

G 质量机制 70

H 开展众包建议 70

 

1 绪论

     2006年6月,美国《连线》杂志的月刊上,该杂志的记者Jeff Howe首次提出了众包(Crowsourcing)的概念。之后,Howe指出,众包主要指一个公司或机构将过去需要员工执行的人任务,以自由自愿的形式外包给非特定(通常是大型的)大众志愿者的做法。基于众包概念,笔者进行了文献研究和调研,提出了基于历史档案文本转化的众包模式研究,以下是对研究课题的背景范畴目的意义内容技术路线进行了解释和阐述,以及本论文各章节内容概况研究方法和课题研究的创新之处。研究论文代写

1.1研究背景

不同的历史档案记录着不同国家文化的发展与传承,这些都系统的反映我国古代社会的文明成就,是我国文化的传统物质体现.历史档案是档案学研究中重要的研究对象,涵盖史、经、哲、文等多领域,它为中国古今政治文化发展和有效传承提供了有力的数据资料。如何有效的整理这些历史档案是档案馆人员工作的一部分。根据2015年我国档案馆档案局的统计数据了解到,各级档案馆行政管理部门和综合档案馆共有专职人员49109人,我国各级档案行政管理部门3077个.以我国第一历史档案馆的数据为例,它是国家档案局下属的一个文化事业单位,馆藏的明清档案共计1000余万件, 其比值为4.9:1000,档案馆人力资源与历史档案的比值差距是不可能保证历史档案整理工作高效完成的。其次,在互联网信息时代下,大众习惯于在网上检索各类信息,建立历史档案文本数据库将满足大众对档案信息的检索和查阅。最后,笔者进行关于档案馆文本转化众包模式文献的查阅,在查阅过程中,发现国内外对于众包项目实施案例研究较多,但是对于众包模式制定缺少研究。基于此背景,笔者提出通过入众包概念,并设计切合我国国情的众包模式,以此将历史档案整理工作变成“全民参与”的工作,节省档案馆的人力资源。通过“众包”模式的设计为历史档案大量的文本转化提供了新的思路思维工具。

1.2研究范畴

       古希腊哲学家亚里士多德在《范畴篇》中,论述了事物实体数量性质关系场所时间姿势状态动作承受等所有十大基本方。论文以历史档案文本为范畴,进入众包概念,并针对国内外图书档案馆众包项目案例来加以分析,结合我国国情,提出基于历史档案文本转化的众包模式设计思路,并对于未来我国档案馆引入众包,提出了建设性的意见与期望。

1.3研究目的

通过在历史档案文本转化中进入众包概念,并提出符合我国国情的众包模式构建设计,从档案学事业管理研究方面,帮助我国档案工作人员提升历史档案整理速度;有效降低我国档案馆人力资源成本;在档案学基础理论研究方面,笔者查阅大量文献了解到,目前我国并没有一套完整的基于历史档案文本转化众包模式,本众包模式建构设计的提出就是为了填补这一空白,帮助未来档案学学者研究历史档案文本转化提供理论数据。在档案资源管理与开发研究方面,众包模式建构设计的提出,帮助档案工作者提升档案信息选择加工编辑和输出的效率,为档案使用者提供高效率服务。研究论文代写

1.4 研究意义

    研究论文的意义分为两部分,一部分为理论意义,通过对于历史档案文本转化的众包模式研究,可以帮档案学研究者针对于历史档案文本转化提供新的研究思路;一部分为实践意义,通过对于历史档案文本转化的众包模式研究,可以把档案馆目前不完善的众包模式补充完整,从而进一步推动历史档案的整体工作,帮助档案馆的工作人员减轻负重的工作任务和压力。

1.5研究内容

I.通过对国内外引入众包项目的研究,提出基于档案馆历史档案文本转化,并符合我国国情众包模式的构建设计

II.将众包模式的构建设计运用于档案馆历史档案文本数据整理中

III.探讨该模式构建的优点(节省档案馆大量人力物力资源,提升档案馆历史档案整理效率,有利于增加大众对于档案的兴趣,促进发包方接包方和专家学者的交流互动),并指出该模式构建的适用领域(本模式构建具有高效化数据化的特点,尤其适用于档案馆与图书馆的历史档案文本转化)

IV.针对于众包模式建构设计,提出我国档案馆引入众包模式的建议和期望。研究论文代写

1.6技术路线

    本文采用的技术路线图如下:

0

1.7各章节内容概况

本文主要分为以下六个章节:

  • 第一章节:绪论——主要是对研究课题的背景范畴目的意义内容技术路线进行了解释和阐述,以及本论文各章节内容概况和课题研究的创新之处。
  • 二章节:国内外学者关于众包的研究综述——主要包括“众包”概念的提出和界定,众包模式的定义和应用以及众包引入档案学中学者的研究综述和经验不足。
  • 三章节:历史档案文本转化引入众包模式的可行性与必要性,以广东省档案馆未来引入众包项目的实际调研结果为例,分别从政策层面、技术层面、人力层面、执行层面分析历史档案文本转化引入众包模式的必要性与可行性。
  • 四章节:国内外档案、图书馆的部分历史档案文本引入众包概念的调查分析案例——以美国、英国、荷兰、芬兰和澳大利亚、档案、图书馆众包项目以及上海市图书馆盛宣怀档案众包项目为案例为基础,分析它们在众包项目实施过程中不同环节,为笔者提出设计我国众包模式提供理论基础
  • 第五章节:基于研究结果提出我国历史档案文本转化引入“众包”模式的设计——分别三大要素主体(接包方发包方平台)入手,并包含了众包模式任务设计、众包模式激励机制设计、众包模式质量审核机制设计、众包模式反馈设计等五个环节第一次完整系统化的设计符合国国情的档案馆历史档案文本转化的众包模式
  • 六章节:我国档案馆未来实施众包模式的展望——从政策维度、经济维度、技术维度、人力资源维度等四方面维度提出我国档案馆未来实施众包模式的展望。研究论文代写
1.8研究方法
  • 文献研究方法:通过查阅大量的国内外文献,历史档案文本转化引入众包有了深刻的了解系统地研究了众包概念内涵和外延,众包在国内外档案馆引用的案例,众包引用对于档案学研究的影响,历史档案文本整理的方式和途径,为本论文的研究课题提出和制定提供了理论基础。
  • 网络调查法:综合各种搜索引擎查找、获取众包研究模式、案例等资料,为基于我国国情的档案馆历史档案文本转化过程中,构建众包模式设计提供借鉴和参考价值。
  • 访谈法:国档案馆历史档案文本转是否有必要引众包?国档案馆能否引众包?在档案馆众包项目实施过程中又需要注意哪些关键性步骤?本论文运用访谈法对这些问题进行调查,得出了我国档案馆在历史档案文本转化中引入众包的必要性,通过深入了解我国档案馆工作者和档案学专家对这些问题的意见,为提出众包模式构建设计提供了研究数据。
  • 观察法观察法是指研究者根据一定的研究目的、研究提纲和观察表,用自身的感官和辅助工具去直接观察被研究对象,从而获得资料的一种方式。观察的好处是目的性、计划性、系统性和可重复性,文主要是通过观察国内第一个(上海盛宣怀图书馆众包项目实施)案例,了解国内的档案馆实施了众包项目取得的实践经验和部分成果以及遇到的问题。研究论文代写
1.9创新之处

课题研究的创新之处:

  • 研究内容创新:历史档案文本转化引入众包概念,虽然已经被世界上很多国家进行采用和应用,但都没有针对于历史档案文本转化构建众包模式,这对于档案学的研究是一个新的领域,不仅如此,本研究论文也提出了一套基于我国档案馆历史档案文本转化,引入众包的模式构建设计,本文在国家相关政策方针对支持“大众创业,万众创新”政策指引下与广东省档案馆目前遇到的难题下,详细的分析了我国档案馆历史档案文本转化引入众包概念,实施众包模式的必要性与可行性。通过对先行实施档案众包项目的上海市盛宣怀图书馆采访调研构建设计出符合国国情的历史档案文本转化的众包模式日后我国档案馆历史档案文本转化引入众包提供理论研究基础。

 

  • 研究方法创新:传统的档案学被称之为纯人文学科。因此,传统的档案学研究方法一般采用历史性研究方法,比如调查法历史比较法研究论文不仅运用了传统的研究方法,还应用了采访法与文献比较法,提出了我国档案馆历史档案文本转化引入众包模式实践的可行性和必要性。不仅如此,为设计出基于符合我国特定国情的档案馆历史档案文本转化的众包模式设计构建奠定了基础。

 

  • 填补了档案学应用研究的理论空白:根据文献资料和采访调研笔者了解到了外档案馆开展众包项目的具体情况和实施成果。但笔者发现,目前并没有人基于历史档案文本转化引入众包概念,构建一套完整的众包模式设计的研究。本文在现有研究理论成果的基础之上,提出了基于我国国情的众包模式构建设计,分别是众包模式任务设计众包模式激励机制设计众包模式质量管理机制设计众包模式反馈机制设计等五个环节的设计,构建了一套完整的众包模式设计。并为我国档案馆未来实施众包模式提出了建设性的意见。

 

  • 选择一手研究资料本论文采用了上海盛宣怀图书馆和广东档案馆的一手研究资料,采用一手为研究对象可以保证研究的结果更加真实准确。同时,提升论文研究课题的价值。研究论文代写

 

2. 国内外学者关于“众包”的研究综述

         国内外学者关于众包的研究综述——主要包括众包概念的提出和界定,众包模式的定义和应用以及众包引入档案学中学者的研究综述和经验不足。

2.1众包概念的提出和界定
2.1.1众包概念的提出

    概念是抽象的普遍的想法,是充当指明实体事实或关系的范畴或类的实体。概念具有外延和和内涵。概念的外延是指所有在这个概念中的事物,众包概念的外延,众包概念的外延是包含众包这个概念中的事物,比如概念的内涵包括所有一个组成该概念的事物的特性和关系。众包概念的内涵也非常丰富,所欲组成这个概念事物的特性和关系,比如发包方中介机构接包方)

    众包(crowdsourcing)是在2005年混合群众(crowd)和外包(outsourcing)的词义而产生的混合词。目前,该词,还没有统一的中文译名相对应,有人称为众包,也有人称为群包,但笔者认为称为众包似乎更为恰当一些。2006年6月,美国《连线》杂志的月刊上,该杂志的记者Jeff Howe首次提出了众包(Crowsourcing)的概念。之后,Howe指出,众包主要指一个公司或机构将过去需要员工执行的人任务,以自由自愿的形式外包给非特定(通常是大型的)大众志愿者的做法,他透露,人群不仅仅是明智的,而且才华横溢富有创造力。Howe强调了众包 的两个典型特征,一是广泛性,由专业人士和爱好者组成;二是低报酬,促使行业机构节省成本2012年,Estellés-Arolas和González-Ladrónde-Guevara 进一步界定了众包的构成要素,认为严格意义状态下的众包应该包含以下特征: 一是众包面向的对象群体界定清晰;二是众包任务目标明确;三是清晰的酬劳机制;四是实名认证;五是明确对贡献者的报酬;六是参与式的在线分配过程;七是开放征集;八是在线。尽管Ellis 提出众包的用户和媒介不仅仅局限于网络,但网络能最大限度的聚集用户参与,更加容易地完成特定的任务。众包和通过互联网控制,这些组织可以利用志愿者员大军的创意和能力,这些志愿者员工具备完成任务的技能,愿意利用业余的工作时间,满足对服务收取一点报酬,目的在于未来获得更多的报酬的前景。另外一种情况,众包可以通过业余人士或者志愿者利用它们的空余时间提供解决方案,或者让专家或小型企业从无人知晓到初具规模。众包的核心思想是“集思广益”,利用群众的集体智慧和力量完成个人或机构无法或难以完成的任务。通过其互联网技术,以最低的成本汇聚全体大众的智慧结晶,以独特的优势赢得了各类企业和机构的推崇。众包的参与者可以在任何时间任何地点参与平台并且完成任务。 研究论文代写

2.1.2众包与外包威客的关系

    外包可以被定义为外部资源的战略性使用,以执行传统上由内部员工和资源处理的活动。

    众包与外包的相同点,首先,众包与外包都是网络背景下的产物,利用网络力量突破地理空间限制,降低沟通成本,促使沟通更有效。其次,众包与外包都通过外部获取可用资源来弥补自身资源的缺陷,提升企业运作效率。最后,众包与外包实现了企业或机构组织边界的扩张与企业向外求的创新能力。 众包与外包区别,第一,众包与外包发布的任务属性不同,外包大部分集中资源和时间做自己核心的业务,众包任务并不一定是企业非核心的; 第二,众包与外包的对应关系不同,外包强调一对一,众包更多是一对多;第三,专业化度不同,外包更加强调专业,专业化的外包公司是企业需要选择的,众包强调个体的行为,不一定专业化;第四,外包以合同形式存在,众包更多从外部招募人员参与,具有自愿的特征;第五,外包的生产、销售、人力资源等需要实实在在的进行;众包是完全虚拟的,依托于网络进行。

众包与威客的关系,什么是威客是一个近年来诞生于中国大陆的新名词,主要指一群通过网络平台将自己的知识技能专长经验等等提供给别人并且换取实际的经济收益的人,威客可以是一个特殊的社会群体,并非是一种运营模式,他们赚钱可能是通过众包,也可能是外包形式。威客主要是特质一类人。威客的优势是可以利用大众的智力资本,还可以最大限度的利用民众的体力和意愿。而众包更多的是最大限度的利用大众的智力资本,并非一定可以利用民众的体力和意愿,这取决于众包的模式,是否可以吸引更多的民众进行参与任务中。研究论文代写

2.2众包模式的定义和应用
2.2.1众包模式的定义

    众包模式是基于众包概念出现的,是指一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的,而且通常是大型的大众网络的模式。在这一过程当中,企业需要为贡献者支付少量的报酬,而有时这种共享甚至完全免费。众包模式已经对美国的一些产业产生了颠覆性的影响:一个跨国公司耗费几十美元也无法解决的科研难题,被一个外行人两周的时间内圆满完成,过去要数百美元一张的专业水准图片,现在只要一美元一张就可以买到。众包模式就是基于此,被很多商业机构应用目前国内对档案众包尚未有统一权威定义。针对于档案众包模式的构成要素,郑博(2017)认为它是由档案众包的发起者档案机构、档案众包(一般为网络平台和档案众包的参与者三部分组成,它们具备以下特征,首先,作为档案众包项目发起者的档案机构,将档案众包任务发布到档案众包网络平台上,在众包任务的选择上,发起者会尽量选择大众感兴趣的、专业性不强的内容,能够吸引对众包任务有兴趣的大众利用业余时间参与到档案众包中来;其次,作为档案众包主体的参与者,由于档案众包的非营利性,大众人群参加任务不以获得物质报酬为目的,基于个人的兴趣爱好、获得社会成就感和实现自我价值等动机参与档案众包;再次,档案众包媒介的档案众包平台,档案众包的发起方可以依据众包任务开发网络平台,也可以充分借助第三方平台,在档案众包过程中,大众通过参与自己感兴趣的众包任务获得了成就感和实现了自我价值,从整体上提升了社会的档案意识。研究论文代写

2.2.2众包模式的应用

众包在欧美等发达国家已经逐渐兴起,许多知名企业如全球500强的 Proctor、Gamble和Boeing 等都通过众包模式共同提高自身竞争实力,社会生产模式早已出现在军事、媒体以及创新领域,比如BUSH将其描述为智力放大,被 LEVY称为集体智慧,HIPPEL 将这些分布式的智慧群体命名为创新团体。众包模式也是伴随着网络技术发展出现网络化社会生产,自2006年兴起后,大量出现在媒体和互联网上。这是继知识众包模式和生产众包模式之后,众包模式逐渐扩展到广告、营销和市场调研等领域。

2.3众包在档案学的研究综述

    众包是一种新的商业模式,是指一个公司(机构)将之前员工执行的工作,以自由自愿的形式外包给非特定的大众网络的做法。实际上,企业通过利用网民群体的集体智慧去解决公司的某些核心业务的过程就是众包。随着时代的进步,大众的集体素质都得到了提升,专业与业余的差距越来越小。社会发展为众包产业的发展提供了广泛的人力资源供给基础。互联网用户数量正在急剧上升,如果可以利用网络用户一起来为历史档案数字化处理贡献力量,利用网络大众智慧去解决历史档案数字化处理的难题,多对少转换为多对多,档案数字化的难题迎刃而解。

    众包模式与历史档案处理模式的结合不但有效解决了档案文本化处理的难题,也符合馆藏机构数字化发展和信息化发展的历史趋势。植入众包模式从根本上改变了历史档案文本化处理的传统方式,进一步简化了历史档案文本化处理的过程。引入众包后,将历史档案的影印件打包发布到众包平台上,网络大众在申请获得众包资格后领取任务及任务要求进行下一步的图处理、文本化等后续工作。某种程度上讲,众包模式作为比较新颖的理论,与比较新颖的历史档案数字化整理方法相互结合,具有很大的创新性。基于众包的历史档案数字化处理模式的提出,借助于网络化的优势和大众的集体智慧,加快了历史档案数字化水平的提升。在保护信息安全和版权不被侵犯的基础上,有效改善了历史档案数字化处理模式中的封闭性问题,为进一步充分的挖掘历史档案内部的核心价值提供了强有力的保证。鉴于已有研究有待完善的背景,笔者选择我国历史档案文本转化中众包的实施模式研究为题。本文的研究也将建立在研究者所开展的工作与创造的成果之上,这也他们的开创性研究正是本文的出发点和研究基础所在。研究论文代写

2.3.1档案众包的研究理由

    Scott R. Anderson和Robert B. Allen(2009)运用吉登斯的社会结构理论,从结构论角度说明档案众包是适应时代发展要求的社会结构模式在互联网时代,档案领域的社会结构发生了巨大变化,由档案部门作为唯一的规则制定者转变为普通大众可以参与规则的制定。Tarvo Karberg认为,档案工作者不仅是没有足够的时间,档案工作者不是万能的,不可能了解各行各业的专业知识,这就需要将具有不同专业背景知识的人吸纳到档案工作中来,借用户的知识来服务于档案工作。加小双,安小米(2016)提出参与式数字档案资源建设,档案专业主体通过互联网将档案管理工作的部分权限转让给社会公众个体2015年,谢晓萍、胡燕较早提出了档案众包的概念,档案部门可以通过互联网信息共享平台,为某项需大众力量完成的档案业务,从中组织合适志愿者群体加入,承担不同难度和模块的任务,贡献个人的智慧与资源,使所有参与者形成互利共赢的一项活动。类似提法还有孙洋洋(2015)认为务引入众包,并应用于档案信息资源协同共建,指依托于网络技术,将档案馆信息资源建设的相关业务外包给网络大众,通过扩大开放档案信息资源建设主体的方式实现档案信息资源的丰富化、序化和优化。Max J. Evans(2007)认为当前档案工作的主要矛盾为海量待深层次加工档案与有限的档案工作者的矛盾,解决这一矛盾的关键在于大众充分参与到档案转录、标引等工作中来。

2.3.2档案众包的研究应用

    近年来,其中最著名的是美国公民档案员项目。自2010年出台第一个开放政府计划后,NARA就开始了公民档案员的项目实践,为公民档案员项目设计并开发了专属平台Citizen Archivist Dashboard。公民档案员项目内容主要有:添加标签(Tag)、转录(Transcribe)、历史中心(History Hub)、共享照片(Upload and share your photos)、编辑文章(Edit articles)。文章分析了NARA发挥公众参与模式的,以众包(Crowdsourcing)为方式,以自建网络平台与第三方社交媒体为依托,围绕着公民意识的培养、能力的构建、可持续的实践保障机制以及资源与平台的支撑四个方面进行项目分配。研究论文代写

    档案众包的应用,主要涉及三个实践领域,档案转录、添加档案标引和光学识别校对。档案转录主要是针对历史档案,将这些档案数字化之后纸质档案转化成为扫描图像格式,这些图像格式的档案无法实现档案信息的全文检索。由于计算机网络检索的广泛应用,传统的档案分类法不能满足公众对档案的检索需求,加标签是大众分类法在档案分类上的应用。对于形成时期距离现在较近的纸质档案,将数字化之后形成的图像格式转化成为文本格式,可以借助光学识别技术来实现。但光学识别不能提供百分之百的正确率,这就需要人工对经过光学识别后的档案进行校对,做到与档案原件一致。  

    档案众包应用中,几个关键机制决定着众包”应用的成败。

众包发起模式一般以项目的形式,选择合适的项目对模式开展是否成功非常重要;由于众包过程是基于任务导向的,对于发包方来讲选择什么样的任务和如何分解任务对整个过程具有先导性和决定性意义;众包平台的选择则影响着用户参与的深度和广度;如何有效激励用户参与众包活动,直接影响众包任务的完成质量;众包结果最终目的是要为民所用,选择什么样的质量控制机制保障众包质量同样必不可少。基于这样的认识,主要总结这五个方面的实施机制研究。

第一,项目选择方面,盛芳等(2012)认为众包项目的成功率和许多因素有关,项目本身的新奇性、难度设定、激励手段、大众的兴趣点是影响到大众参与的重要因素,寻找难度小、有趣的、能吸引大众眼球的明星项目能够帮助众包项目成功[31]。谈伟则首先关注了隐私保护问题,众包因为采取的是公开形式发布档案,因而要格外注意发布行为的合法性,涉及国家机密和公众隐私的档案不能成为众包的对象。其次是著作权问题,作为接包方的网民可贡献劳力、智力参与众包,对于网民的智力成果的商业使用,则应格外注意著作权的事宜。研究论文代写

第二,任务选择方面,Oomen J, Aroyo L(2011)将任务分为了文本转换与纠错、情境化、馆藏的补充征集、分类、联合策展、众筹,为方便公众参与进来,应尽量选择难度小的微任务。张卫东(2016)则认为解决档案机构馆藏业务积压状况的众包任务,专业性可能更强,其主要目的并不在于吸引新用户的增加,所以在任务确定时会比较少地考虑难度低和趣味性强的条件

第三,众包平台选择方面,张卫东(2016)根据国外实践经验总结,得出众包平台主要包括专业平台和第三方平台,如博客、Flickr、维基等。他认为档案机构既应该重视利用专业平台吸引档案机构的主要用户,也应该重视与第三方社交平台的合作,他认为档案以加强机构馆藏与用户的互动。

第四,激励机制方面,孙洋洋(2015)分为主要有物质激励和精神激励两种方式,物质激励包括真实货币,虚拟货币、纸支票、礼品卡等,也可将付费馆藏作为回报免费向用户开放,或者提供档案馆纪念品,精神型激励主要是增强众包个体的荣誉感,可通过用户评级的形式展开,参考群决策中赋权重评分的方法。张卫东(2016)认为用户更为注重参与感、使命感、成就感等内在需求的满足,应多采用虚拟积分制、排行榜、游戏闯关等非物质形式的奖励模式。叶绿美(2017)认为档案馆应创造条件为虚拟档案员提供各种培训和指导,使他们不断提高在线服务的能力,同时还应给予虚拟档案员档案开放利用的专享权,可以设立专项奖励或评定相关荣誉,定期评定并在网站或社交媒体上表彰,增强虚拟档案员的身份感与价值感研究论文代写

第五,质量控制方面,目前针对档案众包质量控制的研究较少,Lang, A. S.I.D. and Rio-Ross提出为了有效测试参与众包的工作人员是否认真对档案进行校对,可以在转录的文本中有意地插入错误,以便测试校对人员是否认真完成了他们的工作。主要有裘丽(2017)从众包平台准机制和网络信息安全技术两个方面进行前端控制、参与者和档案工作人员进行中端交互、后端保障则由档案部门采取档案工作者和专家团双审核机制对参与者提交的项目结果审核三个视角阐述档案众包质量全过程管理

谈伟(2014)则认为我国开展档案众包应注意设置科学的激励机制、对众包产生的结果进行质量监管、确保众包项目合法合规等问题。叶绿美(2017)提出了我国档案馆发展档案众包首先应该坚持用户中心的理念,构建在线参与档案事务的模式,提供多维立体的保障。顾丽娅(2015)则强调了档案众包项目的开展,首先需要做的就是寻求行业之间合作,如与数字化公司的合作、与社交媒体的合作,她还指出就我国目前的现状来看,档案众包这一项汇聚社会力量、惠及民生的项目正处于萌芽阶段,若想给档案众包营造良好的发展环境,借助政府力量对事情发展产生事半功倍的结果。综上观点,学者们根据国外成功案例总结出档案众包在我国的开展的经验主要有多利用社交媒体平台,积极设立激励、加强质量监督保障,并且得到政府部分的支撑将执行众包模式。研究论文代写

2.4国内外档案众包的研究不足

档案众包虽然在西方的档案实践领域热度逐渐上升,但理论界对它的研究还处于起步阶段。概括而言,国内外研究呈现以下不足:

(1)有关档案众包的定义及相关理论还没有形成统一的认识。尽管有文献对档案众包的内涵及本质进行了分析,但尚不足以真正支撑档案众包理论,因此目前档案界尚未有权威的档案众包的统一权威定义,更多的是直接套用众包或者参与式档案管理等概念,外延过于宽泛,不利于有效针对档案信息资源这一对象展开研究。总体而言,档案众包是什么、存在哪些类型、其理论基础有哪些等方面的研究,还有待深入。研究论文代写

(2) 由于档案众包在西方档案领域取得一些成功由于档案众包的前提是需要开放档案信息资源,可能会造成不法分子趁机利用档案信息资源为非作歹的局面,形成我在明处,敌在暗处信息不对称的劣势地位。因此需针对档案众包项目的选择展开研究,从而做到合法合规保障档案的保密性和隐私。

(3) 对案例的总结多为大方向思考,缺乏有关档案众包的实施步骤研究。现有对国外档案众包案例的研究中,得出对我国档案众包实施的启示多为大方向性指导类启示,对我国如何开展档案众包实践缺乏操作性指导,有待于对档案众包实施步骤进行具体研究,使理论真正能够更深入指导实践。

(4) 现有的研究方法多以国外案例分析、客位角度分析为主,很少主位角度的分析。案例分析存在两个方面的不足:一是研究方法上都以案例描述为主,至于档案众包对档案机构产生怎样的影响,缺乏经验数据的支持。二是研究角度上都采取客位视角,直接将西方的档案众包模式应用在我国实践,对我国特定文化情境下的档案众包问题缺乏针对性,导致研究结论过于空泛,实践指导意义不强。因此,我们有必要对我国档案馆的档案众包问题做本土化探索和实际需求及可行性分析,从而丰富档案众包的理论,填补研究空白,为日后我国实施档案众包模式铺垫理论基础。

    总的来说,关于档案众包方面的实践,国外档案馆众包项目实施较多。国内关于档案众包模式的项目开展较少,有且仅有尚未成熟的众包模式雏形。相较于国外如火如荼地利用档案众包开展档案信息资源开发和利用,我国档案馆有必要对档案众包引起重视,付诸行动,跟上时代潮流。研究论文代写

3. 我国引入众包模式的可行性与必要性

         历史档案文本转化引入众包模式的可行性与必要性,以广东省档案馆未来引入众包项目实际调研结果为例,分别从政策层面、技术层面、人力层面、执行层面分析历史档案文本转化引入众包模式的必要性与可行性。

I.有助于现代档案馆转型为数字档案馆

         目前,档案馆保存的资料,大多以历史档案为主历史档案的整理过程中,文本形式的档案给档案馆工作人员带来时间成本高,资金消耗大等问题。如何整理和公开浩如烟海的历史档案文本,节约档案馆的各项资源是每一个档案馆需要深思的问题。如果将之转化为数字档案馆,因数字档案馆具有馆藏资源数字化信息检索便捷化等诸多特点。众包模式就为解决这个问题提供了新的思路,它最大的特点是:“集众人之力,完成同一个目标”。通过众包模式的构建,实现档案馆档案整理和档案资源开发挖掘的双重目标有助于现代档案馆快速转型为数字档案馆,与现代化数字时代形成有效接轨。研究论文代写

II.有效缓解目前档案馆的资源不足

        笔者在文献中得到了解,中国除了少数发达地区档案馆的资源相对完备之外,剩余的地区档案馆都出现了人、财、物资源匹配的不足。这就造成了部分档案馆“老气横秋”,缺少活力,极大的造成了档案馆资源的冗余与档案资料利用率严重不足目前中国档案馆存在的现状并不能支撑档案的整理,想要解决如此问题,就需要借助于先进的互联网技术,通过众包项目的开展,吸引众多社会公众参与到档案工作中去,帮助现存的档案馆工作人员完成这些任务。众包模式的应用可以帮助档案馆提供新的理念和工作方式,减少档案馆工作人员压力提升档案馆队伍的整体实力,拓宽档案事业的发展前景。

III.增加公众对历史档案重要性的认知

        兴衰有其原因,衰亡有其教训历史是在另外一个时代发现的、某个时代值得被人们所记录的东西”。历史的作用在于,通过理解过去的社会,增加掌握现在的能力。如何更好的了解历史,阅读历史档案是一种很好的媒介渠道。因此,在中国信息化的发展浪潮中,档案已经不可抗拒的渗透到了社会的不同领域。目前现状是很多公众对于档案工作存在着严重的认知偏误,比如公众对于档案馆了解程度只是停留很粗浅的级别,更别说对于档案的历史价值和挖掘价值,没有多少人有相关的认知和意识。档案馆工作人员就需要不断地吸引档案使用者参与进档案工作中,不断提高公众的参与意识和对档案的深度认知,档案馆和社会公众才能形成良性机制,有利于档案馆和谐有序发展。参与众包项目既可以帮助公众更好地了解档案工作,也可以提升社会全民的档案认知和意识。研究论文代写

IV.历史档案整理工作任务集中繁重

      伴随着国家对于历史档案的重视程度不断提高与公众对于新时代信息数据的新要求,因历史档案专业性强,识别度很低,往往需要经过专业人士的翻译之后才能被公众理解。因此,想要方便公众的使用和查询,需要重新整理,大量的查询业务蜂拥而至,造成了档案馆必须在较短的时间内完成档案整理业务,但档案馆属于政府服务型机构,人数极大不足,工作人员任务过于繁重,导致档案的利用率大大降低,长此以往,则会影响到档案馆工作人员的工作热情,导致服务意识下降,人才进行流失。

3.1我国开展众包项目的优先案例

    站在全球视角下去俯瞰,众包模式在全球范围内改变着不同商品和不同服务的发明方式,生产模式、销售和分配形式,实现了组织实体的相对弱化,而开源和协作成为了现在劳动的新形式Terry Cook这位学者提出了关于档案的种范式,第一档案工作者与社会或社区(即有城市和乡村的真实社会/社区);第二网络空间社会连接的虚拟社会/社区的共建档案这样,由专业档案员鼓励和指导大众参与建档,通过档案馆与用户协同合作共同建立档案信息资源,充分档案信息资源与用户需求的契合度提供了新的机会。为了解中国目前档案馆对于众包模式是否有哪些成功的案例?取得了那些成功的模式,笔者进行了相关调研,发现了上海市盛宣怀图书馆档案众包项目,该项目也是目前中国唯一一家开展众包项目的图书馆案例。

盛宣怀图书馆是上海盛宣怀家族自1850年至1936年间的记录,目前现存档案共计17万余件,类型种类多种多样,其中包含日记、文稿、信札、电报、经济、社会、军事、外交、金融、贸易、教育等各方面档案资料,被称为中国私人档案馆第一藏库,是研究中国近代史的第一手史料宝库。在中文方面,上海盛宣怀图书馆众包已经实施的众包项目,分别为李鸿章写给盛宣怀的与轮船招商局相关的信函4件关汉冶萍总局的账单账册6件通商银行的章程4件,关于溥仪颁布的有关宫廷祭祀的谕旨8件等相关众包项目英文方面有关于中法战争相关的电报5件,中国与外籍员工聘用相关的合同4件。在众包项目流程方面,上海盛宣怀图书馆众包项目主要是通过在自身网站上发布以信函账册章程等抄录的众包任务,吸引历史档案爱好者参与其中,并给予参与者积分贡献奖励为激励手段,在大众完成众包任务之后,相关专家在进行统一的修改和审核任务质量。截至目前为止,已经有很多爱好者参与其中,其中最高的贡献得分为11841分。研究论文代写

3.2档案馆开展众包项目的可行性
3.2.1政策战略层面的支持

         2015年6月11日,国务院正式出台《国务院关于的大力推进大众创业万众创新若干政策措施的意见》【国发(2015)32号】文件,文件指出,推进大众创业,万丈创新是中国的发展动力之源,对于推动经济结构调整、打造发展新引擎、增强发展新动力、走创新驱动发展道路具有重要的战略决策意义。也是稳增长、扩就业、激发亿万群众智慧和创造力,促进社会纵向流动、公平正义的重大举措。文件提出通过开放共享,推动模式的创新,加强创业、创新公共服务资源开放共享,整合利用全球创新、创业资源,实现人才等创业、创新的要素跨地区、跨行业的自由流动,文件的提出为档案行业提供了新的指导意见和部署[56]

        除此之外,2014年9月22日,由中共中央办公厅和国务院办公厅共同印发了《关于加强和改进新形势下档案工作的意见》,它明确提出,面对新形势和新要求下,档案工作还存在一些适应上的不足,主要是一些地区和部门不够重视档案工作,档案机构事业发展的保障条件需要进一步改善,档案收集模式、管理手段、服务机制需要进一步创新,档案干部队伍素质需要进一步提高等指示,意见的提出为档案馆后续开展创新工作提供了理论支撑。除此之外,意见强调中国档案工作者必须积极的运用网络,组织档案工作支援者进行开放档案的编目、关键词的著录和编纂等工作,为档案馆开展众包项目提供了政策战略指导优势。

        除了,中央通过政策战略层面支持和鼓励在行业发展中积极应用创新模式进行尝试和探索,2016年,广东省人民政府发布《广东省人民政府关于印发广东省系统推进全国创新改革试验行动计划的通知》,了解到相关产业可以发展共享经济,拓展产业发展空间,鼓励发展众包众创的支持基于互联网的各类创新方式。档案众包是一种档案工作模式的创新,也是一种借助社会力量开展档案工作的新方式。《全国档案事业发展“十三五”规划纲要》也提出,建立开放档案信息资源社会化共享服务平台,落实数据开放与维护的责任,为档案数据开放指明了方向研究论文代写

        根据广东省档案馆的调研,广东省档案馆中领导把档案数字化的深加工也列入了未来档案工作发展的计划之中,众包也将是他们考虑的一个工作方式。响应政策号召,开展和实施档案众包工作,也是事情档案工作改革和行业创新的一项重要任务,有助于完善档案事业的发展体制。

         根据相关调研显示,目前阶段,中国对于“参与式档案”依然停留在初级的阶段,并非形成常态化和规模化的组织。西方学者特里库克在《四个档案范式——1840年以来西方档案观念与战略的变化》,提出了档案战略变化经历已经四个范式,分别是证据、记忆、认同和社群。现在时代,档案的发展渐渐转向与社群的战略,面对日新月异的发展,在档案工作中,需要寻找到新创新的活力,并且去思考如何有效的发挥公众力量为档案工作发展增添新的势能,思考公众在档案信息资源开发中的参与性与能动性,鼓励多元化的群体参与档案的管理过程。正如特里库克所呼吁的那样,当代档案工作者应该放弃专家的控制权,学会与大众融为一体,利用第三方平台(互联网化),让每个人都成为自己的档案工作者,重新思考档案工作、对社会公众的重塑深刻内涵正是基于此,中国档案文本化众包实施模式的架构也需要奏起时代的变奏曲。

3.2.2技术战略层面的支持

         引进档案众包模式,进行档案文本是目前档案部门改善工作提升效率的一种有效方式,想要实现档案文本的众包模式,离不开科学技术的配合自20世纪90年代北京档案馆建立档案网站之后,各地档案馆也开始建立自己的档案网站。据不完全统计,截至2010年,省市区域各级档案局档案馆档案网站有400余个。

          中国档案馆针对档案众包改进也进行了初期的探索,比如中国辽宁档案局开设的“社会档案人”栏目,它是中国档案馆开展档案众包的雏形,有很强的参考价值。除此之外,以广东省档案馆的众包项目开展的可行性现场调研为例,了解到关于技术层面的OCR识别技术,互联网Web.2.0技术,社交媒体技术也可以支持众包。笔者在调研过程中发现,目前,中国基于众包模式所采用的众包技术是足够的,已经有很多档案馆都具备了众包模式的技术支持,也有很成熟的实践基础。这些在众包模式中所采用的技术支持,也可以把目前档案馆开发的任务外包出去,帮助更多的档案馆实现众包模式的构建。研究论文代写

        目前,中国开展众包模式的技术性已经具备,并且还有很多的实践案例,因此,引入众包模式的时机已经成熟。

3.2.3人力资源战略层面的支持

        以上海图书馆盛宣怀档案众包项目为例,调研发现,众包模式的确是很好的一个路径在互联网的时代背景下,是一种新的试验。不仅如此,目前在人力资源层面众包模式也已经成熟,原因有三,第一,据了解,对于历史档案感兴趣的人还是有的,这其中不乏相关专业的专家学者,可以通过挖掘这些专家学者更高效的完成众包任务;第二,根据中国互联网网络信息中心在北京发布的第42次《中国互联网络发展状况统计报告》(以下简称报告,截至2018年6月30日,中国网民达到8.02亿,如此庞大的人群数量,如果宣传得当,可以发现和找到很多对历史和档案文本众包感兴趣的人群;第三,通过众包系统平台的建构,也可以培训和强大社群的建立,培养出更多对于档案众包模式,感兴趣的人群。

        众包模式的成功在于人数增量,人数增量与众包模式成功成部分正相关关系。目前,中国根据多方位分析,已经具备了众包模式需要的人群基础,从人力资源层面来讲,档案馆开展众包模式也已经具备了最基本的可行性。

3.2.4执行战略层面的支持

        目前上海市图书馆盛宣怀已经成功引进众包模式,并完成了第一期众包项目的建设和执行。上海市图书馆盛宣怀众包模式采用了抄录竞赛的方式,部分低级任务公开的方式,众包模式任务详细的介绍和解释等方式。通过众包模式,上海图书馆盛宣怀确实解决了很多之前档案文本的整理和抄录问题,并且已经有很多的历史档案被公开和整理。但是,在档案众包执行层面,中国的档案馆需要根据自己的实际情况来进行合理有效的选择众包模式和众包任务,这样才可以更加有的放矢的利用互联网平台模式,吸引公众完成不可能档案馆的众包任务。研究论文代写

3.2.5总结

        通过政策战略层面、技术战略层面、人力资源战略层面和执行战略层面等四个层面分别对于中国档案馆开展众包模式可行性进行了了解和探讨,得出如下结论:众包模式和项目是很好的互联网时代的思考模式,也是档案馆一种创新型工作路径。但因其具体实施的情况而言,众包模式依然需要在模式设计上,执行层面效率上,众包任务目的性上做更详细的规划和设计比如具体馆藏采用众包模式进行详细、精确的流程设计,只有这样才可以有效地发挥出众包模式的便利性,帮助档案馆完成模式“创新”的执行和操作。

4. 国内外档案、图书馆的部分历史档案文本引入众包概念的调查分析案例

         国内外档案、图书馆的部分历史档案文本引入众包概念的调查分析案例——以美国、英国、荷兰、芬兰和澳大利亚、档案、图书馆众包项目以及上海市图书馆盛宣怀档案众包项目为案例为基础,分析它们在众包项目实施过程中不同环节,笔者提出设计我国众包模式提供理论基础

4.1案例介绍
4.1.2美国案例

    国外基于众包模式进行的项目有很多,它们大多是通过一定的途径(基本是网路平台)向不特定的公众发出馆藏征集的需求,公众可以根据需要提供的数字化特定资源或者非数字化资源,由图书馆数字化加入到数字馆藏建设中。例如2012年美国推出公民档案员项目Citizen Archivist),通过结合线上和线下方式,公众通过为档案添加标签,转录文件,为历史视频添加标题,编辑维基文章。同时,通过上传和分享档案的方式,为档案增添元数据,使档案信息能够被有效检索和利用。不仅如此,还通过Flicker第三方平台,让公众在线下获取档案资料的数字版本后,上传至Flicker并为图片加入标签,方便公众日后寻找和检索。从2012年到现在,公民已经贡献了数百万个标签,元数据、转录、视频字幕和数字图像。再比如美国的北爱荷华DIY HISTORY”项目,以众包的方式录入美国内战的日记手稿,其中也包括馆藏手写菜谱在内的特藏文献;美国路易斯维大学“Louiseville Leader”数字报纸项目中引入众包模式录入的报纸数字化后图片中包含的文本内容。研究论文代写

4.1.3英国案例 

    为全世界展示第一次世界大战的真实全貌,英国国家档案馆发起的一项“一战日记”众包项目,利用公章的力量深度开发和分享这些珍贵的战争日记档案其中,英国帝国战争博物馆主要为改众包项目提供学术上的指导并引入Zooniverse公司为该项目建设众包平台,提供技术支持该档案众包项目的任务比较简单,即公众通过门户网站阅读战争日记,对页面进行分类并标记每一页的关键信息最后项目的门户网站为参与者提供了一个十分钟的教程,演示了完整的操作流程在进行具体任务时参与者可以在Zooniverse公司构建的虚拟社区Talk上讨论遇到的问题和想法,交流日记中的有趣故事2010年9月,英国伦敦大学院开始进行边沁手稿(Transcribe Bentham)录入项目,该项目是由英国伦敦大学学院(University College London,UCL)的边沁项目组统一管理,主要是发布已拍摄为图片的哲学家杰里米边沁手稿大约6万字的手稿,公众通过浏览边沁手稿的图片,完成人工的录入,该项目已完成46.85%,贡献最大的参与者积分以达到14602分。

4.1.4荷兰与芬兰案例

荷兰的众包参与项目始于2011年,该项目由荷兰阿姆斯特丹档案馆牵头,与专门做数字化的Picturae公司合作共同打造Picturae公司根据阿姆斯特丹档案馆的需求,开发了Velehanden这一众包网站,并对其进行日常维护此外还负责将阿姆斯特丹档案馆馆藏的所有档案进行数字化并上传至Velehanden网站用户可以在该网站首页的Projecten-栏中注册并学习如何参与该众包项目,完成学习之后,用户即可登录该网站对自己感兴趣的档案进行添标签、著录、建立索引等操作。该网站推出了奖励措施,如根据用户参与众包的项目以及完成程度赠送相应积分,积分可供用户兑换自己所需要的档案复制品。在芬兰也有相关的众包模式项目,芬兰国家图书馆的数字报纸项目也是非常成功的一个案例,它为了鼓励公众的参与度,专门请设计公司设计了游戏系统,公众通过OCR识别内容和正确的建立互联或者尽可能快写出OCR待识别的正确内容,该项目进行了8个月,注册用户多达1 09 321人,共完成了8 024 530个纠错微任务。研究论文代写

4.1.5澳大利亚案例
针对于数字报纸项目众包模式中,澳大利亚的案例可谓是直接借鉴的典范,最为典型的当属澳大利亚国家图书馆报纸项目,该项目应用众包模式进行OCR识别内容纠错,并利用此项目,将其经过1803-1954年间没有版权的历史报纸进行了数字化,并经过OCR识别之后为用户提供全文检索,设置了众包用户贡献度排名,采用了类WIKI的方式来允许不同用户对同一内容进行核对性多次等校正。截至2014年10月底,已经有42 226人注册并且完成了纠错工作,超过了1429万篇报纸文章被正确的校队并且纠正,2014年前十个月的纠错量超过了250万行。
4.2档案众包项目开展过程中存在的问题

        纵观所有众包模式,国外的发展更加成熟多变,因为我国档案等特殊的国情,想要实现众包项目或者目前国内已经拥有的众包项目可谓凤毛菱角。但即使这样,依然在上海市图书找到了目前参与档案众包项目的中国原型,虽然它们在具体执行、执行过程和最终效果中依然存在这样那样的不足之处,但面对我国先行引入档案众包项目的图书馆,依然具备相关的研究价值和可借鉴意义。该项目具体呈现出几个特征:第一,关于第三方平台,目前国内并不能找到第三方的合作平台;第二,关于技术问题,众包项目的技术问题,并不是什么明显或者不可攻克的技术难题;第三,众包模式也只是档案文本化的一种有力补充,并非会影响档案馆的正常运营;第四,在文字识别和扫描上,字迹太过于潦草并且还有繁体字的识辨问题,这是一个反复细致的工程;第五,在档案文本化的过程中,抄录难度很大,找不到相关的人来抄录是一个非常大的问题;第六,针对于档案馆来讲,档案文献是一种很多年轻人都不感兴趣的东西,所以都是老年人在操作,就老年人而言,他们的电脑和技术接受比较慢,因此速度和效率并不高第七,目前众包模式中使用很高的OCR校对技术,在这里不太合适,因为成本非常高第八,在激励方面,资金不足是一个很大的挑战研究论文代写

        国外的众包项目精彩纷呈,分别由美国,英国,芬兰和荷兰还有澳大利亚的众包项目,这些项目都呈现几个明显的特点:第一选择众包内容的谨慎性和趣味性,比如英国的边沁书稿是选择一个作家书稿进行众包尝试,避免了因为版权问题引起的纠纷;比如英国档案馆发起的一战日记项目,通过借由所有人对于一战历史的关注和一战历史事件的兴趣,进行全民公开的众包项目。这种方式更多的吸引了公众的对于国际历史事件的参与度,更有利于公众对于宏大历史背景的了解和解读第二在众包项目参与方式的灵活性,比如澳大利亚的数字报纸项目的设计中就专门请特别的设计公司,设计了游戏的环节,让更多的公众在游戏中体验历史的乐趣,很好的完成了众包项目的任务指标;英国档案馆发起的最后制作小视频的环节以及国外给予的用户奖励积分机制和贡献值积分形式第三在众包项目的第三方参与,比如美国档案馆邀请Flicker第三方平台的参与,通过与第三方合作平台的合作,帮助历史档案馆进行历史档案的校队和识别,甚至进行图像的扫描OCR的识别等一系列的新型数字技术的应用,把枯燥无聊的档案录入和档案校对变得有趣生动,并且调动群力共同完成这些项目。第四,在众包模式中的形式多样化,国外的很多众包项目虽然主题风格不同,在进行众包模式尝试中的形式也是多样化,比如芬兰国家图书馆应用OCR识别技术,识别正确的内容,比如荷兰的众包项目,通过登录网站将公众感兴趣的档案进行添加标签,著录和建立索引等操作,比如美国的档案图书馆鼓励公众为档案增加元数据和维基百科的编撰过程,这些都是国外档案的文本数字化众包模式的很好探索。通过这些方式和选择的引用,国外的众包项目精彩纷呈,在很好的进行全民历史知识的普及和参与度基础上,也让公众了解了数字化的众包模式。不仅如此,还帮助了档案馆减轻了人力物力的负担,减少了专家进行具体工作的工作量。因此,通过档案馆的众包理念,国外档案馆和图书馆的对于众包模式的尝试与摸索,取得了令人振奋的显著成果。

4.2.1第三方平台短缺

        在调研中了解到,目前众包项目在国内属于新尝试,不仅如此,例如Flicker这种网站,国内并没有非常成熟的可以发出去抄录的第三方平台。原因如下:第一是技术的问题,因为中文的档案设计历史跨度比较大,会出现不同的字体和识别难度,比如个人手写体,比如年代久远的繁体字,比如涉及到历史事件背景的资料,这其中更多还是解读和破译的过程,需要具备更多的历史学、档案学、考古学、人类学、化学、文字识别和机器分析、应用语言学等专业人才配合,这些知识并不是一个第三方的平台可以轻而易举做到的;其次,为何西方会出现一些第三方平台,原因可能和文字有关,因为西方使用的语言是英文,英文的识别度和分析度都比较低,但相对汉字来讲,它的实用度和分析度要高出很多。所以,看似简单的抄录其实背后有一系列的系统指导,这可能就是国内第三方平台没有的原因。研究论文代写

4.2.2公众参与度严重不足

         在调研中了解到,虽然众包模式在国外已经发展起来了,并且越来越成型,但是对国内来讲,目前这个众包平台依然是一个小众化的平台,针对一些特殊的群体爱好者,人数参与少, 众包模式就不能发挥最大的威力。原因如下:第一,现在是一个科技和商业的时代,所有人都在喜欢实实在在的利益驱动或者发展驱动,但档案馆的众包模式,更多的是对于历史事件和历史爱好者,传统的老年人居多;第二,现在有很多的宣传和广告都是一些新型的价值观和文化理念,可是档案馆的宣传和推广目前很多的人觉得就是一个服务机构和公众机构,无需宣传,这一点错误的认知也是公众参与力度不足的原因;第三,经济的考量,作为一个服务机构并非与商业机构一样,在经济利益的补偿上和驱动上会差很多,所以寻找到的可能只是一些特殊的爱好者,义务服务,与利益服务相比,义务选择权会少很多,以上就是人力参与度不够最重要的原因。

4.2.3档案版权问题的法律不完善

        在调研中发现,因为版权问题、档案问题很多众包项目并未公开,目前上海图书馆盛宣怀众包项目选择都是一些档案年代久远,原始作者已经无从考证或者已然去世,也不会涉及版权问题其中,有的档案历史跨度已经超过一百多年。但档案毕竟还会有年代比较接近现代的,比如很多名人的手稿,剧本和书信这些内容,也涉及到版权问题,也还是图书馆的文件私藏品这些并非开展众包模式原因在于国家对于版权保护法也是这几年才开始提出来的。同时,对于档案这种特殊的历史材料,对于版权问题的考虑相比现代社会的版权归属问题更加的复杂化,所以关于档案馆的版权问题法律并不完善。

4.2.4小结

         通过对国内外众包模式的调查和研究发现,国外因制度开放度和思维灵活度的方面,对于众包模式的执行和应用上更加的科学化和灵活多变化,有别于国内在众包模式的执行上缺乏灵活性和趣味性,由此导致最后的众包成果并不是十分理性。随着数据化的普及和更新迭代,众包模式已经被各大档案馆和图书馆平台采用和使用,因为我国进行的建立成熟的众包模式平台已时不我待。研究论文代写

5. 基于调研的档案众包实施模式设计

          基于研究结果提出我国历史档案文本转化引入“众包”模式的设计——分别三大要素主体(发包方接包方平台)入手,并包含了众包模式任务设计、众包模式激励机制设计、众包模式质量审核机制设计、众包模式反馈设计等五个环节第一次完整系统化的设计符合国国情的档案馆历史档案文本转化的众包模式

历史档案众包模式主体要素特征概述
要素主体 要素特征 概念解释 实例
发包方 外部 发包方的所具有的领域影响力, 英国国家档案馆发起的一项一战日记
  影响力 项目的发起意义、团队自身魅力 是保证项目吸引用户参与的前提 美国“DIY HISTORY”项目
  内部属性 历史档案时代领域、以往项目开展情况 上海盛宣怀图书馆众包项目
接包方 参与动机 接包方参与项目的内在、外在动机,比如自我成就感、社会归属感,娱乐性、趣味性。 荷兰阿姆斯特丹的众包项目,以游戏的方式吸引公众进行OCR识别纠错任务。会建立游戏得分排行榜,满足公众的使用趣味性、成就感和社会认同感。
  技能水平 接包方所擅长的知识领域专业度、水平、学习能力等 历史档案涵盖不同领域, 比如文献编纂学、 古文书学等。 历史学、档案学等, 志愿者除了具备基本的档案分析能力,档案编辑能力。还要通过学习该领域的基础知识。
平台 平台规模 从平台运营主体来分,分为专业型平台和第三方平台 Flicker属于第三方平台 目前并没有综合型的专业平台
  平台功能 平台为连接发包方和接包方提供功能,任务设计功能、社交宣传功能,激励和质量监管措施等。 上海盛宣怀图书馆自身网站,登录等
 

图1 历史档案众包模式主体要素

 

 

1
1

图2历史档案众包文本转化众包模式设计图

 

5.1任务设计

    根据任务的自主性任务粒度和任务描述,在任务设计的上应注意低难度性、时长性、切割性和可操作性。通过任务的设计,让整个众包平台更加实用化和精准化,这样就可以促使更多的档案馆参与众包模式的设计和操作,为这种新型模式提供更多的效能。研究论文代写

        上海图书馆的盛宣怀档案众包案例中,由于初期的经验不足,对于众包模式了解不够透彻,第一期的众包项目效果并不明显,对于平台的稳定度并不高,之后上海图书馆进行了系统的调整,加入了验证用户和多人共同抄录节,众包的参与度上有了显著的提高。根据文献了解和调研分析,国内的众包项目案例分析可得出,在初期设置任务环节,需要考虑到趣味性和实践性。首先众包项目公众参与度的高低是一个众包项目取得成功的关键,所以如何吸引更多的众参与众包项目就是一个需要分析的点,这方面国外的众包项目比较有借鉴意义,比如美国的国家档案馆与文件署开展的公民档案员的项目以及美国北爱荷兰的“DIY HISTORY”项目。这些国外的项目都在公众参与度下足了功夫,可是上海图书馆的众包模式案例对于公众的参与度上还有待提高,比如可以在初期设计登录网站中进行更多的游戏的设计在进行众包项目的选择上可以进行那些不涉及到版权的内容进行公开在具体的抄录过程中可以开放多人抄录一人审核模式在具体的登录和抄录提交环节设计中更多重视简单性。其次,可以进行微任务化,并且完成每一个微任务的操作方法简单且过程可以重复。这不仅符合众包任务开展的条件也与档案信息资源的开发工作相吻合。此外,上海盛宣怀目前的开放的众包项目还是属于整件的抄录,这种模式第一工作量比较大,第二具体的需要的知识储备也比较强,很多参与众包的爱好者并没有这样的能力完成任务,因此就会减少众包模式的参与度。改进的方法可以参与澳大利亚图书馆(NLA)的众包项目,将整篇文章或一行行的内容传输给志愿者抄录和识别,除此之外,还可以分门模块化,将档案,进行识别、抄录和校对,把一篇篇的档案进行模块化,这样一来有助于设计,同时也更加简单化,可以吸引更多的公众参与。

    众包项目实施成功与否,最开始便是任务方式的设计,它直接影响着众包的最终实施结果。根据国外的参考和之前的调研结果,就我国国情来讲,档案馆应根据自身的具体需求和相关项目类型,设计出符合不同档案馆的众包任务。每个档案馆选择和采取众包模式的重要意义在于,可以帮助档案馆丰富和完善档案信息资源库的扩建,特别是档案的收集、标引和描述。因公众自身的实力差距和时间碎片化的特点,很多公众很难参与到长期和复杂的任务中,因此众包任务也被分解成简单的“微任务”。具体设计理念如下:

  1. 任务低难度性设计:

可以在众包任务设计中设计一部分低难度的简单任务,这样更加有助于公众的参与,比如文本的转化与纠错,可以由更多的非专业爱好者与志愿者进行参与,但是目前中国的现状是大部分档案以书信和手稿为主,识别难度比较大,因此任务难度级别高,想要解决这些问题,就需要在设计中加入培训机制,让更多的工作人员进行相关简单的培训,比如文稿的识别,文本的纠错等基本专业知识的培训;同时也需要转变理念,不能只是思考众包到底能解决多少档案馆的问题,而应该去思考如何和公众更好的发生联系,和公众形成一个社区,让更多的公众了解档案工作和档案学的意义,对档案学和历史学产生兴趣,自觉自愿的进行参与,这样才能更好调动公众的积极性。研究论文代写

  1. 任务时长性设计:

档案是一种复杂的文本,它涉及到的专业系数大,所以众包任务设计中,耗时短就很重要,比如澳大利亚国家图书馆数字报纸项目的统计表明,用户访问网站的平均时间只有14-18分钟,这种设计的好处在于,一耗时短,公众更愿意利用碎片化时间参与;二避免服务器的拥堵造成时间的浪费。就中国国情而言,在设计中,可以让社会公众利用碎片化的时间进行参与,这样可以节省更多的时间,因此,在界面设计和任务设置流程中应该尽可能的简单、简明、扼要。

  • 任务切割性设计:

因为众包模式就是吸引更多的公众参与,所以在众包模式档案任务设计中,就需要将大件任务分割合理化,将任务的体量放小,这样仅需要简单的人工智能技术,便可以以低廉价格迅速的获得海量的“接包者”完成任务。澳大利亚的数字报纸项目部分以“行”为任务简单,大部分项目以“页”为任务的单元,在具体执行过程中,志愿者完成一页后即可提交,然后系统进行有效合并。对于有一定难度的项目,一次作业可以解决一个目的明确的问题。就中国来讲,在众包任务设计方面可以进行分阶段众包,把任务碎片化和打碎化,这也是很多国外众包项目成功的关键。研究论文代写

  1. 任务可操作性设计:

纵观中国历史档案一般是指1949年建国之前形成的的档案,主要是以明代、清代、民国这些时期的档案为主,迫于时代的转变和目前档案馆技术和保管条件的缺失处于濒危状态,所以快速采取有效措施处理这些档案,成了档案工作者的重要工作,以此保证中国的历史记忆被完好的保存和记录下来。目前要将图片格式的历史档案文本化,主要的方式有OCR光学识别和手工转录两种。针对目前调研所知,OCR光学识别技术因为成本和需求问题,很多档案馆并不会选择,所以手工转录就显得的尤为重要,因此众包任务的设计就需要具备可操作性,这样一可以帮助档案馆解决目前的问题;二可以增加公众的参与度,一箭双雕。同时,在具体的应用中,对照式表单输入,(同一个屏幕页面设置两个二区域,一个是展示历史手稿图像,一个是编辑或输入文本)通过对照将“原本数据”解读输入。因加工者会遇到一些字迹潦草的术语,比入地名人名和专业用语,很多异体字、通假字等,这些可以在任务平台设计中加入测试机制,比如一些难度的任务,可以让专家写一些攻略和基础知识在上面帮助进行参考,还可以进行一些初步的测试,对参与者的水平进行一个基本评估,测试出那个等级,就进行那个等级的众包项目分配工作。目前上海图书馆盛宣怀档案众包项目平台的具体流程是:用户登录平台—用户认领任务—填写“元数据字段”——后续反馈留言(任务提交后并不可以进行修改)。但上海图书馆盛宣怀档案众包平台依然存在不足,可以进行改进为 用户登录平台——用户基础技能测试——确认级别-分配任务认领级别—填写“元数据字段”数据—任务出现问题可以进行修改—反馈留言—任务提交—专家公布修改后结果并作解释—评估作品等级-进入作品任务分类系统。形成一个很好的测试—参与——完成任务——反馈的良性系统闭环。

5.2要素主体之一——接包方

    根据接包方对于参与动机和技能水平的评估,因在设计中引入激励控制,它的具体方式有精神激励和物质激励两大类。其中,任务激励、目的激励、荣誉激励都属于精神激励为主。

        对于任何一种众包项目来讲,公众都是众包项目中非常重要的一环,众包项目的成果是否显著全在于公众的参与率。因此在上海图书馆盛宣怀中报项目中,也很重视激励的作用,他们制定了相关的激励机制,比如进行一个竞赛制度的激励,但因为资金的问题执行状况并不顺利。一方面是因为政策原因资金投入不足,另一方面是目前众包项目平台依然不稳定,难度系数和流程化不够顺畅。结合国外的成功的众包模型的案例分析,们都通过意义机制和精神奖励两种方式对于公众的吸引。比如英国国家档案馆的具体做法是:它们在门户网站明确告诉公众,将在首次公开珍藏已久的一战国家、军队和士兵最真实的面貌和资料,让所有参与公众中,更加的铭记这段历史,同时也发现这些不为人知的历史故事,具有非常重大的意义感和使命感新加坡公民档案项目中的具体做法是:参与任务的贡献者名自会被添加在相关档案的元数据中,通过这些成就感和满足感的激励模式帮助参与者更好的了解到他们参与项目的贡献感。同时,在激励机制的设计中,可以与博物馆和展览馆进行合作,比如参与了众包模式的公众,通过贡献值和参与值,可以获得参与展览的门票或者得到档案馆制作的独一无二的小礼品这些小设计都具备非常独特的纪念价值。因此,要在激励机制环节设计上,开启众包模式的中国档案馆或者图书馆应该积极的思考如何进行灵活多变的激励机制,各种有效的激励方式吸引更多的参与者研究论文代写

    所谓激励,就是组织通过设计适当的外部奖励形式和工作环境,以一定的行为规范和惩罚性措施,借助信息沟通、来激发、引导、保持和归化组织成员的行为,以有效的实现组织及其成员个人目标的系统活动。激励的出发点是满足组织成员的各种需要,即通过系统的设计,适当的外部奖酬和非物质激励的方式,来满足参与者的内在性需求。激励的最终目的就是实现组织的预期目标,也能让组织成员实现其个人目标,即达到组织目标和个人目标客观上统一。正如社会科学理论之一的马斯洛需求层次理论所讲的那样,1943年马斯洛《人类激励理论》论文中提到,人类需求像阶梯一样从低级到高级按照层次分为五种,分别是:生理需求,安全需求,社交需求,尊重需求和自我实现需求。众包的核心理念是利用人类的共同智慧解决问题,主体是人类,所以想要让更多的人参与众包项目,就需要通过马斯洛的需求层次的基础上设计激励机制。一个成功的众包项目,与其说是众包项目,不如说是借助众包平台,将档案工作人员,参与人员和专家学者有效连接起来的高级社群。因此如何有效的驱动和吸引更多的公众参与,就成了众包项目设计的关键。激励机制的重要性也就由此显现出来,通过激发和鼓励人朝着希望的目标行动。

    根据接包方对于参与动机和技能水平的评估,因在设计中引入激励控制,它的具体方式有精神激励和物质激励两大类。其中,任务激励、目的激励、荣誉激励都属于精神激励为主。
  • 激励可以提高参与者的众包工作的积极性、自觉性、主动性和创造性,激励可以提高参与者接受和执行组织目标的自觉程度,解决参与者对众包工作价值的认识问题,使其充分认识到所从事工作的必要性,因为利益使调节人行为的重要因素,在设计目标是,应该尊重个人利益和组织的目标一直,一致性越高,参与者的自觉性、主动性和创造就越高。
  • 激励可以激发参与者工作的热情和兴趣,解决众包工作态度和认识倾向问题,投入自己的全部精力为达到预期目标而努力,兴趣是影响动机形成的重要因素,强烈而稳定的兴趣是保证参与者掌握技术、进行创新、充分发挥自身能力的重要心里条件,通过激励可以使员工对众包工作产生稳定而浓厚的兴趣,使参与者对众包工作产生持久的注意力和高度敏感性,形成对于众包工作的热爱;激励可以提高参与者对于众包工作绩效,激励以世界观为个人行为的最高调度器,以处于积极活跃状态的需要和动机为核心因素,并含有对工作意义的认识及对实现目标可能带来的结果的判断,激励可以充分挖掘参与者的潜能,从而提高众包工作绩效,据统计,一个按时计酬的员工仅发挥其能力的20%-30%,而如果收到了充分的激励,参与者的能力可以发挥至80%-90%。
  • 激励可以创造和维护良好的环境,可以通过营造有很众包工作体验,促使参与者的动机更加强烈,使参与者更好的为了共同目标而努力工作,在信誉好的平台上,参与者往往更加喜欢进行众包工作。
  • 激励可以引导参与者活动的方向,所有人类行为的基本要素,都是一些行为或精神方面的活动,问题是参与者在某一时刻会产生什么行为以及为什么会产生这些行为。行为都是看目标的,因此,在众包平台的设计上应该鼓励参与者在某些活动上做出贡献,有助于组织更好的达成它们的目标和任务。

激励控制是指组织通过激励的方式控制参与者的行为,使得参与者的行为与组织的目标相互协调。激励控制强调的是通过激励调动参与和的积极性和创造性。 研究论文代写

5.3要素主体之二——发包方

    根据发包方对于内在影响力和内部属性的评估,因在设计中引入质量审核机制,在众包模式中加入质量控制机制有助于促进档案众包模式的数据集的开放和验证,提升档案文本的效率和成果,通过自动对比制度和人工审核制度两种模式引入众包模型,同时注意,自动对比制度与人工审核制度应该是递进关系,这样才可以帮助众包模式和谐有序的开展。

5.3.1针对于发包方而言,重视质量审核

    档案是一种特殊形式的文本资料,因其历史性和专业性,因此在执行众包模式的过程中,质量审核环节的设计上就成了所有众包模式的难点和重点。纵观所有的众包模式,其任务都是由大量没有接受过专业培训的众包工作者完成,用户在众包网站上完成注册之后就可以对自己感兴趣的文件或图片档案进行抄写转录、添加标签、图片描述等众包工作。因其参与众包模式公众教育水平、文化水平、学识能力等层次不齐,造成了最后的众包质量也带来了不同级别的水平。因此在众包模型设计中,质量审核机制的设计尤为重要。  

    质量控制机制的设计是出于众包项目的特殊性,因为参与众包项目的参与者,众包任务的完成者在知识储备水平理解能力和表达能力等方面的不同,也会导致了众包任务完成质量的参差不齐。比如有些参与者由于工作的疏忽和怠慢,为了使自己的利益最大化,会出现一些随机的错误,这样会导致一些错误的成果。同时,运用众包模式进行档案文本化时,众包的结果要进行质量控制和反复的确认修正,以此保证这些准确性和可信性,帮助挡杆信息服务提供相应的保障。针对于众包质量控制的适用性,了解到国外的众包案例,目前只是采用两种模式,一是自动对比制度,一是人工审核制度。研究论文代写

I.自动对比制度设计

在设计中充分参考了《纽约时报》的全文数字化项目,该项目的具体方式是将报纸切割,全部改为验证码的方式,由三个人共同参与一个任务,在完成任务之后,三个人的结果进行相互校对,如果三个人给与的答案一致,就自动归为正确答案;如果在完成任务之后,三个人结果不一样,就需要借助专家评审,这种方式的设计更加节约了专家学者的人工成本。这个设计还需要小小的改良,可以更加进行细致化分类,将三个专业水平一般的分为一个任务区,将专业水平强的分为一个任务区。根据任务难度去选择合适的人力资源配比。

II.人工审核制度设计

    根据相关的任务判断,目前高级别的众包任务需要加入人工审核的机制,其中包括档案转录OCR内容识别校对档案征集资源等三项任务可以采用人工审核的机制对于参与者的工作成果进行审核并公布。在众包项目中采用人工审核机制可以精准的关注众包质量,各种非规范情况的处理会比较及时和一致,能够筛选出高质量的“成果”,档案众包成果的人工审核质量控制流程,任务解决者将完成众包任务并提交众包成果后,馆员将接到,并开始对成果按照一定标准进行审核,如果成果合乎标准,则将保存成固定格式并上传众包成果数据库,该项众包任务根据实际需要选择继续开放或直接锁定。如果志愿者提交的众包成果不合格,审核员则将继续开放该项众包任务,等下一位参与者的成

    人工审核的效率和成果率会很高,据调查显示,在转录边沁手稿6个月的测试期间生成了1009份转录本,其中56%的转录本被审核员认为具有足够高的质量,可以被锁定、转换为XML文件并存储以上传到伦敦大学图书馆UCL)的边沁数字储存库。研究论文代写

    针对于人工审核制度,不可回避的一个问题就是如何应对海量数据的加工和审核,在某些情况下,如文本错误过多、流程设计不优等,审核的工作量会不亚于加工的工作量。同时,人工审核制也需要耗费更多的人力、物力,审核工作人员的个人情感和知识水平也可能影响审核结果的公正性。所以针对于目前中国档案馆的现状,人工的审核成本的费用也是比较高的,因此,在众包项目的选择人工审核时应该更具每个藏馆的实际情况酌情选择。

        以上海图书馆盛宣怀档案众包项目为例,他们通过与中国的高校的专业人士合作,进行质量审核,审核质量很高,但是成本也较高。同时,在审核机制的过程中,参与者在抄录完之后,相关的专家是直接进行修改的并且进行打分,这样可以保证成品的质量,但需要浪费的专家人力资源依然多。因此,如何更好的设置质量审核机制很有待于继续探讨,比如可以设置分层审核机制,将众包难度系数高的通过专家来进行审核,众包难度系数低的任务可以交由一些相关爱好者自行审核,这样可以节约部分人力物力;比如还可以进行任务分配的设置选择性比如抄录的难度级别和审核的难度级别相对应进行设计,通过抄录和审核互换任务进行双方合理校对和监督的机制。

5.3.2针对发包方而言,重视宣传性

       当前,众包模式平台设计还不够完善,参与众包模式的人数还需提高。想要提高众包模式的参与者人数,需要具备宣传意识,通过公关和广告的宣传方式,向民众介绍众包模式的优点,构建喜爱众包模式和档案学的兴趣者社群,用全面撒网,广泛积粮的方式进行宣传平台的设计。针对于目前国外档案馆使用的第三方数据平台(猪八戒等商业众包平台,在调研中,中国并未采用,因此,在众包模式设计中更需要加入宣传平台,可以积极的联系和链接第三方平台,但是不能将宣传寄托在第三方平台之上。研究论文代写

5.4要素主体之三——平台

        众包项目是一项系统工程,它想成功的实施,需要强有力的技术支持,众包项目的发布、管理、完成和宣传上都需要一个有利的平台,因此平台的功能性就显的尤为重要,根据国外档案馆的文献得知,大多档案馆在发布项目时会选用本馆的网站作为平台。目前,有以档案馆依托自身网站运行的平台,也有针对于特定众包项目建设的专属网站和第三方众包平台。自建专属网站,英国边沁文稿转录众包项目,是由英国伦敦计算机中心(ULCC)创建的“转录台”,该平台不仅提供了完成书稿的基本功能,还包含用户指南、项目文档信息、讨论论坛和社交媒体界面,这些功能更加的实用性;在第三方平台中,国外如澳大利亚国家图书馆、美国NARA、大英图书馆、丹麦国家图书馆都将众包任务放在Flickr这样的第三方平台上,比如第三方平台(猪八戒等商业众包平台,但它们大多有自身不可克服的缺陷,所有的第三方平台都是内容的简单发布,并没有专业化(抄录、添加标签)众包模式任务完成平台。通过调研反馈中发现,很多档案馆都对众包模式很感兴趣。可是,在具体执行上出现了这样或那样的问题,最大的争论在于众包平台的功能设计上,如果将众包平台功能设计好了,众包模式的应用就可以事半功倍。因为在具体的众包平台功能设计上应注意鲜活多元性、完整层次性和分类多样性,只有多层次,多维度去思考,设计出来的众包平台才能展现出它的功能和效率。针对于平台和功能形成以下的设计措施和设计理念:

5.4.1针对平台而言,设计多功能措施

    通过调研反馈中发现,很多档案馆都对众包模式很感兴趣。可是,在具体执行上出现了这样或那样的问题,最大的争论在于众包平台的功能设计上,如果将众包平台功能设计好了,众包模式的应用就可以事半功倍。因为在具体的众包平台功能设计上应注意鲜活多元性、完整层次性和分类多样性,只有多层次,多维度去思考,设计出来的众包平台才能展现出它的功能和效率。研究论文代写

    登陆上海盛宣怀图书馆的网站,笔者发现,目前该网站对于众包模式的探索只是比较注重任务模式的设计,但在具体的功能上依然不够完善。笔者根据之前的部分众包平台的基础上,在众包平台功能上设计上特别加入了分享反馈功能设计、社交宣传功能设计、游戏互动功能设计、用户协议功能设计、第三方链接嵌入功能设计和质量审核功能设计。

  • 分享反馈功能模块:它的设计主要用于专家与参与者的互动分享,用于帮助相关参与者进行交流的心得体会,这是上海案例中没有的,加入反馈分享模块有利于形成发包者、接包者与专家的有些信息互动,增加单位时间的工作效率。
  • 社交宣传功能模块,目前参考上海图书馆盛怀宣案例发现,网站上对于社交宣传的部分非常少,基于此,笔者希望在设计中加入社交宣传模块,进行关于档案学、档案馆、历史档案和重大历史事件和展览信息的分享与共享,通过社交平台的有效宣传,可以帮助大众更好的了解档案馆的信息和档案馆的职能,帮助吸引更多的第三方大众参与众包项目。
  • 游戏互动功能模块,目前上海图书馆盛宣怀的众包平台还是呈现比较单一型的任务发布,并不能让专业人士之外的人形成兴趣点。基于现状,笔者认为可以在设计中加入游戏公司的互动版块,可以把一些简单的或者有趣的档案制作成游戏,让大众通过通关完成任务,从而吸引更多的人参与众包和了解众包。
  • 第三方链接功能模块,目前上海图书馆盛宣怀的众包平台第三方的链接非常少,还是比较单一的。因此,笔者认为可以将一些众包项目和众包档案公开进入第三方平台,比如馆外平台或论坛和博客。因为众包项目是全民的事情,档案馆的知识教育也是全民的事,不仅仅只是档案馆单个馆的事情。所以将信息公开共享,有利于提升参与的成就感,提高馆藏知名度,促使更多参与者更加了解档案学的意义和价值,这也能体现众包项目的高附加值。研究论文代写
5.4.2针对平台而言,重视宣传性和可操作性

        从上海图书馆盛宣怀实施众包项目的反馈了解到,在平台设计方面遇到了很大的挑战,针对于技术层面的挑战并不大,最大的挑战来自于平台的设计上,开发平台花费的时间很慢长不仅如此,借鉴国外案例实用的第三方数字平台(Flicker),国内并没有较成熟的类似向Flicker的抄录平台,之前参考的澳大利亚数字报纸的抄录平台,国内也没有办法直接发布使用。因此档案众包在平台的设计方面需要花费大力气进行筹建,让公众能够以简单的方式完成任务,并且在设计上尽量简单大方。

        在进行各大众包模式平台的访问网站调查中发现,平台的欢迎界面都十分简单并且详细写清楚了介绍和项目贡献,同时在如何执行的过程中也配有清晰可见的操作指南与实例指导,让公众以最简单快速的方式将档案进行抄录并且提交,加强平台设计环节章的可操作性。此外,还需将众包平台的商业宣传性,通过与媒体平台的互动和构建社区模式,挖掘更多的档案历史爱好者;通过进行广告的植入和推广,让更多的青年人进行众包项目的参与通过进行有趣味的平台论坛的创建,帮众更多的参与者建立身份认同感,提升它们对于众包贡献的成就感,从而更好的吸引和引导更多的公众参与和爱上众包模式。除此之外,还可以将积极主动的与第三方的技术平台进行合作,通过商业模式和传统模式的结合更好的进行众包项目执行和开展,提升众包成果的质量。研究论文代写

5.4.3针对平台而言,重视反馈性

         任何一个系统要想进行很好的运用,反馈的机制很重要。众包模式是属于全民参与的一种新的商业分配模式,其中最大的特殊化就是参与人的级别和等级是随机性的,因此在参与过程中就会造成千差万别的成果差异。在上海图书馆盛宣怀档案众包项目案例中,并没有非常有效的反馈机制。没有反馈机制的建立,众包模式在执行过程中依然没有很好的效果。

        不仅如此,在国外的众多众包模式案例中,具备反馈机制的模型也比较少。所以,反馈机制是国内外众包模式执行和应用中忽视的一项。如何建立有效的反馈机制,可以通过参与者进行备忘录和反思日记的方式,让参与者进行记录自己在参与这个项目过程中遇到的问题和已经参与这个项目的动机和相关请教专家的难点这样可以有效的形成和专家的互动,让参与者更有参与感,同时也可以通过反馈机制了解到目前在项目设计中的不足,更好的进行有效的调整和改正。

    反馈是控制的基本概念,它指导了系统的输出返回到输入端并且以某种方式改变输入,他们之间还存在因果关系的回路,进而影响到系统功能的过程。众包模式加入反馈机制的设计原因有二,第一,众包模式属于新型模式,还处于不成熟阶段,因此需要不断的调整与试错,也需要不断的更新迭代,针对于这一阶段反馈机制还是非常有必要的,正如“反馈到它自身”才能更好的完善众包模式设计。第二,在了解到国外的案例和国内的相关案例,众包模式的项目并没有相关的反馈机制,而公众在众包任务的操作过程中需要不停的反馈信息交流,以得到专业性的辅导和支持。所以,反馈机制是非常重要的。   研究论文代写

        除此之外,也可以帮助参与者在参与项目中学到很多新的知识,达到寓教于乐和群策群力,将专业、技术与知识融为一体的反馈机制,形成良好的双方互动模式,让专家不仅仅知识简单的审核者,让公众也不仅仅只是简单的参与者,而是把这个项目变成“大众”的项目,更好的执行。

如何在众包模式中加入反馈系统的设计呢?具体的做法有以下两种,A.可以利用互联网成立信息交流平台,比如微信群和相关论坛,这属于非正规是反馈机制;B.可以请发包方的专家学者相互交流和积极互动,这属于正式反馈机制。通过非正式反馈机制于正式反馈机制两种方法帮助众包模式系统收到更好的反馈信息,有助于改进众包项目设计流程的信息。

5.5 众包模式中,各要素主体与任务设计的关系

    在众包模式的设计中,需要考虑各要素主体的关系,只有各要素主体与任务设计都适应协调才可以更好的发挥众包模式。各主体与任务设计的辩证关系,在众包中,各要素主体与任务设计是相互生成的一对范畴,各要素主体在设计上比如与任务设计一致,也就是根据任务设计,设计出配套的各主体要素。第一,思考各类主体与任务设计的辩证关系,有助于提升要素与任务设计中的切合行和实用性,第二,思考各要素主体和任务设计中的辩证关系,有利于形成完整系统的众包模式,系统的众包模式在实践应用中更为方便高效。第三,思考各要素主体和任务设计中的辩证关系,可以将众包模式应用特定的领域内,比如针对于历史档案文本转化引入众包模式,继续根据任务设计来设计出与任务设计相匹配的各要素主体设计,档案馆历史档案文本转化的任务设计目前只有档案抄录和OCR扫描纠错识别,所以要针对特定的领域来设计各要素主体。研究论文代写

5.5.1接包方与任务设计的关系

    接包方与任务设计是对立统一的关系。接包方必须看到自己感兴趣的任务,同时自己也有能接受这个任务,接包方才会选择接受任务。在历史档案文本转化任务中设计中。只有多体现设计的激励性、及时反馈及时性、趣味性等,才能吸引接包方选择接受任务。反之,如果任务设计中没有这些性质存在,那接包方并不愿意接受任务,没有接包方接受任务,众包模式就不会实行起来。因此,需要在设计中思考接包方和任务设计的关系,这样才能以任务设计吸引接包方,越来越多接包方接受任务,众包模式才能够有效的被实施。

5.5.2发包方与任务设计的关系

    发包方(任务的请求人)与任务设计是规定与被规定的关系,发包方是任务设计的发布者,所以发包方(任务的请求人)需要根据自己的需要进行任务设计,比如发包方需要抄录任务,就需要在任务设计中设计出抄录任务,并且按照发包方对于抄录任务的需要,进行任务设计。所以发包方与任务设计这种,更加有利于发包方与任务设计配合协调,众包模式才能够有效的被实施。

5.5.3平台与任务设计的关系

     平台与任务设计是包含与被包含的关系,平台中包含任务设计,任务设计也被包含在平台之上.目前,很多档案馆在实施众包模式时,都采用第三方平台或者,将自己的部分信息公开,但是第三方平台的问题在于很多基于档案馆特定的工作任务,第三方平台并不能满足。因此,需要基于任务设计,设计出专门为档案文本转化服务的平台,所以需要思考平台于任务设计的关系,这样可以更加有利于设计出贴合档案馆文本转化的众包模式,众包模式才能够有效的被实施。研究论文代写

6.我国实施档案众包模式的未来展望

    要想实现档案馆众包模式常态化、制度化的开展运行,仅有模式设计是远远不够的,还需要建立科学、齐备、标准的宏观保障策略来促进档案众包模式的顺利实施。针对我国国家档案馆开展众包模式中存在的难题,在国内外理论及实践经验的基础上,为更加顺利落地实施档案众包模式。虽然,在调研过程中,目前中国只有一家图书馆开展了档案众包模式,其余的档案馆也都在处理前期工作,但是档案馆的创新也是新时代新环境下的必须作为。所以,档案馆的众包模式是非常好的一种新的尝试。

         我国档案馆未来实施众包模式的展望——从政策维度、经济维度、技术维度、人力资源维度等四方面维度提出我国档案馆未来实施众包模式的展望。

6.1法规政策

    政策法规就是党政机关制定的关于处理党内和政府事务工作的文件。任何的法律法规都是一个项目一个模式的有序保障,也只有相关的法规政策才可以保证更好项目执行。针对于众包模式的法律法规,目前中国并没有非常明确的关于众包模式的法律法规,因此,为了适应新的形式和环境,制定相关众包项目的法律法规非常有实践意义。

    在档案学众包模式的开发中,不断的完善完备法律法规系统是不可或缺的需要,就当前的中国档案馆实际情况而言,相关的法律制度依然比较陈旧并且不够健全,虽然中国有一些关于档案方面的相关法律,但对于档案众包项目的一些细节内容依然缺乏硬件的规范法规,其中的相关法律依然比较笼统,需要大力补充。在当前的向社会形势下,为了使档案馆的整体实力有待提高,并且促使档案馆减少更多的人力物力和财力。国家应当在符合国情的情况下,积极的制定相关法规政策。一是需要对当前相关与档案学的法律法规更加的完善;二是需要对于有关配套的法律法规进行更好的建设,并且在之前有的法律基础上制定相关的针对性的法律法规,对于线管的法律责任主体,客体应该更好的明确,并且确认有关主体与客体的相关权力、责任和义务,于此同时,对于档案学的版权问题,应该进行更多的细节探讨,并且指定出针对于档案学众包模式中版权问题的法律法规,促使档案众包模式能够更好的发展。

    目前,查询相关的法律法规可以了解到,关于众包模式的法律指导并没有,而针对于档案馆产业改革的法规保障也比较薄弱,成果的桎梏对档案众包的发展和持续执行造成了障碍,因此需要从几个方面开始可以强化:第一,要明确档案众包模式的法律性质的问题,确定档案馆的资料信息是属于政府什么类型的资产,然后更具的资产的性质明确定位于档案信息的主体性和使用主体之间的相关权力和义务;第二,不断的研究中国众包模式的使用,在开放过程中所涉及到的相关的主体的权力和义务,比如要明确界定档案数据的开放范围,档案数据的监督政策并且保证数据的开放性、科学性和可执行性。第三,从法律法律上,明确规定了档案数据的开放心和共享者知情权力的关系,并且明确客体的全体和义务,比如有些档案不能随意公开,比如有些历史档案因为历史时机问题不便公开,不仅如此,还需要明确规定档案数据不能随便引用,不能滥用数据同时保护数据的安全等。第四,明确处罚的范围,包括开放范围和出发的限定等。研究论文代写

法律法规具有非常重要的意义,一是法律的秩序意义,法律在构建社会秩序中起着主要的作用,法律形成保证着人类的生存,保证社会的发展。针对于众包模式来说,制定相关众包模式的相关法律就可以更好的规范,众包模式规划过程中的秩序和规则,有利于保证众包模式的有序执行。二是法律的自由意义,法律提供给个人选择的机会,法律明确行为的模式,让行为人选择有利于自己的模式,法律将个人自由赋予法律的形式。档案学的众包模式执行如果有了法律的保障,就可以对于明确的主体和客体的义务和权力,更加清晰的为众包模式建立提供政策法律依据,做到有法可依。第三,法律的效率意义,在但该,法律对于生活渗透无所不在,这使得法律的效率意义更加的重要,同时还需要兼顾平等与效率的同时,法律最大限度地保障了效率的实现,在档案的众包模式中,如果拥有更加规范的法律法规进行执行,就可以保证众包项目的平等和效率。第四,法律的利益意义,法律确认利益,通过平衡冲突进行社会控制,解决社会纠纷,平息社会矛盾,这更加有助于恢复社会的常态,就众包项目相关的法律制定而言,也需要更好的权规定,一方面可以约束档案馆并且规范档案馆在众包项目中的的权力和义务;另一方面也可以规范参与众包项目中参与者的权力和义务,可以更好保障双方的权力,这有助于众包模式在所有档案馆中进行推广和执行。

6.2 专项经费

    人类经济活动就是创造、转化、实现价值,满足人类的物质文化生活需要的活动。新时代、新背景,档案馆需要进行科学的改革和发展,更好的贯彻新理念,落实新要求,深刻认识数字档案馆建设的重要意义,将数字档案馆建设任务落实到实处,并且积极的探索利用移动平台的开展档案服务的新途径,因此引出了众包模式,但想要实现众包模式的落实,经费投入是非常重要的。中国档案馆属于政府的公共服务机构,目前情况是相关档案馆的经费严重不足,拿中国国家档案局为例,截至2016年12月31日,总编制836人,在职人员747人。国家档案局的一年的收支总预算53,317,93万元,这其中包括了预算拨款教育支出和科学技术支出等几个领域,而科学技术支出只有2,370,79万元[90]与众包项目的执行和建设数字化的档案馆,还有一定差距,想要保证档案馆众包项目的有序执行,设立档案馆的专项基金项目和相关专项经费项目,非常有必要。研究论文代写

    档案馆事业专项经费少、缺口量大,档案专项经费投入与经济社会发展不成比例,开展很多的日常工作困难重重,举步维艰。有很多档案馆由于经费不足,整体的档案馆设备陈旧,对档案的开发和利用,存在着较大的短板和不足,实现馆藏档案全文本化、信息化的管理差距很大,对执行众包项目而言,没有经费作为保障,项目的开展和技术水平就不能达到。根据调研可得知,在执行众包项目的过程中,由于经费等相关问题,就会推慢进度或者很多新的技术和科技并不能有效的选择使用,比如OCR技术虽然挺好的,但是成本太高了。只有提高档案馆事业的专项经费才能解决这些问题。如何加强的档案馆的事业专项经费应该从几个方面进行加强:第一,加强档案馆的档案的数字化转化的专项经费投入,这样这有助于更好实施众包项目;第二,加强档案馆的整体设备的专项经费投入,这样可以保障众包项目有效的硬件保障;第三,加强档案馆的众包项目人员专家的经费投入,这样在众包项目实施过程中,可以吸引更多的专家和参与者,参与众包项目,帮助档案馆的减少和浓缩更多的财力资源。

    加强经费投入的意义有几点,第一,档案馆的专项经费投入,可以最大限度地开发投资主体的人力资源,增加投资主体的核心竞争力,针对于档案馆的众包项目而言,通过大量的资金注入和投入,可以更好的提升众包项目的整体建设和资金保障;第二,档案馆投资促进发展中国家实现经济的可持续发展,进而缩短与发达国家的差距,众包模式项目是国外一种新型的商业理念和商业的发展模式,引入中国也是可以帮众中国的档案馆行业进行有效的数字化转型,提出的一种新型路径,并且更好的促使档案馆行业的和谐可持续发展;第三,加大档案馆的经费投入可以很好的解决档案馆的发展问题,更好的实现档案馆的人力物力的有效资源融合。完成基础的建设也是实现众包项目的第一步,所以加强档案馆的经费投入,在解决档案馆的发展问题前提时,为众包模式项目提供基础硬件条件,同时也可以引进先进的技术和科技更好的为档案馆发展做贡献,也可以通过加强经费的投入,对于人才的梯度建设提供资金的支持和力量。   研究论文代写

6.3科学技术

    现代技术的发展,促使大量的电子文件的产生,数字档案馆的建设尤其重要,数字化档案馆与传统的档案馆相比较,区别在于传统档案馆,数字化档案馆有着丰富的数字化资源,海量信息储存、便捷的检索、快速的传输系统、高度的开放、信息的合作共享等优点,这些都依赖于科技的力量,众包项目平台的建设也需要强有力的科技支持,比如档案文件的文本数字化,比如文本数字化的扫描识别技术,数字化档案的储存和提取等都需要技术最为支撑,才能完成。因此,想要很好的实现众包模式的推广和成果有效执行,急需要提升科学技术的实力和能力,这不仅有助于众包模式的应用,也有利于传统化档案馆的模式转变为科学的数字化档案馆,为档案行业更好的适应新时代发展保驾护航。

    目前,中国档案馆众包模式出现的情况,有很多的模式的建设都因为技术层面,没有得到良好的效果。中国众包项目的实施操作和发展中,技术缺口大,技术开发实力还不够强等问题,很多档案馆因为技术层面问题,很多项目都进展缓慢并且推迟进行。根据调研可知,众包项目过程中,技术的不完善就会整体上促使众包项目的系统平台整体运营速度和效率的低效,并不能发挥整体系统平台的合力。如何提升众包模式的技术因从两个方面进行改进: 第一,在构建网络众包创新系统平台的顶层设计,内部架构和接口处理过程中,必须强调体现“编码化和模块化“的设计理念,众包模式平台化的建设,需要更好的将档案数据编码化,有助于降低众包模式任务的开放的难度系数,众包模式平台化的建设也需要注重模块化的技术,这样可以更好的将众包任务模块化分类,可以增加中报任务完成的速度;第二,大数据的技术支持。通过大数据的技术支持,可以有效的帮助众包模式平台的数据化平台建设,更好的进行档案数据的收集和存储,让这些众包模式的参与者更多的参与进来,更好的帮助传统的档案馆转型成为数字化的档案馆,而不仅仅只是简单的抄录和加标签这些简单的众包模式的推广和执行。研究论文代写

     采用科学技术的重要意义,第一,科学技术是第一生产力,是经济发展的决定因素,所以在众包模式中加强科技的建设,除了通过众包项目帮助档案馆减少资源成本之外,还可以通过众包项目帮助档案馆发展新型的收入,比如上海图书馆盛宣怀就可以将开展众包模式中应用的技术,外包给更多的档案馆,增加收入。第二,以技术为依托,众包项目也需要不断的升级迭代,虽然目前众包模式目前基本的技术都已经具备,但是,众包项目不能仅仅只是当前的添加标签,抄录,应需要利用技术的力量,将历史档案中的文本信息进行更多的挖掘和提取,这样才更有利于众包项目建设的技术升级。

6.4人才培养

    人才建设,需要具体梯队意识,所谓的人才梯队建设,就是当现在的人才正在发挥作用时,未雨绸缪地培养该批次的人才的接班人,也就是做好整体的人才储备工作,对于一些有发展潜力的人才要及时培养,这样就可以形成水平不同的人才,彷佛站在梯子上有高有低一样,形象地称为梯队。因档案馆对于社会特殊地位和独特意义,人才的建设尤为重要,比如加强对人才工作的投入,比如加强档案馆学专业人士的培养和发展,比如加强建立档案馆内工作人员的专业和技能培训。针对于众包模式的项目执行上,因为其专业性和难度系数,有很多的参与者感兴趣,却并没有能力参与众包任务。于此同时,在质量审核过程中,档案馆的很多专家也严重不足。所以,人才梯队建设也是保障众包项目发展的一个部分。

    档案馆的现状是专业人才严重不足,众包参与者个人专业能力相差太多,针对众包项目而言,在设计中,不管是众包项目的参与者还是众包项目的审核者,都严重不足。想要从根本上解决这个问题,建设一批有专业度的档案馆人才是一种解决方案。具体的操作如下,第一,可以采取柔性的培养模式,分为专职人才的培养和兼职人才的培养,通过合作与交流的方式发现人才并且培养人才,最好是结合众包模式的参与者,对于他们进行柔性的培养和培训,更好的为众包模式服务;第二,优化档案馆的人才引进策略,人才引进的渠道可以从不同的中专院校,科研院校以及社会上的专业人才,进行引进,同时在引进的过程中注意成体系化的,引进复合型的人才,既懂技术又懂档案学,即懂历史又懂商业,这种复合型人才,只有这样才能在众包模式的发展种贡献自己的一份力量;第三,完善人才的评价体制和测试体制,针对于众包模式而言,在设计中要考虑到对于参与者的评级体制和测试体制,这些“潜在”人才的有序培养,也是保证众包模式更好的执行的关键依托;第四,强化众包模式中参与者的激励,众包模式而言,更需要参与者的力量,除了有效的培养和提高参与者的技能和专业度,还需要增强对于参与者的鼓励和激励,这样才能保证参与者更加的努力并且积极的参与众包项目中,只有越来越多的参与者有效参与,才能保证更多的众包项目落地发展。研究论文代写

     人才的重要意义,第一,人才是每个核心行业的核心竞争力,针对于中国的现状,参与众包的参与者大多只是感兴趣,年龄层偏大为主,但这这些类型的参与者本身的自我动能和自我效能严重不足,所以重视众包模式参与者人才的培养,既然找不到合适的,那就培养出合适的人才用于众包项目;第二,档案馆的深度文本加工改革也离不开人才的培养,众包项目也只是档案馆数据化改革的一种有效的模式,站在档案馆数据化改革的宏观背景下思考,人才的培养更加有利于档案馆的数据化改革,成为档案馆未来发展的有力支持;第三,时代发展,对于人才的需求越来越多元化,众包模式系统平台的建设,在前期的筹备和后期的维护中,更加的需要人才的注入和人才的参与,因此需要培养一批人才队伍更加知识化和年轻化。

     通过,梯队的人才建设,培养和培训一批跨学科、跨专业、跨领域的国际性、复合型人才,不仅能对于众包模式,对于档案馆数据化改革,更是对于社会的发展都具有重大的现实意义和深远的历史意义。

7.结语

    针对于档案学的研究和探索依然有很多的不足和需要继续改进的地方,比如在具体调研中也只是对于上海市图书馆盛宣怀档案众包项目和广东省档案馆进行了详细的采访调研,针对于论文研究中,案例远远不够,所以得出的结论依然不够精准,比如外国案例的选择上,也只选择了几个国家的众包案例进行调研,分析力度难免不足。但即便如此,经过相关的研究和调研依然得出了可以借鉴性的几项研究成果,通过发包方、接包方、平台三个众包模式的要素主体入手,得出了基于历史档案文本转化的众包模式设计,通过众包模式设计可以更好的帮助档案馆档案整理与数字档案馆转型,下面就从几个维度来进行阐述:

  • 历史维度:档案学是社会科学,针对于时代的洪流,众包模式的研究和探索对于数据化新时代具有重要意义,但是目前中国开展众包项目的历史时机已经成熟,可是与之配套的相关技术、人力、和法规设计上依然不够成熟,需要进一步完善。
  • 社会维度:档案馆的历史资料承载着一个国家,一个民族的历史,众包模式的采用是让这些尘封的记忆和历史文本,变成每个人都知道的故事,图片,有助于促进公众对于档案的历史意识。所以研究众包模式推行不仅仅只是一种新的尝试,而对于社会也有重要的推动和发展意义。
  • 政治维度:现在全球都在推进数字化的改革,不仅有产业的数字化,还有数据的数字化,档案馆最多的就是文本资料,档案馆众包模式的尝试,为中国科学数据的公开和共享提供有效的示范引领作用。
  • 系统维度:之前理解的众包模式也仅仅停留在简单一个平台,进行一个众包项目的阶段,这是远远不够的,众包模式一个系统体系的建设,并不是仅仅只让大众参与,解决和降低档案馆的人力与物力,它是一个集人才、技术、平台、资金为一体的系统建设,更是传统档案馆转型为数字档案馆的有效尝试。

 

    针对于档案馆未来的有序的发展而言,针对于众包模式的可行化研究依然是一种在新环境下,新的思考方式,它可以更好的解决档案馆目前亟待解决的问题;它可以帮助档案馆、公众、和技术平台形成很好的互动和互联,让这些数据和历史档案被更多的人知道,而不仅仅时被束之高阁的文本。相信,未来依然有更多的档案学的研究者和专业人士提出更好、更优的研究论题和研究思路,为档案学的学术研究理论宝库添砖加瓦,也希望可以有更多的毕业生,不断的补充和完善关于众包模式可行化探索的新的研究结论和成果,为众包模式的执行和发展提供新的见解和思路。研究论文代写

8.参考文献

1.HOWE J. The rise of crowdsourcing[J].Wired,2006,14(6) :176-183

2.《2015度全国档案行政管理部门和档案馆基本情况摘要(1)》[J]中华人民共和国国家档案局,[EB/OL][2016-11-16].http://www.saac.gov.cn/xxgk/2016-11/16/content_164743.htm

3.Aristotle.Categories.[M].YouHui Culture Publishing Company,2017.https://books.google.com.my/books/about/CATEGORIES.html?id=5pG0DgAAQBAJ&printsec=frontcover&source=kp_read_button&redir_esc=y

4.维基百科.概念.[EB/OL][1994-03].https://zh.m.wikipedia.org/zh-my/%E6%A6%82%E5%BF%B5

5.ELLIS S. A history of collaboration,a future in crowdsourcing: positive impacts of cooperation on British librarianship[EB/OL][2016-03-28].http://www.crowdconsortium.org/wp-content/uploads/A-History-of-Collaboration-a-Future-in-Crowdsourcing-Positive-Impacts-of-Cooperation-on-British-Librarianship.pdf

6.维基百科.维客[EB/OL].https://zh.m.wikipedia.org/zh-my/威客

7.郑博.我国档案众包实现研究[D].河北大学硕士学位论文, 2017

8.俞宽.基于众包理论的粤海关历史文献数字化处理模式研究[D].广州:华南理工大学硕士学位论文,2014

9.加小双,安小米.数字档案资源建设中的参与式图景[J].档案学研究, 2016(2):83-88

10.孙洋洋. 基于众包模式的档案馆信息资源协同共建研究[J].浙江档案, 2015(11):17-21

11.盛芳,李正龙,焦坤,等.众包与众包馆员制度:助推图书馆服务转型[J]. 图书情报知识, 2012(4):95-102.

12.Oomen J, Aroyo L. Crowdsourcing in the cultural heritage domain: opportunities and challenges[C]// International Conference on Communities and Technologies. ACM, 2011:138-149

13.张卫东,韩效东.图博档数字资源的众包模式研究[J].情报理论与实践, 2016, 39(10):74-79

14.叶绿美.虚拟档案员–公众参与档案事务新模式[J]. 中外企业家, 2017(17)

15.Lang, A. S.I.D. and Rio-Ross, J. 2011. Using Amazon Mechanical Turk to transcribe historical handwritten documents. Code4Lib Journal, 15 October 31, Retrieved from http://journal.code4lib.org/articles/6004 [Google Scholar]

16.裘丽.档案众包质量管理及评价体系研究[J].档案与建设, 2017(9)

17.谈伟. 国外“档案众包”实践及引发的思考[J]. 四川档案, 2014(2):51-52

18.顾丽娅.国外档案众包实践及启示[J]. 浙江档案, 2015(7):13-15

 19.国务院. 国务院关于大力推进大众创业万众创新若干政策措施的意见[J]. 办公自动化, 2015(14):13-16.

20.中共中央办公厅国务院办公厅.关于加强和改进新形势下档案工作的意见[Z].中办发[2014]15号, 2014.

21.全国档案事业发展“十三五”规划纲要[J]. 中国档案, 2016(5):14-17.

22.杨冬权. 在2014年全国档案工作者年会上的讲话[J]. 档案学研究, 2014(5):4-6.

23.杨冬权.在全国档案局长馆长会议上的讲话[N].中国档案报, 2014-01-06 (1)

24.杨冬权. 怎样引领档案工作新常态[N]. 中国档案报,2015-11-12(003).

25.邢永福.我国第一历史档案馆藏清代新疆历史档案及其整理出版工作[J].西域研究,2000(1)

26.赵景明,时永梅.图书馆众包模式的理论与实践研究[J].图书馆理论与实践,2011(8):12

27.张亭亭,赵宇娟,朱庆华.数字图书馆移动视觉搜索的众包模式初探[J].中国社会科学情报学会学报.2016(4):11  

28.Beth Simone Noveck.Wiki Government:How technology can make government better democracy strong and citizens more powerful[M].Washington,D.C.:Brooking Institution Press,2009:224

29.刘晓刚.众包中任务发布者出价行为的影响因素研究[D].重庆:重庆大学硕士学位论文,2012

30.宋喜风.众包模式中参与者行为动机研究[D].西安:西安电子科技大学硕士学位论文,2012

31.马卫,方丽,屠建洲.从外包到众包的商业模式变革及启示[J].商业时代,2008(01):13-14

32.孙捷,宋福根,陈惠兰.基于众包模式的导航库系统构建的探讨[J].图书馆杂志,2012,31(09):38-41

33.马卫,方丽,屠建洲.从外包到众包的商业模式变革及启示[J].商业时代,2008(01):13-14

34.叶伟巍,朱凌.面向创新的网络众包模式特征及实现路径研究[J].科学学研究,2012,30(01):146-147

35.李忆,姜丹丹,王付雪.众包式知识交易模式与运行机制匹配研究[J].科技进步与对策, 2013, 30(13): 127-128

36.张缘.大众参与众包的行为影响因素研究[D].大连: 东北财经大学硕士学位论文, 2011

37.刘苏.专业服务众包模式应用研究[D].北京:北京工业大学工商管理硕士学位论文,2011

38.Vukovic M. Crowdsourcing for enterprise[J]. Congress on Services, 2009(02): 686-692

39.RIGBY R.The billion-man research team[J].Financial Times,2007(10) :12-16

40.BUSH V.As we may think[J].Atlantic Monthly,1945,176(1) :101-108

41.LEVY P.Collective intelligence: mankind’ s emergingworld in cyberspace[M].New York:Plenum,1997:133-167

42.HIPPEL V E.Democratizing innovateeeion[M].Cambridge: The MIT Press,2005: 66-87

43.TAPSCOTT D,WILLIAMS. A.Wikinomics: how mass collaboration changes everything[M].New  York:Portfolio,2006: 55-83

44.BENKLER Y.The wealth of network: how social production transforms markets and freedom[M].New Haven and London:Yale University Press,2006: 211-240

45.Trend-watching.Important consumer trends for 2008[DB / OL].[2010-10-11].http: / / www.Trend- watching.com / trends /8trends2008.html

46.HEMPEL J.Tapping the wisdom of the crowd[DB /OL].[2010-10-11].http: / /www.Business week.com / innovate / content / jan2007 / id20070118 _768179.html

47.HEMPEL J.Crowdsourcing: milk themasses for inspiration[J].Business Week,2006( 9) : 38-39

48.Anderson S R, Allen R B. Envisioning the Archival Commons[J]. American Archivist, 2009, 72(2):383-400

49.Eveleigh A. Crowding out the archivist? Locating crowdsourcing within the broader landscape of participatory archives[J]. 2014

50.Kärberg T, Saarevet K. Transforming User Knowledge into Archival Knowledge[J]. D-Lib Magazine, 2016, 22(3/4)

51.谢晓萍,胡燕.国外“档案众包”项目及启示[J].档案天地, 2015(9):48-51

52.Evans[ M ]. Archives of the People, by the People, for the People[J]. American Archivist, 2007, 70(2):387-400

53.闫静.档案事业公众参与特点及新趋势探析——基于英国“档案志愿者”和美国“公民档案工作者”的思考[J]. 档案学研究, 2014(3):81-84

54.NARA. Citizen Archivist Missions [DB/OL]. [2018-03-07]https://www.archives.gov/citizen-archivist/missions

55.NARA. Subtitle Videos on Amara [DB/OL]. [2018-03-07]https://www.archives.gov/citizen-archivist/subtitle-videos

56.NARA. Upload and Share [DB/OL]. [2018-03-07]https://www.archives.gov/citizen-archivist/upload-and-share

57.NARA. Edit Articles [DB/OL]. [2018-03-07]https://www.archives.gov/citizen-archivist/edit 

58.NARA. Citizen Archivists [DB/OL]. [2018-03-07]https://historyhub.history.gov/groups/transcribers

59.The National Archives. About Operation War Diary [DB/OL]. [2018-03-07] https://www.operationwardiary.org/#/about

60.The National Archives. Classify [DB/OL]. [2018-03-07]https://www.operationwardiary.org/#/classify

61.谈伟. 国外“档案众包”实践及引发的思考[J]. 四川档案, 2014(2):51-52.

62.Chrons O , Sundell S . Digitalkoot: Making Old Archives Accessible Using Crowdsourcing[C]// Aaai Conference on Human Computation. AAAI Press, 2011.

63.Saylor, N. and Wolfe, J. 2011. Experimenting with strategies for crowdsourcing manuscript transcription. Research Library Issues, December, : 9–14.

64.顾丽娅. 国外档案众包实践及启示[J]. 浙江档案, 2015(7):13-15.

65.李宗富.国内档案馆开展档案志愿服务活动现状调查研究[J].档案学通讯,2018(06):102-107.

66.曾智. 地方档案网站评估指标体系研究——以湖北省地市级档案网站为例[J]. 档案记忆, 2010(6):9-12.

67.李书宁,曾姗.国外图书馆数字馆藏众包建设实践调查与分析[J].图书情报工作.2014(12):83-90.

68.Kittur A, Chi E H, Suh B. Crowdsourcing user studies with Mechanical Turk[C]// Chi 08 Proceeding of the Twenty-sixth Sigchi Conference on Human Factors in Computing Systems. 2008.

69.傅华,冯惠玲.国家档案资源建设研究[J].档案学通讯,2005(05):41-43.

70.史江,秦慧,赵德喜.历史档案数字化进程中的业务外包问题探索[J].档案学通讯,2010(01):37-40.

71.裴燕生.历史档案数字化管理的基础[J].档案学通讯,2004(05):46-49.

72.Aaron G. Noll. Crowdsourcing Transcriptions of Archival Materials. [DB/OL]. [2017-3-7] http://scholarworks.umb.edu/cgi/viewcontent.cgi?article=1062&context=ghc 

73.Causer T, Tonra J, Wallace V. Transcription maximized; expense minimized? Crowdsourcing and editing The Collected Works of Jeremy Bentham[J]. Literary & Linguistic Computing, 2012, 27(2):119-137.

74.Maslow A H. Motivation and personality.[J]. Quarterly Review of Biology, 1987(1):187–202.

75.DELI E L. Intrinsic; Motivation [M] . New York :Plenum Press,1975 :324-327.

76.Kirsch L J . The Management of Complex Tasks in Organizations: Controlling the Systems Development Process[J]. Organization Science, 1996, 7(1):1-21.

77.Holley R. Collecting ,sharing and improving data: Changing roles for librarians users [R/OL].[2015-01-02]

78.Johns G . Organizational Behaviour: Understanding and Managing Life at Work[J]. Organizational Behavior, 1996.

79.Kohler, Thomas. Crowdsourcing-Based Business Models: How to Create and Capture Value[J]. California Management Review, 2015, 57(4):63-84.

80.百度知道帮助-知道头衔[EB/OL].[2019-02-20].http://www.baidu.com/search/zhidao_help.html#.

81.Causer T , Tonra J , Wallace V . Transcription maximized; expense minimized? Crowdsourcing and editing The Collected Works of Jeremy Bentham*[J]. Literary and Linguistic Computing, 2012, 27(2):119-137.

82.Hirth M , Ho?Feld T , Tran-Gia P . Analyzing costs and accuracy of validation mechanisms for crowdsourcing platforms[J]. Mathematical and Computer Modelling, 2013, 57(11-12):2918-2932.

83.王志宏,傅长涛,李阳阳.众包的行业应用研究述评[J].长安大学学报,2017,19(5):68-76

84.俞宽.基于众包理论的粤海关历史文献数字化处理模式研究[D].广东:华南理工大学硕士论文,2014

85.孙洋洋,基于众包模式的档案馆信息资源协同共建模式研究[J].档案学,2016(2):17-22

86.郑博,我国档案众包实现研究[D].河北:河北大学硕士学位论文,2017

87.刘文斌,刘俐伶,田力奥,严红.[J].科技创业,2018,31(3):104-108

88.唐丹,论档案研究的社会化,上海档案信息网 [EB/OL].[2008-02-22]. http://www.archives.sh.cn/dalt/daxjcl/201203/t20120313_9223.html

89.关富英,李书宁.[J].图书馆杂志,2015,32(2):58-62

90.李书宁,曾姗. [J].图书情报工作,2014,58(23):83-90

91.上海图书盛宣怀,[EB/OL].[2016]. http://sd.library.sh.cn/sd/home/index

92.T·库克.四个档案范式——1840年以来西方档案观念与战略的变化[J].外国档案工作动态, 2011 (12).

93.国家档案局2017年部门预算[EB/OL].[2016]. http://www.saac.gov.cn/uploadfile/daj/00e04ce089701a518a9c02.pdf

附录1上海图书馆盛宣怀档案项目访谈实录

笔者调研上海图书馆时分别针对平台建设,团队建设,项目开展原因,国内开展众包难点,任务设计,审核机制,机构合作,任务发布,政策方面,激励机制反面,版权问题,培训方面,信誉机制,对档案馆开展众包的建议,项目成果,整体流程等问题进行了访谈,以下是相关的现场采访实录(部分摘录)。研究论文代写

A.平台建设方面

1.问,你们这是第几期项目?

  答“我们这个项目其实已经是二期项目,我们总共有两期项目”“平台建设思路是:前期看了一个亚马逊的土耳其人,然后最近有一个美国国会图书馆也有一个众包平台,那个平台其实跟我们这个感觉上是差不多,是类似的。然后我们当时还参考了澳大利亚的一个报纸数字化众包项目。”“一期建设的平台还很不稳定,经常会出问题,然后二期的时候我们是从结构上重新做了一个网站,还有就是一期相当于只针对上海图书馆的众包网站,只有我们自己才可以在后台发布管理任务,二期的时候我们是把平台开放出去的,只要我们验证了用户的资格之后,那么他也是有权限对外发布任务(发包)的。还有一个就是我们在抄录方面改进了,允许多人抄录,这个需要在发包的时候进行设置,比如这个任务允许三个人进行抄录。”

2.问,技术方面的平台建设?

  答“从技术上讲这个平台建设没有很大的难度,主要就是一个常规的网站。主要是流程上比较复杂,反复商榷。”“发布者平台设计这边真的很复杂,发布者这边我们前前后后反复挺多的,平台开发在这方面花的时间长一些。像设计什么的主要就是清爽一些干净一些就行了,也不需要一个很花哨的平台。”“目前国内找不到可以合作的第三方平台(如flicker),就是国内现在我没有看到比较成熟的可以发布出去可以抄录的。但是是针对性比较强的比如它自己有内容然后去发到网上。就像澳大利亚的那个TROVE报纸,他们只针对自己发布出去的内容,没有办法是说把我们的内容放到上面,它就是一个报纸的网站,我不能说把我们盛档的内容塞到他们的网站上去,这个是不现实的。”“(平台有待完善的地方)就是一个是我之前说的多人抄录那边其实可以加入一个机器的自动合并,就可以减轻(专家的负担),就比如说这个字三个人抄录的都是同样的,然后我们可以用同样的颜色标注出来,可以让专家看起来更轻松一些”“我们是希望更多的机构一起来用,如果大家都有需求的话就避免重复建设的一个问题,没必要你建一个平台我建一个平台,大家需求都是差不多的。”“我们这边是想把它做成一个平台,大家都来用的一个平台,也不局限于说只放报纸的内容,你放信也可以,哪怕你把书籍放上去,你有这方面的需求也行。”“平台放上去要先测然后才开始推动。因为你放出去用的话最起码要保证这个功能,因为(任务)本身难度已经很高了,你再在技术层面卡别人(用户),比如说我保存提交不了,那这种事情人家就更不乐意做了——我已经辛辛苦苦在那里抄了。所以说我们整个比较谨慎,想让这个完善了之后再推出去。”研究论文代写

B.团队建设方面

1.问,谈谈目前的团队建设

  答:团队建设“有个数字人文的团队,有很多项目,众包是其中一个。项目基本算是已经建成了。”“我们现在放的盛档,是历史文献中心,在过去对十几万的盛档进行了一个元数据著录,这些都是前期他们都已经做好的,我们只是在他们的成果上,把他们的东西发布出去,希望大家来进行抄录,是这样子的一个过程。所以说没有所谓的众包中心,只是想把已经加工过的档案再加工一次,把它们放在网上。所以说并不需要一个中心,或者很多人力来操作。”“我们目前是十二个人,这个团队(数字人文)固定人员有六个人左右,因为我们是信息网络中心,所以我们基本是计算机技术方面的背景的,我们在建设的时候会请历史文献中心的老师来要求跟我们过一遍,看需求是不是符合他们的要求。”“比如说需求方面会和历史文献他们讨论说:你觉得要插入一些什么,然后南大那边会有一些学生,他们来实习的时候,上次有几个实习生,待了两个月,然后就会操作系统,进行体验。因为我们对系统太熟悉了,有的地方看不出来问题,就是要请别人看。”“因为我们这个中心是为整个图书馆服务的而不仅仅是数字人文。我们的系统啊借书还书啊微信公众号啊这些都是我们这个中心在做。所以说人力上如果有其他事情的话可能会暂缓一下。众包不是一个非常重要的,因为它不影响到我们的正常服务。像东馆那边的话关于一些开放需求是会影响到那边正常开馆的,优先级肯定是高于这边。研究论文代写

C.项目开展原因

1.问,如何开展这个项目

  答:项目开展原因“我们这个团队是做数字人文的,馆内的资源是都影像化过的,但缺少文本化的资源”“我们这边是研发部,我们使有一半以上的同事都是在做数字人文这块的,数字人文工作的话,众包是其中一个工具性的,一个基础的东西。就是说我们建起来是有必要性的”“我觉得中国数字人文这块最大的障碍就是没有文本化的资料。在技术上面现在是没问题的,就是文本化的资料太少,我们目前只做了元数据著录这一块。”“之前也有请过几家公司来进行加工,但外包成本非常高,再加上其实时间上的消耗也非常大”“外包那边的话是成本提高的,我们当时请他们抄家谱上面的shi ming(石铭?)字,但他们做出来的准确率和结构化很高,那个成本的话可能一个家谱就要几百万,那个成本真的是非常高的。”“手稿的繁体字、毛笔字问题,会导致识别的困难”“刚好那段时间众包的概念比较热,我们就想两样结合一下,做一个历史文献的众包,也就是说请大家来帮我们一起抄录一些。”

D.任务设计方面

1.问,怎么设计任务模式呢?

  答“其实主要是因为我们这边有几位老师是参与进来的,大家把需求做出来,主要是想我们这边要做什么,比如说我们要抄录,那么抄什么,一个就是抄全文,一个就是抄元数据,因为元数据就是,你全文都抄了,那你顺便提取一下关键字段。在这样一个想法下,我们确定了需求就是元数据著录和全文抄录。”研究论文代写

“现在主要考虑历史档案,像近代印刷这些档案,使用OCR识别就可以识别出来了,是没有这个需求的。”“比如一封信有三页,我们会想当然地放在一份文件夹里面。”“(目前不考虑添加标签这类众包),我们现在还没有这方面的需求,我们这个平台建设的初衷就是为了文本化。做完文本化我们后期可以利用机器学习,把一些知识点提取出来,因为人工打标签其实是很累的,数字人文现在有人名词表、地点词表、还有一些事件词表,那如果我们一旦把这些资源进行文本化后,我们就可以利用机器学习把这些词提取出来,提出来之后就可以大致就是说已经有一个标签在上面了,比如说里面提到了哪些人,这些都是可以罗列出来的。”“他们(南京大学)是一个竞赛,所以我们尽量会使任务的难度是差不多的,每个任务里面,难度低的占一半,难度中等的占1/3,剩下一两份的难度高的,发到他们的竞赛用,总要放一些难度高的是为了拉开他们的距离。”“不开展OCR校对的原因:你不好让人家只改几个字,然后又提交,这样成本是很高的,就像刚刚说的,国内的审核比较麻烦,不像国外的那种,校对完可以马上看得到,这个是要我改完,专家再审核,再把它发布出去,那如果后面一个人看到了,发现又有错误,又想改,又要审核。这样整个流程在可行性上面就不是很流畅,然后成本也是比较大的。”

E.审核机制方面

1.问,这边的审核机制是?

 答:审核机制“我们现在还是请一些认识的人,也是这方面的专家进行审核。”“其他的方面我们设定的是,抄录用户累积到一定的积分,抄录的质量很高的情况下,我们可以把他的角色添加一个专家的角色,然后根据他完成任务的方向,打上一个标签,比如盛宣怀标签,我们发布任务的时候任务也是有标签的,我们可以把两边标签匹配起来,发送推荐给专家。”“我们这个众包平台也对其他想要众包的机构开放,他们也会有自己的专家,我们可以给他们注册这个身份。”“和南大合作那个,我们请了他们那边博三的,专门研究这块的,他们是非常厉害的,他们是可以完全看懂那些潦草的书法的,术业有专攻嘛,所以去找那些专业性强的人替我们进行审核是可以的,但是这样的话,审核成本也是比较高的。”“现在就是请多人抄录的话也是减轻了他们(专家)的负担,比如三人抄录的话,审核的时候是可以做一个比对的,这样子可以相对地减轻一些工作。我们后期的话想过就是增加一个机器的直接对比,但是这个只是一个想法,目前还没有做。”不考虑大众投票机制的原因:“我们最终希望的成品是得到一个准确率比较高的,我们专家在审核的过程中是直接进行修改的,专家打分是一个方面,然后他在打分的同时,自己也在进行一个修改,我们最后的产品导出来是一个比较靠谱的成果,如果是点赞这样子的比较方式,那如果这个人前面抄的完整一些,那个人后面抄的完整一些,那这个的话,一方面是说这个平台目前活跃人数不多,点赞的话,三两个人给两份结果点赞,到底是哪个好,也体现不出来。最好的方法就是对比一下,请专家结合修改。”“这个审核没有一个具体的标准都是专家边审边改。”“对也没有办法说正确答案是什么。只能说比如信函你念一念语句都是通顺的是对的那么我们觉得就是可以的了,就是说在专家审核完之后。”研究论文代写

F.政策方面

1.问,政策方面如何?

  答:“政策方面”我印象中领导一直是很支持的”“没有(相关政策)。我不是很了解(政策),我们基本上都是大家去想要建一个什么样的网站,我们就开始从需求做。”“因为我们馆有四五百个人,中心也有二十多个,然后中心下面又有很多部门,我们不可能每件事情都经过政策同意后再实施。研究论文代写

G.激励机制

1.问,执行什么激励机制?

  答:“因为是有一个竞赛,竞赛是有奖励的,所以才会有学生来报,如果没有奖励的话他们是不会来报的,因为它毕竟是一个需要投入时间的工作,所以如果没有钱上面的奖励的话比较难吸引。” “因为是有一个竞赛,竞赛是有奖励的,所以才会有学生来报,如果没有奖励的话他们是不会来报的,因为它毕竟是一个需要投入时间的工作,所以如果没有钱上面的奖励的话比较难吸引。”“是这样子,就是和南大那边合作是在请他们帮我们内部测试试用的情况下,所以说有钱上面的一个(投入),实际上现在有很多众包平台他们是给钱的,“土耳其机器人”那个都是有钱上面的(投入),就是是你抄一条有一分两分,抄两条有多少分这样子,我们是因为政策上的原因我们是不允许在平台上面有一个支付,所以这种情况才会说和机构合作,比如说他们自己发布,他们自己找人抄录,他们就可以自己进行一个流水线上的操作。”“讲实话我们还是希望有钱上面的一个驱动的。”“因为现在我们还是在进行一个测试,所以我们这一笔而且是第一次进行这样的合作,我们也在资金上把握不准。资金上发给他们奖励只占一半这样子,还有一半是在专家上面的。因为你请专家这边的话肯定是要给钱的,不然的话没有人会无偿的给你进行这么大工作量的。”“像我们团队我们发出去二十个任务,就是二十个团队在抄录,但是审核的话不会是你分开二十个专家来抄,专家只有两三个在那里抄,他们的工作量是很大的。所以资金方面有一部分是给专家的酬劳,这方面其实是都需要钱的。”“如果以后我们平台更成熟了之后,我们想办法把抄录内容的难度降低,流程化更流畅的话,最好是请人自动的通过兴趣爱好激发来抄,当然这只是一个理想化的状态。”“积分的话就是一个排行榜,让大家看一下,就是比如说有一些人还是比较喜欢自己的名次在上面,它就是一个游戏化的一个元素放到这个平台里面。”“还有就是积分兑换,但是这个不是我们思路上的问题,是一个政策上的问题。我不知道该向去哪一个方向去进行改良。”“后期的话可能比如说没有资金上的推动的话,可以用积分来兑换东西,书籍之类的,有这个想法,是可以的。但是,这个平台在物质方面我们是比较小心翼翼的,我们作为一个事业单位是不太好在网上进行一个物质上的刺激或交易的。”“我是觉得这样(物质激励)可以吸引更多的人,让用户活跃度上去。但是具体能不能做我们现在还没有继续往下推这一步。”“等级激励也可以,就是一个title上的激励,就比如说到哪一步给你一个专家,现在好像有几个国外的网站就是积分达到一定的程度,就会给你一个称呼上的变动,这也是可以的。”“就是我们现在都是以精神上的为主,如果是一个商用平台的话我会建议是用物质激励为主的激励方式。因为现在我们的性质是图书馆性质,所以是以精神激励为主,或者说只有精神激励。”“就是我们实际一点,我们希望有人来抄,你看一看的这个浏览量对我们来说意义不大,我们是需要抄录的人,就是我们要活跃在里面的用户。”“公众宣传的话,就是基数大了以后一百个人里面总有几个人是感兴趣的,但是这样子效率可能会低一些,定点的推广可能效率更高一些。就是我们定点的推广成本十个人里面可能有八个人是感兴趣的,如果是大众的话是会吸引人的眼球,但是真正会抄录的人是可能会少一些。”研究论文代写

H.信誉机制

1.问:执行什么信誉机制?

  答:“大家抄之前我也没有办法知道大家的水平,抄完了以后我们是没有退回的这个功能的,因为我们是为了保证大家不要乱退,所以我们是没有退回的这个功能。你认领完了以后,我们可能是会在专家审核的时候给你打零分,就是作为一个完全不符合要求的。但是你说他下次再交你还是得收啊,万一他那个项目抄的好。我们是没有办法拒绝哪一个用户,我只能说是拒绝你交上来的某一个任务。”“因为我们现在还没有那个用户基础。我们现在不敢踢人,我们希望大家都来,哪怕你看抄录两个字也都是对这个平台是好的。”“有的人就是喜欢抄了退抄了退,但他有时候就是会认真抄一些。因为你抄的不好对专家来说退回是没有什么成本的,他只要看一眼这一页有二十个字你只抄了两个字我就直接打一个零分退回就行了。也不是说需要花大量的精力。但是如果写一起奇奇怪怪乱七八糟的这类用户我们是肯定是会禁止。这种性质的我们是会禁止,但是只是抄录完善上的我们不会去剔除。”

H.版权问题

1.问:有遇到什么版权问题吗?

  答:“就是其实我们发布出去的那些任务,从理论上来说有一部分是不对外开放的,但是你让别人抄你只能开放出去,这一点倒是像我们领导请示过以后才把它往外发的。”“就是你发的内容不是说我什么都可以往外发,因为我们这一批是比较早的,也没有说是权限问题,已经是超过一百年以上了。如果有的比如说民国时期的,可能不太好把它(发布),就比如说我们有很多名人手稿,那些可能还在版权期限内的那些比如写的剧本、手稿、书信这些东西我们是完全不能放上去的。这次初触及到一个法律上的层面,我们也不能保证。因为这个方面现在没有很好的法律保障。”“权限,因为是这样子,我们有太多的东西,总有一批是可以对外开放的,而且那批对外开放的量也是很大的,作为图书馆档案馆这样的我们真的是积累了很多东西,很多包括古籍实际上是数字化的东西开放出去,其实我们是希望大家都开放出去,多多益善的。这些没有版权问题的大家就共享一下。就是说现在最大的问题其实是抄方面的问题,而不是发布上权限上的问题。”“因为我们这边在做项目所以有一些资料。手稿不对外开放,之前开放过一段时间后来就不开了。”研究论文代写

 

附录2:广东省档案馆访谈实录

分别对广东省档案馆馆内数字化情况、开展众包可行性、开展众包必要性、任务选择问题、平台建设问题、激励机制、质量审核机制、开展众包的建议进行访谈,以下是相关的现场采访实录(部分摘录)

A 馆内数字化情况
  1. 问:馆内目前的馆藏和数字化率是?

答:“(档案数字化)做完今年起码有95%以上了。” “我们没做OCR。” “这个OCR肯定有它的好处,但是必要性还要考虑,当然做了肯定有它的好处,可以方便查找嘛。特别是做数据挖掘可以有一个基础嘛。但是投入会很大的。” “我们这个(历史档案)比例不高。我们这个馆的馆藏还是以建国后的为主。”

B 开展众包可行性
  1. 问:可否在档案馆开展众包?

答:“这是一个好的思路,有条件的馆做一做还是有意义的。” “我觉得这个是挺好的设想,互联网时代,这个对各行各业都是这样,我们可以尝试,但刚刚我提到的都是我设想的,并没有真正去做,只是我的 一个主观的判断,我觉得这个是不可能做到一个大众的事情的。根据我对档案的了解尤其是我们认为有必要去做众包的对象,那我们如果自己完全有能力去做的也没有必要去众包。现在要想拿来做众包的,都是为了解决馆内自己做有难度,希望借助社会力量来解决它,本身出发点是这样,但是真正社会上对这个资源、对这个档案能够胜任去做的、能为我们提供这样的服务的人数是不多的。” “技术上问题不大的。” “所以说(用户)没有这个专业训练是很难识别的。当然你们有这样的文化基础,通过一定时间就可以学会,但不是说每个人都能做。”“ 图书馆做这方面我认为可行性会高一些,图书馆本身的资源没受那么多约束,档案资源受的限制比较多,不适合用于开放出去。特别是还没有到开放年限的档案,你是不可能放出去的。” “他首先要能做得了才能去参与,一看就觉得我没有这个能力去胜任,你看现在包括外语的一些,很多人也想做人家开价也很高,但是这个没办法,他首先要具备这样的能力嘛。”研究论文代写

 C 开展众包必要性
  1. 问:是否有必要开展档案众包?

答:“每个馆都有自己特色的东西,像我们馆的馆藏是以建国后为主,我们一百多万卷册的馆藏,我们建国前的馆藏才五六万卷,比例很低,所以对我们馆来说众包的必要性不大。” “包括馆藏的开放程度有多高,如果才有百分之十几二十的开放比例,这么低的比例去做就没必要了,没开放的也不可能拿来做众包对不对。” “从我们国家来看首先是开放的比例很低,里面需要做的不多现在。” “对我们省馆来说,(开展众包)应该是意义不大。” “按照目前的发展,很多东西都可以馆内自己完成。像历史档案众包的话,民国手稿能做(抄录)的人本身就只是社会上的一小众。有多少人会有兴趣去做是一个疑问,做完之后的质量是否能够达到我们的需求,还需要再检验一遍。还要自己去对一遍的话,那我还不如自己做了?就是众包后的质量谁去确认?如果用户修改了,还得再去看原文核对一遍,这个比对不可能是机器识别的,还是要人工,这样意味着我们馆还要派一波人去比对,那你原来的众包的意义何在?” “这个有需要的话是可以做的,就像我刚才说了,我们数字化前期的基础工作做完了以后可能是下一步需要去考虑的了,这个对档案的深度开发利用是很有必要的。” “我们起码要等到前期的数字化,图像化吧,两阶段,把这个纸质文件变成图像之后,这个工作完成了以后,我们要做数据挖掘呀这些工作的时候就会可能要做这个工作了。

D 任务选择
  1. 问:什么样的任务适合用于众包?

答:“比如说七十年代包括六十年代也有,铅字打印的,识别率就很高了,80%、90%都可以达到的,但有些字迹模糊需要校对,机器识别容易出错,这一类做这种,参与人数会很多,不像早期的手写体,尤其是繁体的手写体。” “添加标签是很有意义的,因为每个读者看到这个东西(档案)后,比如一篇文稿,他觉得哪个对他最有价值他就标识那个了,给一篇文稿让大家选关键词、主题内容,提炼,每个人的选择结果不一样,以后著录的内容就会,挖掘的深度就会,文献提供利用就会有一个比较好的基础。” “按照目前的发展,很多东西都可以馆内自己完成。像历史档案众包的话,民国手稿能做(抄录)的人本身就只是社会上的一小众。有多少人会有兴趣去做是一个疑问,做完之后的质量是否能够达到我们的需求,还需要再检验一遍。还要自己去对一遍的话,那我还不如自己做了?就是众包后的质量谁去确认?如果用户修改了,还得再去看原文核对一遍,这个比对不可能是机器识别的,还是要人工,这样意味着我们馆还要派一波人去比对,那你原来的众包的意义何在?”研究论文代写

E 平台建设
  1. 问:众包平台该如何建设?

答:“现有的平台有这方面的功能的话,肯定最好是利用现有平台。再去重新开发一个平台我认为意义不大,因为这些工作始终有一天会做完的。” “做开发就没有必要了嘛,即使你要搞一个这样的专业众包平台,还是要找外面的专业公司来做。” “是单独一个网站还是作为其中一个模块嵌入原有的系统,这个都问题不大。” “但是原来比如说一些门户网站已经很有影响力了,当然最理想的状态就是嵌入门户网站中去作为一个模块,大家就可以在上面来用,就没必要再另起炉灶了,因为再另搞一个的话,别人都不一定知道。你还要再花时间做推广做宣传,是吧。”

F 激励机制
  1. 问:激励公众参与的方式有哪些?

答:“在我们目前国内的环境看呢,打赏(物质激励)会更合适一些,能够吸引更多人参与。” “物质激励和我们现在财政经费的申请有一定的冲突。” “可以我们提供一些档案精品的图片给公众下载啊,给公众更多的权限。” “金钱上的激励也不是绝对不允许,但是可能会比较难,因为这种经费的话,会受到很多限制。” “不可能大众参与。不现实,不会实现普遍意义上的大众参与的,我一再强调这个是一个小众的事情,不是大众能做的事情,所以外包(众包)的这种即使是在网上去做,也只能是一小部分人,首先是一小部分人才有能力去做,那这部分人他愿不愿意去做又是另外一回事,是能说是一小部分人里面的一小部分人,这样的一种情况”

G 质量机制
  1. 问:如何管控众包质量?

答:“请外馆的人来我们这里参与实际工作这不可能的,只能说咨询性的、指导性的培训可以,短期的,让他具体参与,那些离退休的都比较难请,不要说在职的了。” “(专家审核)好处肯定很明显啦。说实话民国档案,尤其是早期的,不是一般人能看懂的,我们这边请了很多应届毕业的本科生,也要适应一段时间,可能才会慢慢提高识读的能力。我们曾经想招一个数字化的人员,是一个学理工的本科生,来了之后我们就拿档案给他识别,他看了之后就说对不起我看不懂。这是实实在在的案例。就像你们现在读书,有多少机会能够去接触历史文献呢?所以说没有这个专业训练是很难识别的。当然你们有这样的文化基础,通过一定时间就可以学会,但不是说每个人都能做。”研究论文代写

H 开展众包建议
  1. 问:对开展档案众包有什么建议?

答:“每个馆的进度不太一样,包括我们数字化的这个图像,现在国内档案馆相差很大,有的馆还没有怎么做,有的馆做到比例已经是非常高了,所以它处在不同阶段,把一个模式推广到所有档案馆不太现实。” “要想达到比较理想的效果的话,负责这个分包的,提要求的,设定具体内容来希望参与者提供怎样答案、信息的,确实要做好前期的功课,包括对这批资源事先的一些了解。……就是作为组织者要非常清楚,效果才更好,否则针对性不强。”研究论文代写

研究论文代写
研究论文代写

更多其他:文学论文代写  商科论文代写  艺术论文代写  人文代写   Case study代写  心理学论文代写  哲学论文代写  计算机论文代写

合作平台:天才代写 幽灵代写  写手招聘