视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
档案数字化方案
2025-10-02 19:22:03 责编:小OO
文档
档案数字化方案

数字化方案是指将纸介质的文件信息进行电子化处理,以便于存储、管理、共享和查询。随着信息化时代的到来,数字化方案已成为国际潮流和信息资源建设的重点之一。在数字化信息资源建设中,将现有的纸介质印刷品数字化,是很大的一个需求。数字化方案可以通过CD-ROM、网进行出版,或上传数字档案馆供用户使用。这样可以减少文件库房占地,节省保管设备和人员方面开支,又方便统计和进行远程查询。

为了实现数字化方案,需要进行数字化加工作业前期准备。这包括数字化工作人员准备、数字化工作软件、硬件准备以及确定数字化内容、数量及用户需求。数字化加工流程及主要技术方案包括入库提卷、拆卷、标引著录、档案扫描、图像处理、全文OCR、生成双层pdf、板式还原及格式、总质检、批量挂接、还卷及数据备份提交等步骤。为了保证数字化方案的质量,需要制定质量控制方案和保证措施。加工质量保障措施包括多环节、多层次的质量检查体系,阶段性验收与终验相结合的严格验收程序是质量控制的终级保障。此外,为了保证安全保密,需要签署保密协议。最后,售后服务也是数字化方案的一部分,需要提供完善的售后服务。

总之,数字化方案可以提高档案的存储、管理和查询效率,减少文件库房占地,节省保管设备和人员方面开支,又方便统计和进行远程查询。在数字化信息资源建设中,数字化方案已成为不可或缺的一部分。

为了实现资料的数字化,需要将档案、期刊、文件等资料通过扫描仪,扫描成图像文件,再通过处理转换成电子文档,建立目录和索引,制作成电子文件。这是目前当务之急。

公司简介:

XXX(前身是XXX)成立于1994年。该公司是在原XXX的支持下,为推进国家“211工程”高等学校中英文图书数字化国际合作计划(China-America Digital Academic Library)“CADAL”项目而成立的一家高新技术企业。公司拥有先进的OCR(双层PDF光学字符识别)技术、图像扫描处理系统、生产流程管理系统,实现工厂化流水作业、智能化质量控制与管理的具有国际领先水平的信息数字化工厂技术。该公司可同时为图书馆、档案馆、、企业提供信息管理系统和信息资源数字化加工服务。

经过六年的不断探索和实践,公司建立了一套完善的服务于各领域的业务体系。对于档案馆,该公司提供档案综合管理系统、档案、古籍、期刊、论文、文献资料数字化加工、档案著录、OCR、MARC数据制作、档案馆设备及耗材提供等服务;对于机关,该公司提供数字档案管理系统、历史陈旧档案数字化加工;对于医疗、保险金融领域,该公司提供病历、保单等数字化加工、数据录入服务、全文OCR等服务。

第一节:数字化加工作业前期准备

一.数字化工作人员准备

1.甲方人员

职务:现场交接管理人员

人数要求:一名

专业要求:为学校档案馆负责档案管理工作的技术或管理人员。

职责范围:

①.负责与乙方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录并签字。

②.负责监督乙方规范化加工。

③.随时把握乙方加工进度并进行协调。

④.及时关注并抽查乙方加工质量

⑤.代表甲方与乙方进行及时的沟通及问题协调,确保项目顺利完工。

2.乙方人员

管理人员

主要为:熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现场管理及沟通能力的乙方负责人。

工程技术人员

主要为:熟悉计算机软、硬件技术,了解档案数据库标准和系统开发。了解档案管理等相关专业知识的乙方技术部技术支持工程师。

数据采集作业员

主要为:了解档案数据库数据标准和计算机软件应用等相关知识的乙方数字化制作部工作人员。

人员安排见表3-1.

1.负责组织和设计施工方案,并管理施工进程。

2.负责保障施工条件,并与甲乙双方沟通协调项目进展。

3.管理现场人员和加工流程,包括数据终验和挂接。

4.协助项目负责人与乙方沟通协调工作。

5.项目负责人不一定常驻现场,但需要通过通讯手段和定期督导掌控加工进度和质量。

6.将档案卷内目录及索引信息手工录入为电子数据,并进行校对。

7.按照技术规范将档案资料进行扫描处理,包括去污、纠偏、文字处理和拼接。

8.矢量化人员负责将处理好的图像进行全文识别、校对、板式还原和格式转换,并进行初验和终验后交付现场主管挂接。

9.硬件设备数量和档次根据数据采集工作情况和数据量大小进行配备,甲方提供PC机和办公用具,其他硬件设备由乙方自行解决。

10.软件配备包括综合档案管理系统、数字化流程管理和加工软件、OCR软件等。

11.甲方提供场地、电力和饮水等条件支持。

确定数字化内容和数量以及用户需求是数字化加工前的重要步骤。为了确保施工准确,需要制定相应的方案和技术控制。XXX通过用户需求调研表来了解用户需求,包括档案类型、档案数量、数字化准备情况、纸张及保存情况和备案数字化方案等。根据需求,制定数字化方案和加工流程,包括提卷、拆卷、档案著录、扫描、图像处理、OCR、校对、版式还原、转双层PDF、终验和挂接等步骤。在加工过程中,要严格执行档案交接手续,保证档案不损失、不丢失。同时,需要对档案进行整理、修复和装订,确保档案整齐、牢固、材料不松动、脱落,并保持与原案卷一致。标引著录时,需要按照XXX的标准结合用户需求进行录入。

数字化档案方案的校对方式包括软件校对、打印输出和对比校对,错误率低于万分之二。档案目录的数字化采用原始数据录入,卷内目录和卷案目录的样式可根据用户需求进行调整。对于修改和补充的数据,需要填写更改资料,并将其放入原案卷内,同时补充完整卷内目录和其他不全的信息。

在数字化档案中,扫描方式应根据档案幅面大小选择相应规格的扫描仪或专业扫描仪进行扫描。对于大幅面档案,可以采用加长式扫描或图像拼接处理方式处理,对于同一页面有两个以上文件的情况,需要分别扫描。扫描色彩模式以黑白二值扫描为主,附有灰度(彩色)照片及原件分明度很低的档案,可视情况采取灰度和24位真彩色扫描。扫描后的图像再辅以黑白二值保存,以提高图像质量。

分辨率方面,无全文检索需求的文档分辨率调整为200DPI最为合适。需要全文检索而做OCR识别的文档,黑白二值扫描分辨率最佳为400dpi,此分辨率下识别成功率最高。24位真彩色扫描分辨率标准为200dpi。图像文件大小方面,黑白二值扫描A3页面为20K—40K,灰度或彩色扫描A3页面为100—150K。

在数字化档案中,如果遇到字间距和行间距过密、原件本身是复印件等字迹不清楚的情况,可适当增加扫描的分辨率,但要保证图像清晰的同时,又不影响远程查询和浏览的速度。扫描图像字迹清晰、颜色恰当,不宜过浅或过深,并且不得出现字迹笔画残缺或字迹笔画叠合而影响阅读的情况。即使原档案存在锈斑变质、颜色过浅或深浅不一致,也要保证扫描图像可读,扫描留下的墨迹宽度不得超过厘米,并且指印和黑线不能覆盖或影响正文内容。

根据档案实体情况,在档案电子文件中相对应目录设置“复制件”、“原件不清”标志。目录以原有档案目录为准,在实际处理过程中著有未归类的新目录。可根据情况修改目录,增加或调整标准目录,对档案原目录数据修改或补充的数据,需填写更改资料,更改资料放入原案卷内,能实现一条目录对应多个图像和一个图像对应多条目录的编目。

图像时,应特别注意这些细节问题),以达到清晰、干净、完整的效果。

4.裁切:对于扫描图像中的边角、黑边、空白区域等进行裁切,使图像内容与原图页面一一对应,不得出现内容残缺或将旁边页面信息扫入本页的现象。

5.压缩:对于扫描得到的大文件进行压缩,以节省存储空间和传输时间。但是,在压缩过程中,需保证图像质量不受影响,不得出现失真、模糊等情况。

6.格式转换:根据用户需求,将扫描得到的图像转换为不同的格式,如PDF、TIFF等。

7.质量检查:对于处理后的图像进行质量检查,确保图像质量符合要求,没有遗漏、重复、错页等问题。

8.归档:将处理后的图像按照档案编号、文件编号、页码等信息进行归档,并备份存储,以确保档案数据的安全性和可追溯性。

9.工作记录:记录每一步操作的时间、人员、工作内容等信息,以便后期查找和追溯。同时,及时反馈和处理出现的问题,以提高工作效率和质量。

扫描方案的图像内容应当实时监控扫描全过程,遇到漏扫、重张、黑边、偏斜、折角、不清晰等情况,应进行重扫或补扫。扫描件必须与原图页面一一对应,不得出现颠倒、缺页、重页或错页情况,同时不能有遗漏、重复、扫错等问题。图像内容与书本面必须完全对应,不得出现书页内容残缺或将旁边页面信息扫入本页的现象,同时需要进行处理以达到用户需求。对于纸张较差的历史档案扫描,需要保证档案安全,同时保证扫描质量尽可能清晰、干净,以达到高效高质的完成任务。

在图像处理过程中,需要逐张检查图像质量、纠偏、去污、裁切、压缩、格式转换等,同时进行质量检查和归档,确保图像质量符合要求,没有遗漏、重复、错页等问题。同时,需要记录每一步操作的时间、人员、工作内容等信息,以便后期查找和追溯,及时反馈和处理出现的问题,以提高工作效率和质量。

50%的情况下,页面上可能会有零星的污点和反面倒映文字污点,这可能是由于印刷质量或纸张质量等原因造成的。如果在页面视图下看不清楚,或该污点嵌在文本行中无法清除,可以不清除,但应尽量保证图像可读。

为了提高图像的清晰度,修正原资料中存在的字间距和行间距过密,文字较深或较浅,字迹不清楚的缺陷,可以对原始档案进行加深和变浅的处理。

对大幅面档案进行分区扫描形式的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性和数字化档可读。对于照片页,必要时采用专业的图像处理软件进行处理,确保照片的清晰度。

存储格式以G-4压缩TIFF格式保存。对于A4幅面档案保存文件,不得大于100K。其他幅面档案扫描形成文件,在保证影像质量的前提下,尽量缩小文件占用空间。扫描文件存储命名必须与条目档案号一一对应。

将扫描处理完成后的文档利用专业的识别软件进行全文OCR,如甲方对识别成功率有严格要求的,还需另外进行人工校对,校对结束后将版式还原及转换成双层PDF文件格式。根据用户对识别率的要求,可选择性进行人工校对。

不进行人工校对的优点是效率高、成本低、能利用原文检索浏览速度快。缺点是识别准确率取决于原件的质量,所以准确率不稳定。适用于原件版面干净及保存完好的资源,或原文中只含部份核心检索内容的资源。

进行人工校对的优点是全文检索无差错,准确率可达99%,且文本层和图像层一一对应。缺点是效率极低、成本极高、因为进行了版式还原,所以原真率不到98%,而且存储空间很大而致浏览速度降低。适用于所载信息珍贵且使用频率很高的资源。

数字化项目需要充足的资金预算和充裕的时间资源来实施。此外,还需要有良好的硬件环境支持。

总质检阶段需要对扫描处理后的图像页进行全面检验,包括档案拆分、扫描、修正、去污、插图、照片的处理以及文本和图像页的匹配等质量。如果发现质量达不到要求的情况,需要进行重扫、补扫等操作。同时还需要对文本域录入、文本录入域的标引、文件的页号和页数进行对比,确保图像版面清晰、干净、大小一致、方向一致。主要质检标准包括电子影像在总数量、完整性、清晰度上与源文件保持一致,案卷著录、按文件的属性著录数据库字段,电子影像档案件信息定义数据差错率控制在百分之二以内等。

批量挂接阶段需要将扫描图像信息与录入到档案管理软件系统中的目录进行对应挂接,确保目录与原文的一一对应。挂接到档案管理系统中区后,还需要进行再次的成品验收。

还卷及数据备份提交阶段需要严格按照XXX规定的相关标准和实际情况进行有序的还原。将还原的档案资料逐卷精心检查,确实没有落页、掉页、折页等问题后再归还档案管理人员。同时需要建立数据备份制度,将所有成品数据备份,提交给用户。刻录光盘时需要制作两份,制作成档案数据格式为多页TIFF的光盘单盘调阅,并且同一份文件不跨越二片DVD片号,电子档案存在于符合标准的单片包装光盘。

1.标示光盘编号,将光盘内主要信息注明在单片包装盒上。

2.在光盘刻录完成后,进行一次与硬盘系统中电子档案的比对,以确保档案资料无遗漏且正确。

3.制作光盘人员需对所有光盘序号进行标记,并提交相应表格。

档案数字化方案

第三节:质量控制方案和保证措施

项目加工总体质量目标:保证合格,争创优良!

一、加工质量保障措施:

1.严格遵照执行我方签定的《不分包、转包三峡大学档案数字化项目承诺书》,避免项目转包、分包引起的管理混乱和质量风险。

2.严格按照我方制定的人员和设备投入计划进场加工,确保人员设备供应,为项目进度和质量提供保障。

3.在该项目加工过程中,我方所有现场加工人员均受我公司《数字化作业人员质量考核制度》的约束,并承担相应奖罚结果。

二、多环节、多层次的质量检查体系:

1.对档案签收和属性数据录入的质量检查,主要内容包括:档案签收的准确性、完整性和即时性;数据内容齐全,属性数据输入准确;与数据校对的档案交接。

2.对数据校对处理的质量检查,主要内容包括:校对后的数据内容齐全、正确;纸质档案实体完整,还案及时无误。

3.对数据迁移的质量检查,主要内容包括:迁移后的数据的完整性准确性;对数据进行组合查询并且结果正确;对数据进行汇总统计并输出标准表格,试运行无死机现象。

4.在完成以上每个环节后,检查人员将其数据再次进行一遍全面的复查,尤其对检查记录单上更正后的错误进行仔细的检查,确保扫描得来的数据与源文件内容完全一致。

5.实施项目负责人对成品数据进行百分之十的抽查,在抽查时将该查数据的年度、保管期限、全宗号、卷号、卷内顺序号等目录信息是否准确无误,再对获取图像数据的亮度、歪斜、是否错页等方面进行抽查,如有不合格的数据及时进行统计和修正,确保最终数据的准确无误。

三、阶段性验收与终验相结合的严格验收程序是质量控制的终极保障。

阶段验收报告:

项目名称:

项目编号:

报告人:

项目负责人:

时间:

所处阶段:

项目状态参数监控情况:

项目状态:

项目进度:

计划情况实际情况偏差:

扫描纠正措施:

项目工作量(人时):

项目规模:

项目外工作量情况描述(非项目工作):

其他:

工作中遇到问题及困难:

需要用户支持与配合:

用户意见:

用户签字:

签字日期:

终验报告:

项目名称:

报告人:

项目负责人:

项目编号:

时间:

第()阶段:

本阶段项目完成情况:

本阶段的项目包括档案整理、档案扫描、图像处理、索引目录录入、全文OCR、档案数字化方案、报表输出、资料装订、内部验收、目录与图像文件的衔接、数据上传到服务器、数据备份等工作。经过双方的共同努力,乙方所提供的数据基本满足甲方的要求,甲方同意通过验收,进入下一个工作阶段。

第四节安全保密控制:

为了确保采集数据不外泄,公司将不允许加工人员携带任何存储介质进出加工现场。为避免采集数据在硬盘上的物理磁道上被还原外泄,公司将使用乙方提供的电脑用于数据采集作业。电脑上所有可以读写存储介质的接口自进场之日起即贴上封条,直到工程完工。为避免数据采集过程中数据通过网络外泄,公司在加工期间将关闭,只使用局域网完成数字化作业。为了建立并严格落实安全保密制度,保证档案资料的安全保密性,公司将与乙方签订保密协议,并成为合同不可分割的一部分。

保密协议:

鉴于甲方委托乙方承担其档案资料的数字化加工服务,乙方可能接触到甲方某些非公开的、涉密的文件、档案和资料。为了维护甲方资料的安全,保守国家秘密,乙方同意在整理档案中涉及大量的重要的档案材料承担保密义务,并遵守如下保密规定:

1.乙方同意保密涉及机密文件和资料,数字化期间保证文件和资料秘密安全,不得以任何形式向第三方(包括家属、亲友)谈论工作中接触的文件资料内容。

2.在乙方工作人员在工作过程中接触到重要文件资料时,除确有必要(如自拟文件标题,图像处理等需要查看文件内容外)不得阅读文件资料内容。

3.乙方工作人员不得带进、带出各种计算机磁盘、光盘等易于存储文件资料的存储介质。

4.因工作需要必须带进的计算机软件工具类应用软件,须经档案室同意,并在带出时办理检查登记手续。

5.甲方提供乙方所需数字化处理的文件和资料等有形载体,仅限于乙方在数字化加工期间使用,不得擅自带出。

Based on the needs of Party A to produce a digital archive product。Party B is not allowed to copy any of the XXX them to any third party。After completing the work。Party B must nally clean all the data from their work machines。which will then be checked and accepted by Party A according to the contract.

During the project。Party B's staff must not take any archive materials out of the workplace unless necessary for work purposes。They must not record or discuss the content of any confidential documents of Party A.

Party B must take on the XXX agreement。XXX。XXX agreement。If Party B's staff cause any leaks or loss of documents during the work process。Party A will XXX。such as the "Law on Guarding State Secrets".

This agreement is made in duplicate。with each party XXX.

Digital Archive Plan

Party A: Party B:

Representative (Signature) Representative (Signature)

n Five: After-sales Service

1.The parties will enjoy free technical services for 12 months after the contract is XXX.

2.The general technical response time is 24 hours。If there are any data processing quality issues。Party B will arrive at the site within 48 hours to provide services.

3.Party B XXX on the use of archive data processing are for the personnel of the archive。and also provide paid follow-up technical support.

4.Party B guarantees the data quality of the electronic images of the archived materials。If there are any quality issues。Party B will XXX charge.

5.Telephone support services: Party B will provide 24/7 telephone support。The after-sales service phone number is:

6.Online QQ technical support: Party B will provide 5-8 hours of online QQ support。The QQ number is:

7.Email services: Party B will respond to emails within 8 hours of receiving them。The email address is:

8.Regular return visit services: During the valid d of after-sales service。Party B will XXX.下载本文

显示全文
专题