国网临沂供电公司, 276000
摘要:档案数据属于档案信息资源范畴,具备档案的基本属性,既包括档案部门已经掌握的各类数字化档案资源、电子档案等,还包括具有长久保存价值但还没有纳入档案部门保管范围的数据,以及档案管理业务过程中产生的各类数据等。档案数据质量控制,即在档案部门主导下联合业务部门、数据管理部门、档案外包机构等,在相关法律法规、标准规范指引下,采用一定手段对处在形成、运行、传输、保管、利用等过程中的档案数据进行管控,使其保持稳定的质量效果,符合档案工作需求。本文主要分析电力企业档案数据自动分类管理实践探究。
关键词:档案数据;数据分类;数据管理;自动化
引言
在数字时代背景下,企业档案数据增长快、体量大。为充分发挥企业档案数据的资产价值,使其能够准确、清晰地反映业务经营成果,进而推动企业高质量发展,企业在业务经营管理过程中,就需要深入开展档案数据管理,对档案数据分类管理模式做进一步的研究与创新。这里需要指出的是,本文中所提及的企业档案数据自动分类主要是借助专业系统对前端业务系统收集归档到数字档案馆中的数据实现自动组卷/件、分盒、添加管理标识等。
1、企业档案数据自动分类管理的目标及意义
企业档案数据自动分类管理的目标主要在于实现企业档案数据自动整编功能,按照整理规则对整编库中的数据进行模拟组件、装盒,生成档案著录项,自动添加文件标识,比如归档章、条形码、页码等,并由管理员进行复核审查,完成档案的整编。企业档案数据自动分类管理的主要意义在于:第一,实现全程系统控制,减少了人工著录,降低了著录错误率,提升了规范化水平;第二,极大地提高了档案整编的工作效率,降低了人力物力成本;第三,提高了档案整编的规范性,在整编过程中规范归档章、页码、条形码等格式及内容;第四,提升了企业档案数据管理水平,优化了其管理、存储、利用整体过程。
2、大数据时代档案数据质量控制现状分析
2.1档案数据政策法规制度缺失
政策法规制度是维护档案数据质量的重要保障。新修订的《中华人民共和国档案法》第三十五条提出:“保障电子档案、传统载体档案数字化成果等档案数字资源的安全保存和有效利用。”可见,档案数据质量控制在宏观层面已经受到关注,但是,在微观层面上,目前配套的政策法规制度尚未完备,现有的政策标准主要局限于系统规范、数据存储等方面,而对其形成、传输、运行、保管、利用等各方面的规范存在缺失。
2.2档案数据实践处于起步阶段
档案数据化的持续推进倒逼实践部门改善管理理念、更新数据处理技术,但是,档案数据实践尚处于起步阶段,技术应用尚未成熟,实践部门之间缺乏有效联动,档案数据质量控制效果甚微。一方面,档案部门依然更多地将关注点放在档案数据的数量增长上,越来越多的档案馆馆藏档案数字化程度可达到较高水平,但是,档案部门对其馆藏数字资源的管理大多只停留在简单的组织、检索、利用层面,未能对其进行深度的数据挖掘、数据审查及安全维护等操作。另一方面,馆藏资源呈现出孤立、碎片化的管理格局,易造成“数据壁垒”“数据孤岛”等质量问题。如大连市在民生档案数据资源整合共享方面,其户籍档案与大连档案部门的档案是分散管理、各自为政的,“数据孤岛”现象严重,未有做到有效的整合与共享。
3、企业档案数据自动分类管理方案
3.1企业档案数据自动分类管理目标
实现档案数据自动组卷/件,主要实现途径为:数据组卷/件规则的设置、程序设计以及系统处理。实现档案数据著录及编码,主要实现途径为:数据著录规则设计、数据编码规则设计以及系统处理。实现档案数据标识及归档管理,主要实现途径为:数据标记及添加水印、数据检查及处理、格式管理并生成归档文件。实现档案数据模拟封装组盒,主要实现途径为:数据模拟封装规则设计、程序设计及系统处理。
3.2企业档案数据自动分类管理的实施
企业档案数据自动分类管理的组织及实施过程如下所述。1.系统对档案数据进行处理前首先需要进行数据检查,“数据检查”功能将针对打印任务中的数据进行文件下载、文件格式转换(将非PDF格式文件转换为PDF格式文件),在检查过程分别对正常的、异常的数据予以标记。数据检查完成之后,系统就可以进行生成归档文件的操作。生成归档文件功能,可实现将数据进行标识后按照文件顺序合并生成一个版式文档,这样既便于数据应用,同时又便于数据的长期保存。2.档案自动组卷功能需将组卷规则设置到程序设计中,启动程序后,该功能项将待组卷数据分类别归入不同数据卷内。3.生成数据编码功能将会按照规则生成件号和档案编号。其中,件号的生成规则为:同一部门同一保管期限内按照文件形成时间升序排列,顺序生成三位编号(位数不够的,在数字前用“0”补位);档案编号的生成规则为:全宗号+年度+保管期限+件号。生成档案编号之前,系统会对必需的字段进行检查,当存在必需的字为空的情况时,不能进行档案编号生成,必需的元数据项为:部门、年度、保管期限。4.自动模拟组盒功能按照部门、保管期限、页数的制定规则生成盒号,系统默认每盒页数不超过300页,不同部门、不同保管期限的数据不在同一盒中进行混装,装盒时按照“档案编号”字段升序顺序进行。在开始进行自动组盒之前,系统将对必需字段进行空值验证,验证的字段为:部门、保管期限、页数。5.系统设置生成审批单功能,针对档案数据,根据数据目录生成PDF格式审批单文件,并且自动在生成的审批单文件中添加对应的条形码及归档章标识。
3.3档案数据技术保障机制
档案数据的质量由两方面内容构成:一是档案数据自身的质量,即档案数据准确、可靠、可用的程度;二是档案数据过程质量,即档案数据在传输、存储、运行、利用等过程中的质量。因此,可从元数据管控、数据运转过程两个方面入手。(1)打造有效的元数据管控机制。有效的元数据管控机制对于保证档案数据质量具有重要的意义。因此,必须要打造切实可行的档案元数据管控机制,实现对各元数据名称和语义的规范化管控,并尽量以已有标准为指南,加深引用、复用的方式构建新的元数据管控机制。如可利用DublinCore作为基础复用元数据标准,在复用基础上结合大数据时代社交媒体档案数据特征进行元素扩展,制订完整的社交媒体文件元数据归档技术方案,实现海量社交媒体数据的归档。(2)构建科学的档案数据运转机制。科学的档案数据运转机制,能克服档案数据在运行、传输、存储、利用过程中易受到的技术异常、系统漏洞或管理人员操作不当等不利因素影响,保证档案数据质量在全生命周期中始终处于良好状态。一是注重数据审查技术的应用,加强对档案数据的检测、识别,实现对其质量的全面追踪。二是更新数据库技术和存储设备,促进不同来源、异构、碎片化、离散性强的档案数据之间的整合集成,使其在存储过程中保持关联,确保可以重复利用。
结束语
企业档案数据自动分类系统按照规则能够实现电子文件自动组件功能,统计电子文件页数,模拟装盒,生成著录项及设计标识水印,实现电子文件全文检索等。这一系列操作大大提高了企业档案数据管理效率,节省了人力物力,进而可以推动企业提质增效,实现高质量发展。
参考文献:
杨帆,王强.大型企业档案资源分类体系建设实践与思考.北京档案,2020(10):33-34.
霍光煜,张勇,孙艳丰.基于语义的档案数据智能分类方法研究.计算机工程与应用,2021(6):247-248.
王泓.电子文件自动分类方法概述.档案与建设,2017(1):29-31.
高晨翔,牛力.国内“档案数据”研究述评[J].档案学研究,2020(5):11-18.
[5]赵跃,石郦冰,孙寒晗“.档案数据”一词的使用语境与学科内涵探析[J].档案学研究,2021(3):24-32.