• 走进中心
    • 中心概况
    • 领导团队
    • 组织结构
    • 定位宗旨
    • 主要任务
  • 新闻公告
    • 中心新闻
    • 活动公告
    • 学术动态
    • 行业动态
  • 研究团队
    • 专家顾问
    • 研究员
    • 学生研究员
  • 学术资源
    • 品牌论坛
    • 培训课程
    • 学术沙龙
    • 著作
    • 论文
    • 项目成果
  • 知识服务
    • 标准库
    • 法规库
    • Wiki词条
电子文件管理研究中心
  • 走进中心
    • 中心概况
    • 领导团队
    • 组织结构
    • 定位宗旨
    • 主要任务
  • 新闻公告
    • 中心新闻
    • 活动公告
    • 学术动态
    • 行业动态
  • 研究团队
    • 专家顾问
    • 研究员
    • 学生研究员
  • 学术资源
    • 品牌论坛
    • 培训课程
    • 学术沙龙
    • 著作
    • 论文
    • 项目成果
  • 知识服务
    • 标准库
    • 法规库
    • Wiki词条
  • 主页
  • 新闻公告
  • 中心新闻
  • 活动公告
  • 学术动态
  • 行业动态

行业动态 | NARA发布《永久联邦文件数字化法规》(中)

  • 2025-03-12
引言

电子文件档案馆(Electronic Records Archives,ERA)是美国国家档案与文件管理署(National Archives and Records Administration,NARA)建设的专门用于接收、管理、保存和利用美国联邦政府永久性电子文件的综合数字档案馆系统[1]。2015年,ERA2.0项目正式启动;2023年6月,NARA发布了《ERA2.0中的数据于2023年6月20日(起)供各机构使用》的通知,标志着ERA2.0的正式上线,详见行业动态 | 电子文件档案馆(ERA)2.0正式上线!。《永久联邦文件数字化法规》(36 CFR 1236 Subpart E)是ERA2.0项目推进的重要保障性法规文件之一,对永久联邦文件数字化的范围、定义、文件管理要求等做出了详细规定。小编将分为行业动态 | NARA发布《永久联邦文件数字化法规》(上)(中)(下)三期译介,此为(中)。

四.1236.44文件数字化项目

在对永久原文件进行数字化处理时,各机构必须创建数字文档。该机构必须将这些文档与数字化文件一起保存,直到数字化文件被移交给NARA,NARA通知该机构接收过程已经完成。机构必须按照适当的通用文件保管期限表(GRS)或机构文件(保管)期限表处置此文档。所需文档将帮助机构在NARA的ERA系统中填写移交请求文书(TR)。

申请人须提交以下文件:

1 已定义的项目计划,(该计划)确定:

(1)需要数字化的文件组或案卷组;

(2)用于命名数字化文件的方法;

(3)原文件(数字化)的估计日期范围;

(4)缺页;

(5)文件组中的空白或缺失文件。根据空白或缺失文件的类型,指出是否存在跳过或缺失文件的借出管理卡,如果它们在稍后的日期转移,则将被交叉归档;

(6)原始文件的估计容量、载体类型、尺寸、物理特征和状况;

(7)用于文件数字化的设备和软件;

(8)估计数字化文件的存储需求。文件存储需求可能会影响项目决策,例如压缩和文件格式;

(9)适用于文件的任何访问或使用限制;

(10)一旦原始文件数字化,用于捕获原始文件之间存在关系的方法;以及

(11)与§1236.54的规定不同的任何元数据元素标签。

2.将数字化文件与原始文件的文件保存期限表(包括项目编号)相关联所需的任何信息。

3.任何相关的查找辅助工具、索引、馆藏目录、日志、登记簿或机构用来管理文件的元数据方案,这些文件可以作为§1236.54中要求的元数据来源。

4. 质量管理(QM)计划:确保项目符合质量保证(QA)目标和质量控制(QC)检验程序。
(1)质量管理计划必须包括项目的方针、功能、角色、职责、需求和目标。

(2)质量管理计划的质量保证部分必须包括以下文件:

① 选定的图像质量性能参数,以确保捕捉原始文件中的信息;

② 设备及相关验收测试方法与结果;

③ 设计评审,以评估数字化工作流程是否符合要求;

④ 培训记录。

(3)质量管理计划的质量控制部分必须记录:

① 图像质量检查程序;

② 元数据质量检查程序;

③ 为减少偏差,在项目各阶段采取的纠正措施;

④ 验证数字化文件符合要求的程序。

五.1236.46质量管理要求

机构必须通过验证设备是否满足目标点和参数公差,来符合§1236.50中规定的图像质量性能参数。机构不能仅依赖设备规格(如扫描仪 PPI 设置或相机传感器的百万像素值)来确保数字图像质量。

(1) 机构必须采用 QA 流程,以实现以下目标:

① 在设备选择前,通过扫描参考目标并使用分析软件测量结果,以量化扫描仪或相机的性能,确保其符合技术参数;

② 根据图像质量性能参数,评估内部或外部供应商的成像系统;

③ 在数字化过程中,通过量化扫描仪或相机的性能来监控设备状态;

④ 验证生成的数字文件是否符合项目规范。

2. 质量控制(QC)要求。机构必须实施 QC 检查和监控流程,以确保图像符合 §1236.50 规定的数字化图像质量参数。
(1) 联邦机构数字指南倡议(FADGI)数字图像一致性评估程序(DICE)是一种 QC 检查和监控流程,利用图像目标和分析软件来验证合规性。正确应用该方法可确保机构符合 §1236.50 的要求。

(2) 如果机构未采用 FADGI 一致性评估程序,则必须记录所使用的检查流程及其如何验证图像符合质量参数的要求。

3. 质量控制(QC)测试与分析。在数字化过程中,机构必须进行 QC 测试与分析,以识别设备故障或配置错误、不当的软件应用设置、元数据捕获错误或人为失误,并采取纠正措施。机构必须:

(1) 实施图像质量分析流程,并使用参考目标验证数字化设备是否符合本部分规定的成像参数;
(2) 及时更换参考目标,当其因褪色、污垢积累、划痕或其他表面损伤影响可用性时;

(3) 定期测试设备,以确保扫描仪、数码相机/复制系统处于最佳工作状态,包括:

① 每个工作日开始时,扫描包含灰度图、彩色图和精确尺寸比例尺的参考目标;

② 使用图像质量分析软件验证其是否符合性能评估规范;

③ 发现问题时,进行额外测试;
(4) 使用特定的软件/设备驱动组合测试设备,并在工作流程发生变更后重新测试;

(5) 确保设备操作、设置及图像处理方式与用于评估测试目标的方法一致。关闭捕获设备中的自动校正功能(如“自动曝光”),以防影响目标评估或导致生成的图像文件不一致。

4.质量控制检查。

(1)该机构必须对数字文件进行QC检查,以确保其符合本部分规定的技术参数和标准。检查时必须保证100%的图像文件:

①可打开并显示;

②采用§1236.48中规定的压缩类型和格式进行编码;以及

③具有§1236.50中规定的分辨率、颜色模式、位深和颜色配置文件。

(2)该机构必须使用统计上有效的技术进行目测检查:

①该机构可以目视检查至少十个数字文件的随机样本或每批数字文件的10%,以较大的数字文件为准;或

②机构可以采用统计上有效的抽样计划来验证图像质量、文件质量、元数据质量和完整性要求已得到满足。根据§1236.44(d)(3)(i)的规定,使用自己取样技术的机构必须包括所使用方法的文件。

(3)目视检查必须使用经过校准的图形工作站和使用设置为100%放大倍率的显示器来检查以下图像质量特征:

①图像色调、亮度、对比度和色彩精度符合§1236.50的要求;

②图像未受剪切(在高光或阴影中丢失细节);

③图像没有颜色通道错配或量化错误;

④图像不包含任何有损文件信息内容的图像伪影,如灰尘、牛顿环、缺失像素、扫描线、信号失落、耀斑或过度锐化;以及

⑤图像没有被不恰当地裁剪,有预期的尺寸和方向(横向/横向或纵向/纵向),图像没有翻转、倒置或倾斜。

5.纠正措施。如果检查发现错误,请继续执行以下步骤,直到样本集的成功率达到100%。
(1)如果1%或以上的被检查文件不符合§1236.50中的任何标准,(则需要)确定所有错误的来源和范围,纠正或重新数字化受影响的文件,并按照本节(d)段的要求重新检查图像;

(2)如果少于1%的被检查文件不符合§1236.50中的任何标准,确定所有错误的来源和范围,并对受影响的文件进行更正或重新数字化。

6.其他质量方面的检验。该机构必须检查产生的文件来验证它们符合元数据和文件完整性的要求:

(1)元数据质量。该机构必须评估元数据的准确性。在合适情况下可以使用自动化技术来完成(评估),否则QC检查必须手工进行。这些检查必须确保:

①文件根据项目规范命名;以及

②在文件保管系统和影像文件中捕获正确的管理、描述和技术元数据。

(2)文件完整性。该机构必须采用自动化和目视检查流程来验证数字化的完整性和准确性:

①根据盒目、案卷夹标题清单或其他馆藏目录,确认所有文件都已入账;

②将源文件与它们的数字化版本进行比较,以验证100%的信息内容已被捕获;

③将原始文件与其数字化版本进行比较,以验证数字化文件的顺序相同;

④检查文件的相关信封、便笺或其他形式的载体,以核实文件的所有信息来源都已数字化;

⑤使用§1236.54(c)中的“关系”元数据元素验证所有不能数字化的混合媒介文件与数字化文件相关联;以及

⑥确认缺失的页面或图片已在项目文档中注明。

六.1236.48文件格式要求

1.该机构必须以下列文件格式之一对数字化文件进行编码、保存和移交,可以是未压缩的,也可以是使用表1和表2中指定的压缩编解码器之一。
(1)若机构使用 JPEG2000 压缩方式,将多个未压缩的 TIFF 图像合并为 PDF/A 文件,则必须对生成的 PDF/A 文件执行 §1236.46(d) 规定的质量检查步骤。

(2)在使用 JPEG2000 视觉无损压缩时,机构必须通过测试并进行视觉评估,以检测是否存在模糊或改变信息内容的压缩伪影,从而确定适用的压缩比(不得超过 20:1)。

2.该机构必须以下列文件格式之一对数字化的永久纸质文件进行编码、保存和移交,可以是未压缩的,也可以是表1至(b)段中规定的压缩编解码器之一。

表1至(b)段-数字化永久纸质记录表的文件格式要求

3. 机构必须以下列文件格式之一对数字化影印档案进行编码、保存和移交,可以是未压缩的,也可以是使用表2至(c)段中规定的压缩编解码器之一。
(1)对于一系列以文字为主的、穿插影印的文件,使用本节表1至(b)段的格式进行纸质记录。所有照片必须按照§1236.50的标准进行数字化处理。
(2)对于一系列以印刷为主的照片,包括那些穿插着纸质文件的照片,使用本段(c)表2中的影印文件格式。
(3)然而,代理机构不能在任何工作流程中进行代码转换或插入(上样例)文件。

表2至(c)段-数字化永久影印档案的格式要求表格

七.1236.50数字化永久纸质和影印文件的要求

1.概述。本节描述纸质文件数字化的最低要求。根据原始文件的物理特性,机构必须选择适用的规范:现代纸质文字文件应参考 本节 (d) 段的表 1,而照片打印及包含精细细节的纸质文件应参考 本节 (e) 段的表 2。机构必须采用适当的设备、照明、特殊处理或成像方法,以确保完整捕获所有信息。如有必要,机构可超出这些要求,以获取更详细的信息或满足自身业务需求。

2.图像质量参数。其性能参数基于 FADGI 三星标准的目标值和公差范围。

3.设备要求。用于数字化联邦文件的设备必须和载体类型相适应,并且能够在不破坏原始记录的情况下实现文档化的项目目标。

4.现代纸质文字文件数字化的要求。对于这些文件,要为原始文件生成至少300 ppi大小的图像文件。
(1)适用于表1至(d)段中关于现代纸质文字档案的规范记录是具有明确的印刷字体(如排字、打字、激光打印)的现代文字档案,并且文本的墨水与纸张背景之间具有中等至高对比度。表1中关于现代文本纸记录的性能度量值符合FADGI“文档(未绑定):现代文字档案”类别,并且适用于原始记录没有L*值大于20的可见内容。不使用中性参考补丁分析L*小于20的评价测试目标。
(2)对于其他纸质文件,如手稿、插图、图形、易读性差或字符分散的文件(如复写本或热敏复制品),其可见内容的L*值大于20,则机构必须在评估测试目标上评估L*大于20的中性参考贴片。(这些值相当于FADGI的三星“文档(未绑定):一般集合”)。
(3)如果文件包含解释原始文件信息所必需的颜色或其他特征,或使用灰度gamma 2.2进行数字化时可能丢失特征,则该机构必须以可接受的RGB颜色模式进行数字化。
(4)至少,该机构必须将本段所述的纸质文件数字转化为下列参数:

表1至(d)段-永久、现代文本纸张记录数字化要求表

5.对具有精细细节的影印和纸张文件进行数字化的要求。具有精细细节的文件、要求高色彩精度或具有其他独特特征的文件,必须使用表2到本段(e)的规格来捕获具有精细细节的影印和纸质文件。对于这些文件,要为原始文件生成大小至少为400 ppi的图像文件(如表2所示)(这些性能值等同于FADGI的三星类别“印刷品和照片”)。对于某些具有精细细节的文件,可能需要应用比最小值分辨率更高的分辨率。
(1)这些规范适用于摄影印刷品、平面艺术印刷品(例如平版印刷或凹版印刷)、图纸、压印印章等文件,以及具有现代纸质文字档案中表1至(d)段参数无法捕捉到的信息的文件。
①对于最小的重要细节为1.0 mm或更小的文件,如航空照片和地形图(需要高度放大和精度以确保扫描的尺寸精度),该机构必须提高分辨率以捕获原文件中的所有信息。
②对于许多成像设备,增加ppi设置可能不会增加实际的分辨率级别或捕获所需的细节。用于数字化精细文件的设备必须能够满足更高的质量参数。也许有必要超过表2中所列的参数以达到(e)段的要求,以便获得文件中所固有的所有资料。
(2)该机构必须使用彩色模式对照片(包括单色和黑白)进行数字化。
(3)如果文件包含解释原文件信息所必需的颜色或其他特征,或者在使用灰度伽玛2.2进行数字化时可能丢失,那么该机构必须以可接受的颜色模式进行数字化。
(4)至少,各机构必须将本段所述的所有文件按照以下参数数字化:

表2至(e)段-有详细信息的永久性、照相打印文件和纸质文件数字化的要求

参考文献:

[1]祁天娇,刘越男.ERA 2.0:美国联邦政府数字档案馆系统的新发展[J].档案学通讯,2018(4):14-20.

(本文内容为学生研究员自主翻译,仅供参考学习。)

本期学生研究员风采

赵婧羽

秦杨

张开霞

程家盛

安天成

于泉皓

毛宁

张茜雅

姚立颖

翻译:赵婧羽 秦杨 张开霞 程家盛 安天成 于泉皓

校对:毛宁 张茜雅

排版:姚立颖

审核:钱毅

  •   010-82500663
  •   erecord@126.com
  •   100872
  •   北京市海淀区中关村大街59号中国人民大学信息资源管理学院信息楼404室
友情链接
  • 国家档案局
  • 中国人民大学
  • 中国人民大学信息资源管理学院
  • 电子文件管理百科

关注我们

电子文件管理研究中心 © 2010 - 2026 All Right Reserved