2022年4月16日,由中国人民大学电子文件管理研究中心、中国人民大学信息资源管理学院主办的第十二届“中国电子文件管理论坛”成功在京举办。论坛的主题为“深耕内容——电子文件管理深化与服务升级”。来自党政机关、企事业单位、高等院校、科研院所、档案信息技术公司的400多名代表,共同探讨在电子文件管理与数据管理深度融合的背景下,如何通过深耕内容实现电子文件与档案资源的价值转化和业务赋能,推动电子文件的单轨制拓展和数据化转型。
中国人民大学原常务副校长、一级教授、电子文件管理研究中心顾问、国家电子文件管理专家委员会主任冯惠玲代表论坛主办方致欢迎辞。以下为全文:
这是中国电子文件管理论坛举办12届来第一次以线上参会为主的论坛,特别欢迎以这种特别形式相聚的所有与会者!
小米科技创始人雷军说,产业化的信息就像一部200迈的汽车行驶在未来之路上,但我们并不知道它要开往何方。200迈,好快!作为电子信息的一种形态,电子文件也在这辆不知终点的车上超速前行着,虽然我们不知道它的最终目的地,但可以知道现在到了哪一站。现阶段信息化的一个显著特征是从信息形态的改变,即数字化阶段,进入了数字赋能阶段,即数字信息嵌入社会运行,包括数字政府、数字经济、数字文化、智慧城市、数字乡村、数字生活等等,追求信息世界与物理世界的统一融合。在这个融合中,信息不以独善其身为追求,而是要作为活的要素参与和赋能数字社会的各个领域,“数据要素”“资源要素”的概念逐渐深入人心。今年2月,习近平总书记在《求是》杂志发表了题为“做大做强做优数字经济”的署名文章,指出“数据作为新型生产要素,对传统生产方式变革具有重大影响”;李克强总理在今年的政府工作报告中也多次提及“数据要素”,指出要“培育数据要素市场,释放数据要素潜力,提高应用能力,更好赋能经济发展、丰富人民生活。”那么电子文件怎样才能从文件成为资源要素,融入数字社会呢?这就是本届论坛所要探究的议题:深耕内容——电子文件管理深化与服务升级。
为什么要深耕内容?简单来说,以数据驱动为特征的数字化生活需要活的、含义明确的数据作为支撑,而不是静止的、意义不明的文件库藏。《信息简史》的作者詹姆斯·克雷格对于文件的电子化收藏有两个忧虑和两个对策,忧虑之一是“当文件进入电子系统中,一旦被归档,从概率上讲,它就不太可能被人读到了”。这里他并不是说文件公开、档案开放政策问题,而是说读者很难在电子文件系统的汪洋中找到所需信息。忧虑之二是“一大堆数据往往不能告诉我们所需要的知识,也不能确保带来启示和智慧”;相应的两个对策就是过滤和搜索。然而,进入大数据时代,这两个对策并不足以让电子文件信息活化为资源要素进入数字社会各领域,即使我们通过鉴定和文件级著录实现了良好的过滤和检索功能,在用户确切表达需求时找到相应文件,文件的作用和功能仍然是有限的、被动的、或是滞后的,只有让电子文件的全部内容自动灵活地匹配任何明确或潜在的需要时,才能以要素身份加入大数据战略,为数字政府、数字经济等提供信息、知识和智慧,使电子文件价值实现并得以增值。
举两个例子:中石油为了优化企业采购行为,他们对供应商、采购商品、商品价格等电子业务数据(包括调用归档的电子档案数据),匹配了相应的算法模型,为所有的供应商刻画高度精炼的特征标识,形成七大维度立体360°供应商信息库,有力地解决了对企业供应商风险判断不明、比价难度大等核心问题,这些业务数据成为采购活动的依据性要素,有效帮助客户优化采购资源、降低采购成本、规避采购风险。他们还对集团全业务场景的数据加以梳理,形成由四个领域、30项业务分析组成的“企业价值地图”,为企业各方面的核算、运行和决策等提供重要的数据支持。
另一个例子是意大利的“威尼斯时光机”项目,主持人说,他们可以知道16世纪威尼斯里亚尔托地区每一栋房子里居住什么人。他们并没有400多年前该地区的居民档案,而是将收藏于威尼斯档案馆的地图、纳税档案、医疗档案等进行数字化加工和数据关联后,对该地区进行了实景建模和社会网络重建,还原了居住区原貌。项目首席专家称之为“历史的倒带纽”,档案数据分析为历史新发现提供了关键信息。
可见,文件和档案内容中深藏着很多宝贵知识,电子化、数据化管理可以拨云见日,点石成金。尽管我们还面对电子文件常规管理的诸多挑战,但不能等管理好了再做内容,而是要通过内容管理促推电子文件管理的高质量、智能化发展。
那么怎样深耕内容呢?我想需要对电子文件管理目标中的“四性”给予新的深化扩展解读,特别是其中的可用性。早期的认识是,把电子文件中的数字信息还原成人可以阅读的记录形态就达到可用了,如今应该加上机器的可读、可理解、可表达和可分析,让计算机懂得电子文件内容,借助机器学习、人工智能等技术实现文件内容的知识化和智能化应用,才能让电子文件进入数字社会运行过程,成为有独特价值的资源要素。
数据化管理是深耕内容的基本路径,其中数据的覆盖面与连接度是两个重要条件。社会学家内尔·格罗斯预测,在21世纪整个地球都会蒙上一层“电子皮肤”,现在这层电子皮肤正在形成、连接成片,直至覆盖全球,其中相当一部分来自于记录数字社会运行的电子文件。这就要求我们把电子文件的范畴扩大到文图影音各种原生数据领域,与数据管理深度融合。数据的知识化很大程度上是通过数据连接实现的,主要包括各种系统数据和多种媒介数据的连接,这两个连接是当代“数据主义”的基本点,尽管它推崇的数据至上、算法至上有绝对化倾向,但这种强大的数据连接范式正向各个领域蔓延着,在复杂的关联中发现和建立各种关系,使数据产生了明显的增值效应。电子文件数据的连接有赖于从文件单元到数据单元的细颗粒化、结构化、语义化管理,使计算机能够在数据识读、理解和分析中发现和创造新知识,进而升华为智慧。这是电子文件管理的又一场实质性进阶革命,目标是大幅提升文件对于数字业务的贡献度和资产价值,让文件数据深度参与数字社会运行,成为激活数字政府、数字经济、数字生活的资源要素。
衷心感谢今天论坛的所有发言专家,期待各位面向文件内容管理的真知灼见!
2022年4月16日