前言
阅读本文,你将了解:
(1)I Trust AI项目的发展背景、基本概况;
(2)I Trust AI项目的发起团队、发展阶段;
(3)I Trust AI项目进展与近期成果。
“人工智能与档案工作发展国际学术研讨会”宣传海报
1. I Trust AI项目概况
InterPARES第五阶段致力于研究“我们能否在利用人工智能技术承担档案职能的同时尊重文件的本质属性并确保其长期可信”这一关键问题。即注重使用人工智能技术实现“保障数字文件可靠性”和“以可靠数字手段创建、保存所有媒介和形式的数字文件”的两项目标。
InterPARES Project项目网站主页
从研究路径上看,I Trust AI项目组计划采用短期-长期双管齐下的方法解决问题。从短期看,项目组应尽快识别对文件档案发挥职能影响较大的问题和障碍,以及应用人工智能解决这些问题、障碍的方法;建立文件与档案专家学者和人工智能领域专家学者的联系。从长期看,项目组应确定未来能够在文件和档案领域使用的人工智能工具,且这种工具应具备应对快速变化的灵活性,能为决策提供支持并能以较快速度实施基于人工智能的解决方案。[4]
●信息学院
●不列颠哥伦比亚大学
●信息学院
●不列颠哥伦比亚大学
项目协调员(Project Coordinator)
●信息学院
●不列颠哥伦比亚大学[6]
2. 项目阶段性计划和研究内容
|
|
|
|
|
|
>>对全球文件和档案界从业人员的调查和访谈 ●确定每个关键挑战中的具体因素以及AI如何应对这些因素 >>专家访谈和计划制定 ●确定候选 AI 技术并设计其雏形 ●为应对文件和档案挑战的 AI 解决方案创建初始评估标准,包括专注于特定问题的各种挑战数据集 |
|
|
|
|
|
|
>>法律问题研究 >>建立风险和收益的价值结构 ●确定每个潜在AI解决方案的局限性 >>政策分析 >>专家访谈 >>环境审视 >>AI解决方案在代表性数据集上的比较研究 ●制定威胁和漏洞列表 >>SWOT/PESTLE分析 >>理论分析 >>对利益相关人员的访谈 >>专家评估 >>基于挑战数据集性能的AI解决方案误差分析 ●迭代验证标准,例如创建新版本的挑战数据集,以解决通过威胁和漏洞分析发现的所有重要因素 |
|
|
|
|
|
|
●基于这些原则开发和改进AI工具 ●识别并减少训练数据集和模型中存在的偏差 >>一致性分析 ●确定基于档案原则的AI是否更符合档案需求 >>挑战数据集模型的实验比较 |
|
|
|
|
|
|
●根据第1阶段和第2阶段制定的验证标准衡量AI解决方案 ●检查AI解决方案中的可行性、可持续性、偏差、透明度、普遍适用性和对AI背景信息的保存 >>案例研究 >>示范用例 >>案例研究中AI解决方案的详细性错误分析 ●为考虑实施AI的机构开发和验证工具,包括评估框架和清单 |
|
|
|
|
|
|
●形成套装软件(例如,自动为历史照片添加说明文字、对文件进行敏感性描述,或用土著语言翻译历史文件。) |
●改进现有工具并创建新的机器学习工具来满足档案工作需求,例如机器翻译、图像识别和描述、光学字符识别 (OCR) 和手写文本识别、文本摘要和分类等。开发的工具将由文件和档案社区量身定制、测试和部署。
●为全方位应用机器学习(ML)工具制定最佳实践、标准和指南,需要将档案知识和实践用于解决机器学习中的偏见、可解释的人工智能 (XAI) 和图像描述等问题。
●通过这些学科的学者和从业者之间的知识交流和应用,丰富研究,促进多个学科的知识共同创造,包括档案科学、文件管理、AI、网络安全、信息科学、法律和伦理等。
●培养一大批未来的学者和专业人士——他们将把优化的知识带到他们将服务的机构、组织、社区和政府,以及整个档案和文件界。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 .I Trust AI项目最新研究成果
推出Learnera.ai 深度学习训练新平台
UBC的深度学习和自然语言处理研究小组(DLNLP)致力于深度表征学习和自然语言社会语用学研究,以构建能够促使人类健康得到更大改善、社会网络更加安全、信息过载更加减少的社会机器(social machines)。DLNLP开展了广泛的学术合作,支持SSHRC(社会科学与人文科学研究理事会)的I Trust AI 及 Ensuring Full Literacy 项目研究。此外,DLNLP还与谷歌、AMD、微软等企业开展行业合作。
(AI IN RELATION TO GLAMS TASK FORCE:
Report and recommendations)
GLAMs工作组尝试试验不同的人工智能技术,将其应用于不同的业务领域,比如数据分析、提炼甚至生成新的信息。该工作组专注于在分析和丰富数字藏品中所使用的人工智能技术,进而改善用户搜索和浏览功能。这些技术包括但不限于机器学习、自然语言处理(包括翻译、OCR、HTR、统计分析、计算机视觉和文本分析算法),用于提取实体、特征、颜色、组成和纹样装饰等信息,进行相似性匹配、图像分类和标记。其中,他们通过使用一组数据在半监督甚至无监督状态下进行算法训练。
GLAMs工作组还计划通过进行横向扫描,调查人工智能在数字文化遗产领域的预期作用和影响,特别是在藏品分析和完善方面。所调研的具体问题包括:有哪些关键项目和机构在调查人工智能对文化遗产的研发影响方面取得了长足进展、有哪些类型的数据集被用于算法训练、哪些验证技术和指标被用于关键的文化遗产项目、不用研究所采用的研发工具和方法及其效果等等。
《非洲数字文件管理》
(Managing Digital Records in Africa)
《非洲数字文件管理》书目封面
[2]石文馨、档案那些事儿. 国际视野|国际知名合作项目InterPARES 20周年特别回顾:成就与应用[EB/OL]. 2018-09-17[2022-06-10]. https://mp.weixin.qq.com/s/PxF1lyPiAFwR0NbO1iDpZg.
[3]Luciana Duranti & Muhammad Abdul-Mageed. InterPARES Trust AI: Webinar 1:InterPARES Past[EB/OL]. 2021-07-12[2022-06-10]. https://interparestrustai.org/assets/public/dissemination/Webinar1_InterPARES_past_internal.pdf.
[4]Luciana Duranti & Muhammad Abdul-Mageed. InterPARES Trust AI: Webinar 3 Next steps, meetings, first deliverables[EB/OL]. 2021-07-16[2022-06-10]. https://interparestrustai.org/assets/public/dissemination/Webinar3-Nextsteps.pdf.
[5]2021 InterPARES Trust AI. About the Research-Research activities[EB/OL]. [2022-06-10]. https://interparestrustai.org/trust/about_research/summary.
[6]2021 InterPARES Trust AI. Management[EB/OL]. [2022-06-10]. https://interparestrustai.org/trust/aboutus/management.
[7]2021 InterPARES Trust AI. Working Groups[EB/OL]. [2022-06-10]. https://interparestrustai.org/trust/about_research/summary.
[8]UBC . Dr. Abdul-Mageed Launches a New Platform for Deep Learning Training[EB/OL]. 2022-05-01[2022-06-10]. https://ischool.ubc.ca/2022/05/dr-abdul-mageed-launches-new-platform-for-deep-learning-training/.
[9]2021 InterPARES Trust AI. AI IN RELATION TO GLAMS TASK FORCE: Report and recommendations[EB/OL]. [2022-06-10]. https://interparestrustai.org/trust/article/ai-in-relation-to-glams-task-force-report-and-recommendations.
[10]2021 InterPARES Trust AI. Book Launch! Managing Digital Records in Africa[EB/OL]. 2022-05-26[2022-06-10]. https://interparestrustai.org/trust/article/book-launch-managing-digital-records-in-africa.