建立信任:可追溯系统是在人工智能系统中建

Where business professionals discuss big database and data management.
Post Reply
suchona.kani.z
Posts: 683
Joined: Sat Dec 21, 2024 5:27 am

建立信任:可追溯系统是在人工智能系统中建

Post by suchona.kani.z »

立信任的关键。当用户和利益相关者了解人工智能决策是如何做出以及数据如何使用时,他们更愿意接受和使用人工智能系统。对人工智能的信任对于确保人工智能项目的接受度和长期成功至关重要。
探索追溯工具
可追溯性、可重复性和再现性等概念发挥着至关重要的作用。可追溯性可以清楚地记录数据和过程的起源和演变,而可重复性则确保可以在相同条件下重复实验。另一方面,可重复性确保其他研究人员可以通过使用独立数据集进行相同的实验来获得类似的结果。

许多数据存储库中发布的材料通常会对可重复性或可再现性提出挑战,主要问题是没有充分捕获执行代码所需的必要软件和系统依赖性。即使研究人员留下了一些注释或说明,也常常缺少必要的背景信息或对工作流程的深入了解。结果是执行代码要么几乎不可能,要么需要大量的额外工作。

将代码和数据放在个人网站或 GitLab 或 GitHub 等存储库中通常被 医疗保险线索电子邮件列表 证明是无效的,因为在大多数情况下会丢失重要信息,包括运行时环境、上下文和系统信息。

云存储和 Docker 等容器化技术是市场上许多在线工具的基础。这些工具的共同目标是全面捕获进行研究的环境,以使整个研究过程可重用、可共享并最终可再现。这些工具中最全面的主要涵盖可重复性的技术方面,包括环境、代码、数据和来源信息。


支持可重复研究方法的工具比较,来源:Mora-Cantallops 的“可信赖人工智能的可追踪性:模型和工具的回顾”

许多工具中经常被忽视的一个方面是叙述的文档。这不仅仅是以文本形式记录代码。它更多的是捕获导致开发人员选择某些工具和工作流程而不是其他变体的文本元素。有关研究人员选择特定数据集合的动机的详细信息,以及构建和测试模型背后的考虑因素,对于方法的透明度和可重复性至关重要。

Code Ocean、Whole Tale 和 Renku 等工具特别注重可重复性原则。这些平台提供的功能和资源使研究人员更容易使其研究结果和方法对他人透明且可重复。它们支持叙述的记录,并实现整个研究过程的全面可追溯。这有助于提高人工智能研究的透明度和可信度,并确保方法的可重复性和再现性。

具体来说,Binder工具专注于提供一个可以执行代码的环境。表中未列出的其他工具的情况类似,例如 OpenML 和 Madagascar。大多数其他工具专注于提供管道以使实验可重复。还需要强调的是,在大多数情况下,无法在与原始实验相同的操作条件和位置下重现实验,不仅会危及可复制性,甚至还会危及可重复性。
Post Reply