委员会发布开源软件包以促进对《数字服务法》透明度数据库中数据的分析
Posted: Wed Feb 05, 2025 10:28 am
新的软件包将提供有关内容审核决策的世界上最大的近实时数据集的见解。
委员会发布了一个新的开源软件包,以帮助简化《数字服务法案》(DSA)透明度数据库中的数据分析。
所谓的dsa-tdb python 软件包由委员会开发,托管在 code.europa.eu 上,这是欧盟开源软件项目的代码开发平台。现在也可以通过DSA 透明度数据库网站上的新专用页面访问它。
DSA 透明度数据库通过记录在线平台提交的每项审 立陶宛 WhatsApp 数据 核行动的一组标准化信息(称为理由陈述),几乎实时地跟踪在线平台做出的匿名内容审核决定。该数据库自 2023 年 9 月开始运营,目前已包含超过 220 亿条条目。
为了支持大规模分析这个大型数据库,该软件包使用户能够以计算效率高的方式执行大量数据预处理和数据聚合任务。它还允许用户根据他们感兴趣的数据创建自己的可视化效果。
此次发布是委员会不断努力开发数据库基础设施和分析工具的一部分,该努力基于其新兴研究社区的反馈意见和交流。通过扩展和增强数据库的分析能力,委员会旨在为 DSA 的学术和民间社会利益相关者提供工具,以尽可能高效地为 DSA 的执行做出贡献。
委员会发布了一个新的开源软件包,以帮助简化《数字服务法案》(DSA)透明度数据库中的数据分析。
所谓的dsa-tdb python 软件包由委员会开发,托管在 code.europa.eu 上,这是欧盟开源软件项目的代码开发平台。现在也可以通过DSA 透明度数据库网站上的新专用页面访问它。
DSA 透明度数据库通过记录在线平台提交的每项审 立陶宛 WhatsApp 数据 核行动的一组标准化信息(称为理由陈述),几乎实时地跟踪在线平台做出的匿名内容审核决定。该数据库自 2023 年 9 月开始运营,目前已包含超过 220 亿条条目。
为了支持大规模分析这个大型数据库,该软件包使用户能够以计算效率高的方式执行大量数据预处理和数据聚合任务。它还允许用户根据他们感兴趣的数据创建自己的可视化效果。
此次发布是委员会不断努力开发数据库基础设施和分析工具的一部分,该努力基于其新兴研究社区的反馈意见和交流。通过扩展和增强数据库的分析能力,委员会旨在为 DSA 的学术和民间社会利益相关者提供工具,以尽可能高效地为 DSA 的执行做出贡献。