与许多其他使用主题建模的项目和分析相比,度上避免使用主题建模的可视化。主要有两个原因:首先,当对底层算法仅部分理解时,可视化会导致对主题的接近度和距离做出草率的解释。其次,密切相关的是,可视化只是另一种简化工具,它可以给人留下这样的印象:人们可以比实际情况更好地理解和解释自己的材料。
每种方法都会导致截然不同的评估程序。对于教科书,这些是使用信息科学家创建的 Excel 表格进行评估的,并将这些结果反馈给参与该项目的计算语言学家和计算机科学家,以进一步开发主题模型。尽管这一逐步的过程意味着各方的工作量都更大,但它使得不断反思和评估各个步骤成为可能。
2. 各项目介绍
2.1 光谱分析
“从实验室到公众”(本文中称为“光谱分析”)项目的出发点是通过各种媒介从科学主题的起源背景中追踪科学主题。具体来说,我们研究了光谱分析和激光发明后的十年内出现的有关光谱分析和激光的科学文章和书籍出版物的形式以及其中反映的主题发展。[21]
19世纪中叶,化学家罗伯特·本生和物理学家古斯塔夫·罗伯特·基尔霍 阿根廷电报数据 夫研究了化学元素的识别问题。他们的研究成果是一种利用化学样品的光谱来确定其成分的方法:光谱分析。该方法代表了化学的一个里程碑,同时使研究人员能够根据天体的光来研究其性质。该发明很快在工业和研究领域得到广泛应用,并通过科普讲座和出版物对社会产生了影响。在自然科学结构不断发展、数学化程度不断提高的时代,谱分析的成功支持了新的方法论。这里提出的项目研究了有关光谱分析的出版物,以了解主题重点如何随着研究的进展而转变,是否存在重复的模式,以及科学出版物对后续研究和科普出版物有何影响。