Page 1 of 1

大数据集齐全,我们不再需要考虑统计

Posted: Thu Jan 02, 2025 9:42 am
by Arzina666
为了避免陷入陈词滥调的形象,Becel 确保与目标目标群体直接接触。这就是为什么每个月都会召开一次由重要的婴儿潮一代组成的小组,其中包括吃 Becel 的人和不吃 Becel 的人。所有 50 岁或以上的人。该面板具有明确的功能。 “我们想知道五十岁以上的人在哪个世界感到宾至如归,”博斯说。


美国百货公司Target也有利用大数据的成功故事 。有一天,一名男子走进塔吉特百货公司,向经理投诉。他的女儿收到了婴儿装和孕妇装的折扣券。而他的女儿确实没有怀孕。几天后,经理甚至打电话给该男子道歉。但事实证明经理的借口是多余的,女儿真的怀孕了。通过将女儿的购买行为与一般孕妇的购买行为进行比较,Target 比父亲更早意识到自己怀孕了。

大数据分析师Kaiser Fung表示,我们应该注意这个故事的误报。冯说,谈到塔吉特的成功故事,有很多因素我们不知道。 “我们不知道邮件列表是什么样的。我们不知道有多少未怀孕的女性收到怀孕相关产品的优惠券。也许塔吉特的优惠券手册有多种选择。”随着大数据的出现,数据分析的结果更加准确。确实,由此可以获得更多利润。但如果我们忽略误报,大数据的精确度就会被高估。

2. 大数据使得研究因果关系变得不必要,我们可以 阿曼电报数据 将注意力转移到相关性上。
大数据的优点是我们可以将注意力集中在相关性上。研究相关性是一种比因果关系(即什么到底导致什么的问题)更便宜、更快捷的研究方法。然而,因果关系仍然是数据集分析中的一个重要因素。例如,谷歌流感趋势结果对流感的传播做出了过于夸大的预测。问题在于谷歌的工程师并没有调查到底是什么原因造成的。他们只关心寻找数据中的统计模式。谷歌流感趋势的失败或许可以用2012年12月的新闻来解释,当时的新闻主要是关于流感的“可怕”故事。

另一种可能性是谷歌的算法影响了数据分析。例如,当人们输入医疗症状时,算法可能会越来越多地生成流感诊断作为搜索结果。当强调相关性时,问题是你不知道相关性背后的原因是什么。《大数据》一书的作者Viktor Mayer-Schönberger和Kenneth Cukier表示:

因果关系不会被抛弃,但它作为意义的主要源泉的地位正在被推翻。


数据分析师将拥有所有必要的数据表示为“N=All”。舍恩伯格不仅是一位作家,也是牛津互联网研究所的教授,他解释说,在这种情况下,你不再需要使用总体样本。因为你实际上拥有代表整个人口的所有信息。因此,您不必考虑统计陷阱。