《Head First Data Analysis》笔记

Posted by Breezedeus on October 11, 2010

第一章:数据分析介绍

数据分析的基本四步骤:

  1. 定义(Define):定义你的问题。只有在明确你的问题后,你才有方向指导你分析数据。如果你不清楚你的问题,你应该让你的客户帮助你进一步明晰问题。
  2. 拆解(Disassemble):把你的问题和数据拆解称多个小块。当你明确了你的问题后,你应该把这个问题拆解成多个可解决的小问题,然后通过逐个解决小问题以便最终解决你的大问题。把原始问题拆解成小问题的另一个好处是小问题往往可以让你更清楚怎么对数据做分析,它们对你的分析更有指导意义。把你已有的信息分拆为不同层次上的粒度可以让你更好地分析数据。
  3. 评估(Evaluate):评估你拆解后的问题和数据块。对不同块进行评估的关键方法是比较。
  4. 决定(Decide):为你的客户提出解决问题的建议。你给出的建议要依据数据分析的结果,要让客户理解你的建议。

精神模型(Mental model):精神模型是你对这个世界的假设和信念,它来源于你对世界的感知和了解。现实世界是复杂的,所以你需要一个精神模型来让世界变得合理。精神模型就像你看世界所戴的眼镜。对于分析数据来说,我们总是先有一个精神模型,然后在这个模型的指导下分析数据。所以,如果你使用的精神模型有误,那么你对数据的分析也注定会错误。(比如说你要分析在泰国什么人会使用某种化妆品,而你的精神模型是人只包括男人和女人,那么你对数据的分析八成也对不了。)当你发现通过某个精神模型获得的分析结果很离谱,那么你可以尝试使用新的精神模型。

好的数据分析总是集中在你想从数据中获得什么结论这个问题上。

References