你可能想获得自己所感兴趣的事情的数据资料。例如,你可能想知道补充肌酸和蛋白粉,哪一个更能够促进肌肉的壮大;你也可能想知道成年人中肥胖的人有多少,其百分率是多少。那么怎样才能获得有帮助的数据资料呢?
为了回答上述问题,我们若在没有任何系统的数据资料情况下,就轻易给出答案,则是基于自己的经验或者经历得出了结论。例如,我们可能想(可能并不是真正想),自己在肌肉力量练习过程中补充蛋白粉取得了较好的效果,或者我们会回忆起一件深深埋藏在我们记忆之中的异乎寻常的事件,就是因为它的异乎寻常所以才会印象深刻,例如奥林匹亚健美先生手捧一桶肌酸的照片。但是,我们可能会忽略这样一个事实,那就是所有有关飞行的数据资料表明乘坐飞机相对开车是比较安全的一种交通方式。
回答上述问题一个好的策略就是去图书馆或通过因特网查找答案。在那里,我们可以找到大量的数据资料,尽管它们不是为了回答我们的问题而特意收集的,但是我们可以使用这些数据。例如,在“中国居民营养与健康状况调查报告之——2002综合报告”中,包括了揭示我国成年人群中有关肥胖的数据资料。通过这些数据资料,我们可以获得相关的信息,例如,有7. 1%的成年人属于肥胖人群,总人数达到6 000多万;大城市成年人群中肥胖人群所占比例明显高于农村。有时也可以通过发放问卷或者通过做实验来获得数据资料。
不论是使用他人获得的数据资料还是自己的数据资料,所获得的信息的品质好坏取决于数据资料质量的好坏。本部分将介绍如何鉴别数据资料的质量,以及产生好的数据资料的实验设计与统计设计,同时指出那些导致不可信数据资料的陷阱的存在。