一项好的研究需要严谨的设计、科学的统计分析及良好的展示,才能最终放置于国内外读者的书桌前。当然,我们也可以这样形象的认为,我们自己是一位大厨,而严谨的设计是食物的来源,统计分析则是烹饪处理,而良好的展示就是装盘上桌。相对应的,流行病学注重思维和设计,统计学则专注于数据清理和分析,那么从这样的角度去了解一篇SCI 文章的产生可能会有不同的火花。
我们在进行一项研究前,必须要准备的就是选题和设计。但是我们经常在查完PubMed 及咨询完师兄师姐后,发现能做的都做得差不多了,如果不想去做重复的实验或者调研,基本就没了方向。其实,我们在这个过程中忽视了生物的多样性及我们思维的惯性。
举个例子,某项研究意欲研究吸毒者患艾滋病和一些暴露因素的关系,那么我们自觉地会将吸毒者患艾滋病与否当作应变量进行思考,但是这样一来,我们研究的方向基本已经被封死了,因为已经有很多很多的研究进行了证实,并且不乏前瞻性的研究。但是,如果我们把其中的一个自变量拿出作为应变量会是怎么样呢?比如,共用针具是影响患艾滋病的一个重要因素,那么是否可以当作应变量进行研究呢?
通过转换角度,我们可以从不同的方向探索疾病或行为与暴露的联系,也可以提供更加有深度和见解的分析,而这就是新颖性和创新性。如果你有一个现成的数据库,那么就不要吝惜敲几行代码的时间,多角度的分析往往会带来令人激动的结果。
对于统计分析,有一个美丽的误区需要大家注意。一般来讲,大家在进行统计分析时是很兴奋的,假如碰到了P<0.05 的结果,兴奋之余还有了幸福的感觉。所以在进行书写的过程中,将统计原理、统计方法在方法部分大面积的书写。但是,我个人始终认为统计分析只是工具,用得好会锦上添花,用得不好也不会掉色多少。
有一些经典的文章仅仅就是横断面调查分析,使用的就是频率表格,也能得出有意义的发现,这是因为这个研究对象可能是新生的,也有可能是我们平常忽视的。那么,当我们进行研究时,注重统计分析固然没错,但是如果食物原料没有成色,再加工也是徒劳。所以,原料的产生是极为重要并且也是审稿人看重的,但可惜的是,在一些稿件的方法学部分,这些过程基本都是被一笔带过。何时进行的现场、现场是否有质量控制、是否进行了问卷信效度检验等等,都是审稿人关注的问题,即使我们忽视,在退修中也会被提及。
对于统计分析来讲,好的统计方法并不一定是新颖的,而是必须是适合自己数据结构的。例如大家常常使用的小样本t 检验,在使用过程中,我们往往忽视这个检验的前提条件,如正态性、方差齐等。所以在挑选统计学方法时,应该使用适合自己数据结构的方法,该红烧的绝不清蒸,该清蒸的红烧味道也不会对。总之,数据前提不对,得出的结果也是不可能正确的。
最后,以一段以前写的话作为结尾吧:“有的时候最简单的统计方法反而能让我们获得很好的效果。现在的我们貌似越来越沉溺于高深的软件,复杂的公式,在概率的海洋里忙爽得不亦乐乎,可是我们却忘了在现实世界,任何事物总只有发生和不发生两种可能,也许我们想要探索他们是否会不会发生,或以怎样的一种方式发生”。