《肿瘤基础与临床》编辑部接收稿件中四格表数据统计学结果差错分析

摘 要 以2015—2017年《肿瘤基础与临床》编辑部接收的所有2 314篇初投稿件作为数据筛选范围,其中涉及统计学方法的稿件1 823篇,经过筛选发现其中涉及四格表数据的初投稿件927篇,将其纳入本研究,分析存在的统计学问题,并提出避免这种统计学错误的方法和建议。结果发现,927篇涉及四格表数据统计分析的初投稿件中,统计学方法描述不清、错误或笼统者占63.54%(589/927),统计数据有问题者占88.78%(823/927),包括其中两者均有问题者42.93%(398/927)。823篇四格表数据统计结果有问题的稿件共涉及4 345组四格表数据,其中统计结果有问题者3 647组(83.94%),包括χ2值未写或错写1 123组(30.79%),P值未写、错写或无具体数值1 638组(44.91%),χ2值和P值均未写、错写、无具体数值886组(24.29%)。结论:《肿瘤基础与临床》编辑部2015—2017年接收的涉及四格表数据统计的稿件,其统计学方法及结果均存在较多问题,通过文章措施能够使录用稿件刊登前的统计学问题明显减少。

关键词 医学期刊;四格表数据;肿瘤基础与临床;差错分析

中图分类号 G2 文献标识码 A 文章编号 1674-6708(2018)212-0172-03

医学研究中,统计学方法的正确运用是评估研究的科学性、实用性、规范性和创新性的重要方法。在医学期刊刊登的论文中大多数需要应用统计学对所得数据进行分析,以便得出简介有说服力的结论,因而正确运用统计学方法与否是评估论文在质量高低的重要指标,也是论文是否能够对后续科研给予积极的帮助的关键[ 1 ]。

目前,文献报道关于期刊统计学问题的报道,大多是以已经公开发表的期刊论文为研究对象,较少有研究关注编辑部初投稿件的统计学问题,而初投稿件又是统计学错误发生的重灾区,因此,这一范围内的统计学问题值得进行研究和探讨。

鉴于此,本文以《肿瘤基础与临床》编辑部2015—2017接收稿件作为数据筛选范围,以其中的四格表数据为例,对其中存在的统计问题进行分析和总结。

1 资料与方法

1.1 研究对象

以《肿瘤基础与临床》编辑部2015—2017接收的新投稿件作为数据筛选范围,将其中涉及四格表数据(仅纳入随机样本数据,排除配对四格表数据)的稿件纳入本研究。

1.2 研究方法

将2015—2017年3年期间《肿瘤基础与临床》编辑部接收的涉及四格表数据的稿件纳入本研究后,对所有稿件的统计学方法描述及统计学结果进行审查,其中统计学方法描述参考《医学统计学》[2]一书,并结合本刊的统计学描述格式。统计学结果按照四格表数据的类型和四格表数据统计学方法应用条件,采用SPSS?23.0统计软件对其进行重新统计分析。所有数据均有编辑部的副高级职称以上的统计学审稿专家对统计学方法描述的恰当与否和统计结果的正确与否进行审查和核验。

四格表数据的统计学方法选择原则为:

1)当样本量n≥40且理论频数T≥5,用Pearson?χ2检验进行统计分析;

2)当样本量n≥40,且理论频数T<5但T≥1,用连续校正的χ2检验进行统计分析;

3)当样本量n<40或理论频数T<1,用Fisher确切概率法进行统计分析[2]。

2 结果

2.1 纳入研究稿件的基本情况

《肿瘤基础与临床》编辑部2015—2017年接收的2?314篇初投稿件中涉及统计学方法的稿件1?823篇,占78.78%,其中含有四格表数据的稿件927篇。通过对这927篇稿件中所有四格表数据的统计学方法、结果分析发现,927篇稿件涉及四格表数据统计分析。其中统计学方法描述不清、错误或笼统者占63.54%(589/927),统计数据有问题者占88.78%(823/927),包括其中两者均有问题者42.93%(398/927)。

2.2 823篇四格表数据的统计数据有问题稿件的统计学问题分析结果

823篇四格表数据的统计结果有问题的稿件共涉及4?345组四格表数据,其中统计数据完整无问题者698组,占16.06%;统计数据有问题者3?647组,占83.94%,包括χ2值未写或错写1?123组(30.79%),P值未写、错写或无具体数值1?638组(44.91%),χ2值和P值均未写、错写、无具体数值886组(24.29%)。

3 讨论

目前,我国医学研究,特别是基础研究水平相对落后,科研方法也较老旧,特别是对统计学方法在医学科研整个环节中的重要性的认识不够,这造成了医学研究课题设计的不严谨、不合理,研究方法的不恰当,研究结果的不严谨,甚至不正确。而这体现在医学期刊方面,就造成了论文的统计学描述不清楚甚至错误,统计学方法的选择错误,以及统计结果的错误等[3-4]。

统计学涉及医学研究的方案设计、数据收集和处理以及结果解释与分析等多个环节,合理的实验设计和正确的统计分析结果是保证期刊论文科学性和可靠性的前提[5]。因此,医学期刊统计学问题的存在则会直接造成医学期刊质量的下降和其学术影响力的减弱,这对期刊学术性、权威性、创新性等均会造成严重影响。

因此,为了进一步提高期刊质量,《肿瘤基础与临床》编辑部聘請郑州大学公共卫生学院统计学专家对所接收稿件进行统计学审查,以尽可能避免有统计学问题的论文见刊。

本文从期刊论文常见的四格表数据的统计学问题方面展开审查,以《肿瘤基础与临床》编辑部2015—2017年接收稿件作为数据筛选范围,将其中涉及四格表数据的稿件纳入本研究,对这些稿件涉及四格表数据的统计学方法描述和统计结果进行重新审查和核验。

结果显示,《肿瘤基础与临床》编辑部2015—2017年接收的2?314篇稿件中的927篇涉及四格表数据的统计分析,其中统计学方法描述不清、错误或笼统者占63.54%(589/927),统计数据有问题者占88.78%(823/927),包括其中两者均有问题者42.93%(398/927)。823篇四格表数据的统计结果有问题的稿件共涉及4?345组四格表数据。其中统计数据完整无问题者698组(16.06%);统计结果有问题者3?647组(83.94%),包括χ2值未写或错写1123组(30.79%),P值未写、错写或无具体数值1638组(44.91%),χ2值和P值均未写、错写、无具体数值886组(24.29%)。这说明接收稿件中大多四格表数据的统计学存在问题,主要有以下几类[5-8]:

1)统计学方法选择错误,未按照文献规定的四格表数据的统计学方法选择原则进行选择。比如当样本量n≥40,且理论频数T<5但T≥1,直接用Pearson?χ2检验;当样本量n<40或理论频数T<1,直接用了Pearson?χ2检验。

2)χ2值未写或错写。χ2值未写得可能原因是未用统计学方法分析,仅根据研究结果对数据进行的直观上的评估,这导致根本无χ2值可写,也可能是将应该用χ2检验的数据错用为Fisher确切概率法导致无χ2值可写。χ2值错写其原因可能是应该选错了统计方法,将需要应用连续校正的χ2检验的数据直接用Pearson?χ2检验进行分析,导致χ2值的错写。

3)P值未写、错写或无具体数值。P值未写可能是未进行统计分析导致无P值可写。P值错写可能是选错了统计学方法而导致对统计学结果分析时错写了P值。而无具体P值(仅写明>0.05或<0.05等)这可能是因为对统计学的重视不足,仅以检验水准为界限对有无统计学差异进行了分析,进而笼统写了P >0.05或P <0.05。当然上述这几种统计学问题均有可能是论文书写过程中的粗心大意所致。

对于四格表数据容易出现的统计学问题,我们认为通过以下方法能够明显减少甚至避免其发生在录用稿件的修回稿或刊登于期刊上的论文[9-13]:

1)编辑部对所接收稿件增加统计学审查环节,通过统计学专家关于统计学的审查,发现并指出作者所写稿件统计学问题,并要求其改正。

2)编辑部实行统计学审查结果一票否决制,即对于存在统计学问题的稿件一律返修,直至所有统计学问题得到解决方可进入刊登流程进行刊登。

3)编辑部的编辑进行统计学知识培训,提高统计学问题审查能力,配合统计学审稿专家把好稿件统计学质量关。

4)编辑部组织作者群,并进行医学研究统计学方法讲座,提高作者的统计学素养。

总之,《肿瘤基础与临床》编辑部2015—2017年接收的涉及四格表数据统计的稿件,其统计学方法及结果均存在较多问题,通过作者和编辑工作者统计学知识培训、审稿环节增加统计学审稿、通过统计软件演算核实能够在稿件修回或刊登时明显降低这种统计学错误的发生概率。

参考文献

[1]张亚玲.医学期刊中常见统计学问题分析及解决对策医学期刊中常见统计学问题分析及解决对策[J].出版科学,2013,21(5):67-69.

[2]孙振球.医学统计学[M].3版.北京:人民卫生出版社,2010:111-118.

[3]姜敏,储怡星.医学研究生应该重视论文写作中的统计学问题[J].医学与哲学(人文社会医学版),2011,32(4):75-76.

[4]潘明志,梁明佩,唐毓金,等.广西14種医学类科技期刊统计学应用调查研究[J].右江医学,2012,42(4):477-480.

[5]马莉,高贵现.《山东医药》杂志常见统计学错误及分析[J].编辑学报,2016,28(1):32-34.

[6]韩磊.医学期刊编辑提升统计学素养的难点及策略[J].科技与出版,2016(1):50-53.

[7]胡宝文.动物学定量与定性资料分析中的常见错误[J].动物学杂志,2009,44(6):41-47.

[8]徐谦,沈耿,莫传伟,等.中医论文撰写中常见的统计学错误分析[J].广州中医药大学学报,2012,29(4):474-477.

[9]姜瑞涛.医学科研论文中常见的统计学问题与改进措施[J].卫生职业教育,2018,36(8):13-14.

[10]田云鹏,陈丽.医学论文中常见统计学错误例析[J].中华全科医学,2017,15(10):1791-1794.

[11]骆焕园,刘慧芳,吴艳乔,等.根据重复观察数据分析临床病人转归的统计学问题和实践[J].中国卫生统计,2017,34(5):749-752.

[12]闫洪涛,杨新军.药学研究论文中常见统计学问题分析[J].药物流行病学杂志,2009,18(3):210-211.

[13]闵莹.医学期刊文献中常见的统计学问题分析[J].天津科技,2016,43(1):68-71.