医学论文常见统计学错误的一项是

1、第一类错误又称Ⅰ型错误、拒真错误，是指拒绝了实际上成立的、正确的假设，为“弃真”的错误，其概率通常用α表示。假设检验是反证法的思想，依据样本统计量作出的统计推断，其推断结论并非绝对正确，结论有时也可能有错误，错误分为两类。2、第二类错误，Ⅱ型错误，接受了实际上不成立的H0 ，也就是错误地判为无差别，这类取伪的错误称为第二类错误，其概率用β表示。简单说就是：你的假设是错误，但你接受该假设。“第一类错误”和“第二类错误”之间的关系：1、当样本例数固定时，α愈小，β愈大；反之，α愈大，β愈小。因而可通过选定α控制β大小。要同时减小α和β，唯有增加样本例数。统计上将1-β称为检验效能或把握度(power of a test)，即两个总体确有差别存在，而以α为检验水准，假设检验能发现它们有差别的能力。实际工作中应权衡两类错误中哪一个重要以选择检验水准的大小。2、做假设检验的时候会犯两种错误：第一，原假设是正确的，而你判断它为错误的；第二，原假设是错误的，而你判断它为正确的。我们分别称这两种错误为第一类错误(Type I error)和第二类错误(Type II error)。第一类错误：原假设是正确的，却拒绝了原假设。第二类错误：原假设是错误的，却没有拒绝原假设。我们常把假设检验比作法庭判案，我们想知道被告是好人还是坏人。原假设是“被告是好人”，备择假设是“被告是坏人”。法庭判案会犯两种错误：如果被告真是好人，而你判他有罪，这是第一类错误(错杀好人)；如果被告真是坏人，而你判他无罪，这是第二类错误(放走坏人)。记忆方法：我们可以把第一类错误记为“以真为假”，把第二类错误记为“以假为真”。当然我们也可以将第一类错误记为“错杀好人”，把第二类错误记为“放走坏人”。在其他条件不变的情况下，如果要求犯第一类错误概率越小，那么犯第二类错误的概率就会越大。这个结论比较容易理解，当我们要求“错杀好人”的概率降低时，那么往往就会“放走坏人”。同样的，在其他条件不变的情况下，如果要求犯第二类错误概率越小，那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时，那么往往就会“错杀好人”。同样的，在其他条件不变的情况下，如果要求犯第二类错误概率越小，那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时，那么往往就会“错杀好人”。

（1）第一类错误，Ⅰ型错误，拒绝了实际上成立的H0，即错误地判为有差别，这种弃真的错误称为Ⅰ型错误。其概率大小用即检验水准用α表示。简单说就是：你的假设是正确的，但你拒绝该假设。（2）第二类错误，Ⅱ型错误，接受了实际上不成立的H0 ，也就是错误地判为无差别，这类取伪的错误称为第二类错误。简单说就是：你的假设是错误，但你接受该假设。

“社会统计学与数理统计学的理论统一”的重大意义统计学家王见定教授指出：社会统计学描述的是变量，数理统计学描述的是随机变量，而变量和随机变量是两个既有区别又统计学家王见定教授著有联系，且在一定条件下可以相互转化的数学概念。王见定教授的这一论述在数学上就是一个巨大的发现，我们知道“变量”的概念是17世纪由著名数学家笛卡尔首先提出，而“随机变量”的概念是20世纪30年代以后由苏联学者首先提出，两个概念的提出相差3个世纪。截至到王见定教授，世界上还没有第二个人提出变量和随机变量两者的联系、区别以及相互的转化。我们知道变量的提出造就了一系列的函数论、方程论、微积分等重大数学学科的产生和发展；而随机变量的提出则奠定了概率论和数理统计等学科的理论基础和促进了它们的蓬勃发展。可见变量、随机变量概念的提出其价值何等重大，从而把王见定教授在世界上首次提出变量、随机变量的联系、区别以及相应的转化的意义称为巨大、也就不视为过。下面我们回到“社会统计学和数理统计学的统一”理论上来。王见定教授指出社会统计学描述的是变量，数理统计学描述的是随机变量，这样王见定教授准确地界定了社会统计学与数理统计学各自研究的范围，以及在一定条件下可以相互转化的关系，这是对统计学的最大贡献。它结束了近400年来几十种甚至上百种以上五花八门种类的统计学的混战局面，使它们回到正确的轨道上来。由于变量不断地出现且永远地继续下去，所以社会统计学不仅不会消亡，而且会不断发展状大。当然数理统计学也会由于随机变量的不断出现同样发展状大。但是，对随机变量的研究一般来说比对变量的研究复杂的多，而且直到今天数理统计的研究尚处在较低的水平，且使用起来比较复杂；再从长远的研究来看，对随机变量的研究最终会逐步转化为对变量的研究，这与我们通常研究复杂问题研究转化为若干简单问题的研究的道理是一样的。既然社会统计学描述的是变量，而变量描述的范围是极其宽广的，绝非某些数理统计学者所云：社会统计学只作简单的加、减、乘、除。从理论上讲，社会统计学应该复盖除了数理统计学之外的绝大多数数学学科的运作。所以统计学家王见定教授提出的“社会统计学与数理统计学统一”理论，从根本上纠正了统计学界长期存在的低估社会统计学的错误学说，并从理论上和应用上论证了社会统计学的广阔前景。[2] [6][5]

医学论文常见统计学错误的是

我们当时也有这个作业太多了很少找，去图书馆随便找那种小的医学刊物，全是错。甚至某些上市的药品说明书上都是错

胡良平教授有一本书，<医学统计学基础与典型错误辨析> 可以看看

医学论文常见统计学错误

胡良平教授有一本书，<医学统计学基础与典型错误辨析> 可以看看

学好了数学或者成为了一个优秀的程序员绝对不等于对统计学有很好的了解。还有一些案例中显示有扎实的统计能力的优秀科学家也不一定总是在统计方面能做好——科学家也是人，他们也会在统计学领域犯错，这里有些例子：非常草率的处理数据，例如：数据误读，错误标注，未能正确清理数据，合并不正确项，不存档等等。对概率论的理解不足，过分依赖少数概率分布，如常态。对取样理论和取样方法的无知：从一个小的自选择样本推广到一个大的异质群体就是一个例子。对数据加权的误解也很常见。第三个例子使用复杂抽样方法时，将数据视为一个简单的随机样本。对统计推断的把握不严，如混淆统计意义和实际意义。另一个例子是对人口数据进行重要性测试。例如，如果我们对A国有五十年的季度GDP数据，这200个数据点是该时间段内国家的人口数据，而不是人口的样本。例如，进行t检验，看看线性趋势是否与零有统计学上的差异，在这种情况下是没有意义的。利用机会寻找重大差异(p-hacking)，却不考虑已经进行的显著性测试的数量。在学术期刊上，要获得学术期刊的认可，通常需要达到统计上的重要性，而出版偏倚是一个严重的后果。 Meta-Analysis (Borenstein et ) 和Methodsof Meta-Analysis (Schmidt and Hunter)这2本书中的对应方法很管用值得一看。从一个没有被复制甚至交叉验证的单一研究中得出戏剧性的结论。对贝叶斯统计，非参数统计，心理计量学和潜在变量模型的理解太表面。对分析时间序列和纵向数据的方法，以及空间统计和多层次混合模型理解不充分。许多工具，如支持向量机和人工神经网络，以及数据挖掘和预测分析中常用的Boosting和bagging等概念，对许多尚未开发的科学领域有潜在的实用价值。没有对广义线性模型方程给予足够的关注，例如忽略交互术语。在量化回归、回归样条、广义相加模型或其他方法时，对一组特定的数据进行线性化。不理解（或忽略）重要的统计假设。回归分析被普遍滥用。测量误差：统计显着性测试不考虑测量误差，但测量误差可能会对统计模型的解释造成很大影响。忽略回归到平均值：一个非常古老而又非常危险的错误！出于各种动机对连续变量进行分类，以满足统计假设，但这样做是不对的。另一个原因是它是一种输出结果的方法——一些“效应”是年龄真正的代理或年龄大大缓和。连续年龄有时被故意地分组到广泛的年龄范围，使其效果减弱。这样，一个不负责任的研究者可以得出结论：他们试图建立的效果在控制年龄后是“显着的”。已经知道结果后才提出假设:这个现象很普遍，以至于“人人都做，所以没关系”。用数据子集支持一个假设：“调整”数据直到它支持一个假设。混淆因果关系：对因果机制的误解并不罕见。埋藏在评论里的错误：有成千上万的“学术”出版物，但很少有期刊审稿人是具备专业的统计知识。将模拟数据当作实际数据处理，并将计算机模拟解释为使用真实数据的实验。基于假设而不是数据来进行粗略的估计，这在学术文献中很常见，我们很少注意到。随机模型有时也被误解为确定性模型。试图 “从石头里挤血” ：当数据越少，研究人员就越要 “填写空白”。有许多(通常是复杂的)方法来处理过少的数据量，但都增加了进入建模过程的主观性。反过来，这也为不负责人的科学家提供了更多的余地。元分析和倾向分数分析的不当使用。 “从小见大”——用少量信息去证实假设。不跟上统计数据的最新发展，不与专业统计人员交流。这是上面列出的许多问题的根本原因。

科学研究很早就已经从简单的定性分析深入到细致的定量分析，科研工作者要面对大量的数据分析问题，科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中，实验设计的方法直接决定了数据采取何种统计学方法，因为每种统计方法都要求数据满足一定的前提和假定，所以论文在实验设计的时候，就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别，其中最主要的就是统计方法和实验设计不符，造成数据统计结果不可靠。下面，医刊汇编译列举一些常见的可以避免的问题和错误：打开百度APP，查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中，最常见的此类错误就是实验设计是多组研究，需要对数据使用方差分析的时候，而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中，不同数据要采取不同统计处理方法，这就需要作者清楚地描述出每个统计值采用的是何种统计学方法，但在许多使用一种以上数据统计分析方法的医学论文中，作者往往只是简单地把论文采用的数据统计方法进行了整体罗列，并没有对每个数据结果分析分别交代具体的统计方法，这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性，即作者即使不看文章内容，也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字，缺乏直观的统计图或表；或者虽然也列出了统计表或统计图，但表或图内缺项很多，让读者难以从中提取太多有用的信息。另外，也有作者为了增加文章篇幅，同时列出统计表和统计图，造成不必要的浪费和重复。统计表的优点是详细，便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释，最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误，把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论，一定要把统计结果和临床实践结合在一起，这样才会避免出现类似的错误。至于回避阴性结果，只提供阳性结果，是因为不少作者在研究设计时，难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时，从一个方向的实验就下完美的结论，尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性，有时会刻意回避报道差异的不显著结果，不思考和探究差异不显著的原因和意义，反而会因此忽视一些重大的科学发现。

缺失值的处理：缺失值是人群研究中不可避免的问题，其处理方式的差异可能在不同程度上引入偏倚，因此，详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如，瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略，包括：将二分类结局中的缺失值视为未发生事件；将生物标志物和心电图测量中的缺失值进行多重填补（multiple imputation）；为了证明缺失值处理的合理性和填补结果的稳定性，研究还比较了多重填补与完整数据（complete-case）分析的结果。2、数据的预处理：实施统计分析之前往往需要将原始数据进行预处理，如：对连续变量进行函数转换使其更接近正态分布，基于原始数据构建衍生变量，将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据，瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述：确定统计分析使用的变量，并针对每一个变量的分布特征进行描述，是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求，但作者往往套用常用方法，如：连续变量符合正态分布时，采用均数（标准差）描述，否则采用中位数（四分位间距）描述；分类变量采用频数（百分比）描述等。事实上，应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如，CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征，而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析（primary analysis）：指针对研究结局的统计分析，是研究论文的核心证据。因此，医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中，应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

医学论文中常见的统计学错误

你可以参考一下《当代医学论文研究》里面很多这样子的文章

胡良平教授有一本书，<医学统计学基础与典型错误辨析> 可以看看

中国光大（集团）总公司：　　你公司《关于报送企业集团统计报表的请示》（光京字［2003］67号）收悉。经研究，现批复如下：　　一、我局现行企业集团统计报表制度规定，国家试点企业集团和中央管理的企业集团统计报表由我局企业调查总队负责布置、收集。由于你公司属于中央管理的企业集团，因此你公司填报的企业集团统计报表应直接报送给我局企业调查总队，具体执行时间从今年半年报开始。　　二、《北京市统计局关于完善企业集团统计报表制度的通知》（京统发［2003］85号）要求你公司向其报送集团2003年年报和半年报的有关事宜，我局企业调查总队已和北京市统计局企调队进行了沟通，北京市企业集团统计的范围不再包括你公司，其所需资料由我局企业调查总队予以提供。国家统计局办公室二○○三年九月十五日

医学论文常见统计错误点评

写论文最关键的是端正心态，静下心来研究、撰写、成稿，有时社会调研必不可少，我这可以帮你。VSJ

不论是什么错，还是谁提出的，一经核实，原刊物会在以后的期刊中，给出勘误表或更正。如果是作者本人，发现的最好尽快与杂志社联系，予以更正，并附一封对读者的致歉信。

总结统计部分。医学论文撰写中存在的统计学错误最为常见，常表现为统计学处理的设计不合理，统计学的方法应用不当，统计分析结果解释不合理以及统计学图表选用错误等。1统计学设计的科学性统计学方法不合理或缺少统计学方法，或虽有统计学方法，但选择的统计学方法不合理是医学论文中的重要的错误。有统计结果表明其错误率在30%左右。还有的论文只给出统计学结果，没有注明所选用的统计学方法，使读者无法对结论进行准确判断。