在弯曲强度测试实验里,异常值可能会对实验结果的准确性和可靠性产生影响,可按以下方法处理:
异常值的判断
- 统计学方法
- 拉依达准则:也叫3σ准则,适用于数据服从正态分布的情况。先计算出数据的平均值 $\bar{x}$ 和标准差 $S$,然后将测量值 $x_i$ 与平均值进行比较,若 $|x_i - \bar{x}| > 3S$,则 $x_i$ 可能是异常值。例如,在多次测量弯曲强度后,算出平均值为 50MPa,标准差为 2MPa,若某个测量值为 57MPa,$|57 - 50| = 7 > 3×2$,此值就可能是异常值。
- 格拉布斯准则:该准则考虑了样本数量和数据的分布情况,通过计算统计量 $G$ 值来判断异常值。将 $G$ 值与临界值比较,若 $G > G_{表}$(临界值),则对应的数据为异常值。此方法相对拉依达准则,在小样本情况下更可靠。
- 狄克逊准则:根据数据的极差比来判断异常值,适用于样本量较小的情况。通过计算不同排列下的极差比,与相应的临界值对比来确定异常值。
- 物理意义判断
结合实验原理和实际情况判断数据是否合理。例如,在弯曲强度测试中,若某个测量值明显高于或低于同组其他数据,且超出了材料的正常性能范围,就可初步判定为异常值。如已知某材料在正常情况下弯曲强度在 30 - 60MPa 之间,出现 90MPa 的测量值,就需进一步分析。
异常值的处理
- 剔除异常值
- 当通过上述方法确定某个或某些数据为异常值,且在实验过程中未发现明显的操作失误或设备故障时,可将其从数据集中剔除。但需记录剔除的原因和数据,以保证实验的可追溯性。
- 剔除异常值后,重新计算平均值、标准差等统计量,以得到更准确的实验结果。
- 重复实验
- 若对异常值的判断存在疑虑,或者异常值可能是由于偶然因素导致,可进行重复实验。通过多次测量获取更多的数据,再根据新的数据集重新评估异常值情况。
- 重复实验能增加数据的可靠性,减少因个别异常值对实验结果的影响。
- 修正异常值
- 在某些情况下,若能分析出异常值产生的原因,可尝试对异常值进行修正。例如,若异常值是由于测量时的短暂干扰导致,可根据实验的规律和趋势,结合其他数据对其进行合理修正。
- 但修正异常值需谨慎,必须有充分的依据和合理的理由,避免主观随意性。
记录与报告
- 详细记录:在整个处理异常值的过程中,要详细记录异常值的发现、判断过程和处理方法。包括异常值的具体数值、出现的位置、判断依据以及最终的处理结果等信息。
- 报告说明:在实验报告中,要对异常值的情况进行说明。阐述异常值对实验结果的潜在影响,以及采取的处理措施如何保证实验结果的准确性和可靠性。让读者能够清晰了解实验数据的处理过程和实验结果的可靠性。