仪器信息网APP
选仪器、听讲座、看资讯

值得玩味的珠峰高程

数据处理

  • 值得玩味的珠峰高程

    武汉大学 叶晓明

    我曾多次用珠峰高程的结果为案例来质疑现有测量理论的误差分类学说。我之所以用这一案例,一者因为这一案例的知名度高,二者期望达到以子之矛攻子之盾的功效,以减轻我的论述工作量。现在通过网络等多渠道的反馈,越来越觉得这个案例很值得玩味了。
    这个案例是这样的。2005年国家测绘局给出珠峰高程测量结果为8844.43米,精度(标准偏差)为±0.21米。我的意图是,一方面用精度与随机误差的对应逻辑证明珠峰高程的误差是随机误差,另一方面用误差的定义(结果与真值之差)证明珠峰高程的误差是恒定的偏差,应该属于系统误差,从而展示现有测量理论的基本概念逻辑无法自圆其说。现在总结起来,对这个标准偏差±0.21米和珠峰高程误差的关系的理解大体有三种:
    1、珠峰高程结果的误差是个恒定的偏差,±0.21米表达这个偏差的可能存在区间的评价,是偏差值的不可确定的程度。这个偏差不存在系统误差、随机误差的分类问题。
    2、珠峰高程结果的误差是个随机误差,±0.21米表达这个随机误差的随机变化范围。
    3、珠峰高程结果的误差是个恒定的偏差,也是随机误差,±0.21米表达未来相同测量条件下重复测量时测量结果的发散度。
    那么,在这三种答案中,您支持哪一种解释呢?
    如果您支持第一种答案,那么很遗憾地告诉您:您不太可能是一个受过专业训练的测量学者。因为支持这一解释的基本都来自非测量专业人士,当年看到珠峰测量的新闻报道时非测量专业人士一般都是这么理解的。
    如果您支持第2或第3答案,那么您很可能是一个受过专业训练的测量专业人士,对课本的概念逻辑具有较好的记忆,甚至是知名学者。因为测量教科书清楚地写着精度是重复测量结果的发散度,是对随机误差的评价,支持这二答案的基本都是测量专业人士。
    正确的答案只能有一个,那么是谁呢?
    珠峰案例虽然知名度高,但测量过程太复杂,而其答案之一还涉及重复测量的过程,大家自然容易陷入思维死角(实际上这个案例根本就不需要追究其测量过程)。既然如此,我就换个简单的案例。
    作者用数显卡尺测量一钢珠的直径为5.00毫米,根据卡尺的标称计量指标推算出标准偏差为±0.023毫米。现在对标准偏差±0.023毫米有三种解释:
    1、 钢珠的直径结果的误差是个恒定的偏差,±0.023毫米表达这个偏差的可能存在区间的评价,是偏差值的不可确定的程度。这个偏差不存在系统误差、随机误差的分类问题。
    2、 钢珠的直径结果的误差是个随机误差,±0.023毫米表达这个随机误差的随机变化范围。
    3、 钢珠的直径结果的误差是个恒定的偏差,也是随机误差,±0.023毫米表达在未来相同测量条件下重复测量时测量结果的发散度。
    学者优先吧,现看第3种解释——未来相同测量条件下重复测量时测量结果的发散度。这很简单,拿卡尺在相同测量条件重复测量试试呗,您也可以亲自实验做一做。您一定会发现,实验结论非常令人失望,发散度比±0.023毫米小得多,甚至基本就是±0.000毫米。这种解释与事实不符。
    再看第2种解释——随机误差的随机变化范围。这也很简单,既然误差是结果与真值之差,结果是不变的,误差是随机变化的,那么钢珠直径的真值(实际值)就是随机变化的,±0.023毫米的随机变化用手就能摸到。用得着摸吗?傻呀?支持钢珠直径随机变化的能量从哪里来?真能通过测量获得这种无中生有的能量来源那还不发财呀?
    啊啊,只剩下第1种解释了啊,实际上也恰恰就是第1种解释正确。现在我就从数学角度推证一下。
    现有误差序列{△xi}的数学期望为0,某偏差△x是序列{△xi}中的一个成员,或者说,序列{△xi}是偏差△x的所有可能取值的集合。这样,序列{△xi}的方差σ2(△x)----序列{△xi}的发散性,就是偏差△x所存在的概率区间的评价值。即


    现在有一个离散的重复观测值序列{xi},取其中的某一个xi作为最终测量结果x。这样,测量结果x与其数学期望Ex之间的偏差△x=x-Ex就是误差序列{△xi}={xi-Ex}中的一个成员,而序列{△xi}={xi-Ex}的数学期望也正好为0,因为Ex=E(x-Ex)=Ex-Ex=0。这样将△x=x-Ex代入上式就有:




    就是说,测量结果x与其数学期望Ex之间的偏差△x=x-Ex存在于一个数学期望为0、标准偏差为σ(△x)的概率区间内,标准偏差σ(△x)是一个偏差△x=x-Ex的概率区间的评价值!标准偏差原来是一个误差的存在范围的概念,表达测量者主观对一个误差的不可确定的程度---不确定度!就是说,方差是误差的方差,而不是测量结果的方差,跟测量结果x没有直接关系。这就和现有教科书用公式σ2(x)=E(x-Ex)2把方差解释成测量结果x的发散度有所不同了。
    当然,如果以n个不同的xi的平均值作为最终测量结果x,这时的σ(△x)还将下降根号n倍。
    同样的道理,数学期望与真值之差Ex-xT也有它的标准偏差,因为它也是测量产生的,追寻到它的上游测量也可以获得其标准偏差(概率范围)。这样,测量结果的总误差的标准偏差自然按照概率法则合成即可获得。
    偏差x-ExEx-xT都是恒定的偏差,都有标准偏差,没有性质差异,不存在误差分类的问题。数学推理证明,这种新的方差概念解释对贝塞尔公式、最小二乘法等没有任何影响,但测量误差理论的解释中却不需要精度、准确度概念了,不确定度也不再是发散性而是误差的概率区间内涵。
    所以,一个非常遗憾的结论,非专业人士对珠峰高程精度±0.21米的理解是正确的。啊啊,事情是专业人士干的,但非专业人士的解释反而正确,这实在太伤感情了。。。
    2018 3 24
  • 该帖子已被版主-Kevin加10积分,加2经验;加分理由:鼓励原创
    +关注 私聊
  • 雾非雾

    第1楼2018/03/26

    应助达人

    都想建立自己的话语权。

0
    +关注 私聊
  • xx_dxd_xx

    第2楼2018/03/30

    楼主的解释,在意思上是没问题的,但是这样表述却并不严谨。
    对于某一个测量结果,其误差是一定的,所以随机误差不是针对某一个数据,而是针对一组数据而言。而这里的正负范围表示的是置信区间,不是误差,所以也不存在系统误差与随机误差的区别问题。
    如果以你说的卡尺测直径的例子讲:
    应该是测量过程有一个随机误差产生的不确定度,即n次重复的平均值5.00、标准偏差0.01(假设)。
    但是卡尺的刻度本身还有一个固定的不确定度,就是刻线本身不准的问题,这个就是通常说的量具的精度。对于某一个给定卡尺,这个误差是定值,这一个是+0.3、那一个是-0.2。但对于一大批同一精度等级的卡尺,这个又是随机分布的误差。
    所以测量结果的不确定度实际上是系统不确定度与随机不确定度的合成,还是必须考虑具体的测量过程的。

0
    +关注 私聊
  • yeses

    第3楼2018/03/30

    我赞同您前边的观点,一个独立的单一误差实际是不存在类别问题的,这里恰恰就是说明传统理论把标准偏差概念和随机误差概念纠缠在一起有问题。
    关于卡尺例子,这里表达的意思是,单次或n次平均(测量过程)都不是问题的本质,本质是最终提交的就是一个5.00mm,这一结果与其真值之差是个恒定的未知偏差(没有类别),标准偏差实际是这个这个未知恒定的偏差的所有可能取值的分布宽度的评价,表达该偏差的可能取值范围---不确定度。任何单一未知偏差都有标准偏差,不存在什么系统误差没有标准偏差的问题。最终单一结果的偏差的确有一部分x-Ex是随机影响导致的,另一部分Ex-xT是由系统影响导致的,但这二偏差本身没有性质差异(只是来源差异),把偏差ΔA=x-Ex解释为精度而把偏差ΔB=Ex-xT解释为正确度就没有逻辑性了。
    实际上,根据下图,总偏差:Δ=ΔAB,总方差:σ22A)+σ2B)。这个总误差的标准偏差σ就是不确定度,根本没有精度、正确度的什么事。

    xx_dxd_xx(xx_dxd_xx) 发表:楼主的解释,在意思上是没问题的,但是这样表述却并不严谨。
    对于某一个测量结果,其误差是一定的,所以随机误差不是针对某一个数据,而是针对一组数据而言。而这里的正负范围表示的是置信区间,不是误差,所以也不存在系统误差与随机误差的区别问题。
    如果以你说的卡尺测直径的例子讲:
    应该是测量过程有一个随机误差产生的不确定度,即n次重复的平均值5.00、标准偏差0.01(假设)。
    但是卡尺的刻度本身还有一个固定的不确定度,就是刻线本身不准的问题,这个就是通常说的量具的精度。对于某一个给定卡尺,这个误差是定值,这一个是+0.3、那一个是-0.2。但对于一大批同一精度等级的卡尺,这个又是随机分布的误差。
    所以测量结果的不确定度实际上是系统不确定度与随机不确定度的合成,还是必须考虑具体的测量过程的。

0
    +关注 私聊
  • xx_dxd_xx

    第4楼2018/03/30

    其实这个问题分歧的关键在于这个“8844.43米,精度(标准偏差)为±0.21米”中“±0.21米”是指什么?
    至少在我所处的学科领域中,这个“±0.21米”是指不确定的范围,或者用统计术语叫做置信区间。所以也不存在这个“±0.21米”表示随机误差还是系统误差的问题。
    不知楼主的学科领域是不是普遍把这个“±0.21米”称作误差?

0
    +关注 私聊
  • yeses

    第5楼2018/03/30

    测绘领域管它叫精度(您可以查阅以前的报道),也就是精密度precision。

    xx_dxd_xx(xx_dxd_xx) 发表:其实这个问题分歧的关键在于这个“8844.43米,精度(标准偏差)为±0.21米”中“±0.21米”是指什么?
    至少在我所处的学科领域中,这个“±0.21米”是指不确定的范围,或者用统计术语叫做置信区间。所以也不存在这个“±0.21米”表示随机误差还是系统误差的问题。
    不知楼主的学科领域是不是普遍把这个“±0.21米”称作误差?

0
    +关注 私聊
  • xx_dxd_xx

    第6楼2018/03/30

    我所在的化学测量方面,对误差理论讨论并不深入,但是我觉得有一个概念是提的非常好的:因为真值不可知,所以误差也不可知。
    在这个前提下,我们讨论的实际上都是不确定度,而不是误差。是在通过不确定度来估计误差。

0
    +关注 私聊
  • yeses

    第7楼2018/03/30

    是的,对误差值不可把握的程度。

    xx_dxd_xx(xx_dxd_xx) 发表:我所在的化学测量方面,对误差理论讨论并不深入,但是我觉得有一个概念是提的非常好的:因为真值不可知,所以误差也不可知。
    在这个前提下,我们讨论的实际上都是不确定度,而不是误差。是在通过不确定度来估计误差。

0
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...