仪器信息网APP
选仪器、听讲座、看资讯

数据处理几大方法

数据处理

  • 1 列表法

    获得数据后的第一项工作就是记录,欲使测量结果一目了然,避免混乱,避免丢失数据,便于查对和比较,列表法是最好的方法。制作一份适当的表格,把被测量和测量的数据一一对应地排列在表中,就是列表法。

    一、列表法的优点

    1. 能够简单地反映出相关物理量之间的对应关系,清楚明了地显示出测量数值的变化情况。

    2. 较容易地从排列的数据中发现个别有错误的数据。

    3. 为进一步用其他方法处理数据创造了有利条件。

    二、列表规则

    1. 用直尺划线打表,力求工整。

    2. 对应关系清楚简洁,行列整齐,一目了然。

    3. 表中所列为物理量的数值(纯数),因此表的栏头也应是一纯数,即物理量的符号除以单位的符号, 例如:α /ms‾²I /10‾³A等,其中物理量的符号用斜体字,单位的符号用正体字。为避免手写正、斜体混乱,本课程规定手写时物理量用汉字表示,例如:加速度/m∙s‾²、电流强度/10‾³A

    4. 提供必要的说明和参数,包括表格名称、主要测量仪器的规格(型号、量程、准确度级别或最大允许误差等)、有关的环境参数(如温度、湿度等)、引用的常量和物理量等。
    +关注 私聊
  • 透明

    第1楼2013/01/26

    2 作图法

    在研究两个物理量之间的关系时,把测得的一系列相互对应的数据及变化的情况用曲线表示出来,这就是作图法。

    一.作图法的优点

    1. 能够形象、直观、简便地显示出物理量的相互关系以及函数的极值、拐点、突变或周期性等特征。

    2. 具有取平均的效果。因为每个数据都存在测量不确定度,所以曲线不可能通过每一个测量点。但对于曲线,测量点时靠近和匀称分布,故曲线具有多次测量取平均的效果。

    3. 有助于发现测量中的个别错误数据。 虽然曲线不可能通过所有的数据点,但不在曲线上的点都应是靠近曲线才合理。如果某一个点离曲线明显的远了,说明这个数据错了,要分析产生错误的原因,必要时可重新测量或剔除该测量点的数据。

    4. 作图法时一种基本的数据处理方法,不仅可以用于分析物理量之间的关系,求经验公式,还可以求物理量的值。但受图纸大小的限制,一般只有3~4位有效数字,且连线具有较大的主观性。所以用作图法求值时,一般不再计算不确定度。

    在报告实验结果时,一条正确的曲线往往胜过百个文字的描述,它能使实验中各物理量间的关系一目了然,所以只要有可能,实验结果就要用曲线表达出来。

    二.作图规则

    1. 列表 按列表规则,将作图的有关数据列成完整的表格,注意名称、符号及有效数字的规范使用。

    2. 选择坐标纸 作图必须用坐标纸。根据物理量的函数关系选择合适的坐标纸,最常用的是直角坐标纸,此外还有对数坐标纸、半对数坐标纸、极坐标纸等。本节以直角坐标为例介绍作图法,其他坐标可参考本节原则进行。

    坐标纸的大小要根据测量数据的有效位数和实验结果的要求来决定,原则是以不损失实验数据的有效数字和能包括全部实验点作为最低要求,即坐标纸的最小分格与实验数据的最后一位准确数字相当。在某些情况下例入数据的有效位太少使得图形太小,还要适当放大以便与观察,同时也有利于避免由于作图而引入附加的误差;若有效位数多,又不宜把该轴取得过长,则应适当牺牲有效位,以求纵横比适度。

    3. 标出坐标轴的名称和标度 通常的横轴代表自变量,纵轴代表因变量,在坐标轴上表明所代表物理量的名称(或符号)和单位,标注方法与表的栏头相同,即量的符号(可用汉字)除以单位的符号。横轴和纵轴的标度比例可以不同,其交点的标度值不一定是零。选择原点的标度值来调整图形的位置,使曲线不偏于坐标的一边或一角;选择适当的分度比例来调整图形的大小。使图形充满纸。分度比例要便于换算和描点,例如,不要用4个格代表1(单位)或用1格代表3(单位)一般取1,2,5,10……标度值按整数等间距(间隔不要太稀或太密,以便于读数)标在坐标纸上。

    3. 描点和连线

    根据测量数据,用削尖的铅笔在坐标图纸上用“+”或“x”标出各测量点,使各测量数据坐落在“+”或“x”的交叉点上。同一图上的不同曲线应当用不同的符号,如“x”、“+”、“☉”、“△”、“□”等。

    用透明的直尺或曲线板把数据点连成直线或光滑曲线。连线应反映出两物理量关系的变化趋势,而不应强求通过每一个数据点,但应使在曲线两旁的点有较匀称的分布,使曲线有取平均的作用。用曲线板连线的要领是:看准四个点,连中间两点间的曲线,依次后移,完成整个曲线。

    5. 在图上空旷位置,写出完整的图名、绘制人姓名及绘制日期,所标文字应当用仿宋体。

    三、 求直线的斜率和截距

    直线时,其方程具有形式y=b0 + b1x。只要求出斜率b1和截距b0,就可以得到关于物理量x,y的经验公式。在许多实验中也通过求斜率或截距来求得物理量。

    例2.测定有一固定转轴的刚体的转动惯量J,该刚体受到动力矩M和阻力矩Mμ的作用,根据转动定律M - Mμ =Jβ,写成M =Mμ + Jβ,设阻力矩为常量,这就是一个直线方程。改变动力矩M,测得一系列相应的角加速度β,作M-β曲线,求出斜率和截距,就得到了转动惯量和阻力矩。

    1. 求斜率

    直线方程 y=b0 + b1x

    (1)

    在曲线上取p1(x1,y2)和p2(x2,y2)两点代入(1)式,即可求得斜率。求斜率时要注意:

    (1)p1、p2必须是直线上的点,且不可取测量点;

    (2)p1、p2在测量范围以内,且相距尽量远;

    (3)p1、p2用不同于作图描点的符号标出,例如用△或□,标上字母符号p1或p2及坐标值。读数和计算时注意正确使用有效数字;

    (4)在实验报告上写出计算斜率的完整过程。

    2. 求截距

    截距b0是对应于x=0的y值。在曲线上另取一点p3(x3,y3),将x3、y3的值和(1)式,代入直线方程,求得



    如果作图时x轴标度从零开始,截距b0也可以从图上直接读出。

0
    +关注 私聊
  • 透明

    第2楼2013/01/26

    3 逐差法



    当两物理量成线性关系时,常用逐差法来计算因变量变化的平均值;当函数关系为多项式形式时,也可用逐差法来求多项式的系数。逐差法也成为环差法。



    一、 逐差法的优点

    1. 充分利用测量数据,更好地发挥了多次测量取平均值的效果。

    2. 绕过某些定值未知量。

    3. 可验证表达式或求多项式的系数。



    二、 逐差法的适用条件

    1. 两物理量x,y之间的关系可表达为多项式形式。

    例如: y=b0 + b1x

    y=b0 + b1x + b 2x²

    y=b0 + b1x + b 2x² + b 3x³

    2. 变量x必须是等间距变化,且较因变量y有更高的测量准确度,以致通常x的测量不确定度忽略不计



    三、 逐项逐差

    逐项逐差就是把因变量y的测量数据逐项相减,用来检查y对于x是否成线性关系,否则用多次逐差来检查多项式的幂次。

    1. 一次逐差

    若y=b0 + b1x,测得一系列对应的数据

    x1,x2,…,xk ,…,xn

    y1,y2,…,yk ,…,yn (3)

    逐项逐差,得到:

    y2-y1=Δy1

    y3-y2=Δy2

    ……………

    yk+1-yk=Δyk

    因为y对于x成线性关系,且x为等间距变化,故Δyk=常量。所以,若对实验测量值进行逐项逐差,得到

    Δyk≈常量

    则证明y对于x成线性关系。

    2. 二次逐差

    若y=b0 + b1x+b2x²,则逐项逐差后所得结果Δyk≠常量,遂将Δyk再作一次逐项逐差(称为二次逐差)

    Δy2-Δy1=Δy1

    Δy3-Δy2=Δy2

    ……………

    Δyk+1-Δyk=Δyk

    同理,若二次逐差结果Δyk≈常量,则可证明y对于x为二次幂的关系。依此类推,还可以进行三次逐差或更高次逐差。



    四、 分组进行逐差求多项式的系数

    用逐差法来求因变量变化的平均值,或求多项式的系数时,不能用逐项逐差,而是把n项测量值分为上、下两组,用下组中的每一个数据与上组中对应的数据一一相减。

    1. 当y对于x为线性关系y=b0 + b1x时,用一次逐差即可求系数b0和b1。

    (1)求系数b1

    测得值如(3)式,共有n项对应值。分为上、下两组,每组有l=n/2项。隔l项相减作逐差:

    yk=b0 + b1xi (4)

    yk+1=b0 + b1xk+l

    两式相减得到 yk+1-yk=b1(xk+l-xk)

    上式左边为因变量隔l项得逐差值,记为δlyk;右边括号中为l倍自变量间隔,记为l(x2-x1),则上式写为

    δlyk=b1·l(x2-x1) (5)

    从k=1到k=l共可得到l个δlyi值,取平均记为δly 。代入(5)式,求得系数b1得值


    (2)求系数b0

    将系数b1值代入(4)式,有

    y1=b0 + b1x1

    y2=b0 + b1x2

    …………

    一共n个yk,每个yk都可以求出一个b0,n个b0取平均,即为所求系数b0得值:




    2. 若y= b0 + b1x + b 2x²,求系数时,则须将第一次逐差得到的δlyk再分成上、下两组,进行第二次逐差,从而求得系数b 2,然后依次求出b1 和b0。

    由此类推,也可以进行多次逐差求高次项的系数,但实际上很少使用。

    3.系数b1和 b0的标准偏差

    (1)b1的标准偏差

    根据(6)式,b1由δly而来,故通常用于求多次测量平均值标准偏差的公式





    求出δly的标准偏差s(δly),再用不确定度传播公式y=f(x1,x2,…)求得系数b1的标准偏差s(b1)。

    (2)b0的标准偏差

    由(7)式可见,b0的标准偏差由y 和b1的标准偏差合成


    得到。如前所述,计算过程中x的测量不确定度忽略不计。

0
    +关注 私聊
  • 透明

    第3楼2013/01/26

    4 最小二乘法和一元线性回归



    从测量数据中寻求经验方程或提取参数,称为回归问题,是实验数据处理的重要内容。用作图法获得直线的斜率和截距就是回归问题的一种处理方法,但连线带有相当大的主观成分,结果会因人而异;用逐差法求多项式的系数也是一种回归方法,但它又受到自变量必须等间距变化的限制。本节介绍处理回归问题的又一种方法――最小二乘法。



    一、 拟合直线的途径

    1. 问题的提出

    假定变量x和y之间存在着线性相关的关系,回归方程为一条直线

    y= b0 + b1x (8)

    由实验测得的一组数据是xk、yk(k=1,2,…,n),我们的任务是根据这组数据拟合出(8)式的直线,即确定其系数b0 、b1。

    我们讨论最简单的情况,假设

    (1) 系统误差已经修正;

    (2) n次测量的条件相同,所以其误差符合正态分布,这样才可以使用最小二乘法原理;

    (3) 只有yk存在误差,即把误差较小的最为变量x,使不确定度的计算变得简单。

    2. 解决问题的途径――最小二乘法原理

    由于测量的分散性,实验点不可能都落在一条直线上,如图3。相对于我们所拟合的直线,某个测量值yk在y方向上偏离了vk,vk就是残差

    vk=yk-y

    =y-(b0+b1xk)

    联想到贝塞尔公式


    如果 的值小,那么标准偏差s(y)就小,能够使s(y)最小的直线就是我们所要拟 合的直线。这就是最小二乘原理。

    最小二乘原理:最佳值乃是能够使各次测量值残差的平方和为最小值的那个值。



    由(9)式可见,b0和b1决定vk的大小,能够使 为最小值的b0、b1值就是回归方程的系数。

    二.回归方程的系数

    1.用最小二乘原理求回归方程的系数

    (10)

    使∑v² k为最小值,极小值条件是一级导数等于零和二级导数大于零。这里xk、yk是测量值,变量b0和b1,(10)式分别对b0和b1求偏导数

    (11)






    整理后得 (12)




    , , ,
    解联立方程(12),得到

    (13)

    (14)



    估计值,于是就求得了回归方程(8)。

    2.为了便于记忆和用计算器或计算机编程计算,引入符号


    (15)


    很容易证明




    于是

    (17)

    3.测量点的重心

    重心。理解这点,有助于用作图法处理数据时的连线。



    三、回归方程系数的标准偏差

    1. yk的标准偏差

    由(12)式,我们很容易求得yk的标准偏差

    (18)



    式中分母n-2是自由度,可以作如下解释:两点决定一条直线,只需测量两个点,即可解出直线的斜率和截距,现在多测了n-2个点,所以n-2是自由度。

    s(y)是因变量yk的标准偏差,在满足本节开始的三个假设的条件下,我们可以对照测量列的标准偏差的意义来理解s(y):对于自变量的某一个取值,因变量是直线上相应的一个点,在重复条件下作任意次测量,实测点落在与直线上相应的距离在s(y)范围以内的概率是68。3%。s(y)描述了测量点对于直线的分散性。

    2. 回归方程系数的标准偏差

    (1) b1的标准偏差s(b1)

    我们的任务是从s(y)求出b0和b1的标准偏差,所以首先要找到b1和yk之间的关系。由(17)




    (19)

    按照不确定度的传播与合成的方法,可求b1的标准偏差。注意到(19)式,b1由多项带有系数的yk求和得到,所以,s(b1)具有方和根的形式,方差s²(b1)为


    将(19)式代入上式,整理后开方得到

    (20)

    (2).b0的标准偏差s(b0)

    同理可推导出 (21)

    3.讨论

    (1) s(b0)是截距b0的标准偏差。如果得到s(b0)< b0,即截距比它本身的标准不确定度还要小,则表明在68.3%的置信水平上,b0等于零,回归直线通过原点。

    (2) 从(20)式可见,当Lxx较大时,s(b1)就较小。根据(15)式,若x的取值比较分散,Lxx就大。这就告诉我们,在求回归直线时,自变量x取点不要集中,要在尽可能大的范围内进行测量,以减小斜率的不确定度s(b1)。

    (3) 从(21)式可以看出,s(b0)不仅与s(b1)有关,而且还直接受x的影响,若

    数值大,s(b0)就会被“放大”。可见,在拟合直线(当然也包括用作图法处理数据)时,如果所取的测量点既远离原点且又密集,则测量结果会很糟糕。



    四、 相关系数

    定义一元线性回归的相关系数

    (22)

    1. 相关系数的正负:对照(22)和(17)两式,可见r与b1同号。即r>0,则b1>0,回归直线的斜率为正,称为正相关:r<0,则b1<0,回归直线的斜率为负,成为负相关。



    图4 不同相关系数的数据点分布示意图





    2. 相关系数的数值:x,y完全不相关时,r=0;全部实验点都在回归直线上时,|r|=1。R的数值只在-1与+1之间,即-1≤ r ≤+1。R数值的大小描述了实验点线性相关的程度。

    3. 通过相关系数计算标准偏差

    用相关系数计算标准偏差甚为方便,推导结果为

    (23)

    (24)



    请注意(24)式的计算结果是斜率的相对标准偏差。

    相关系数爱数据处理计算中有特殊的地位,以致带有线性回归功能的计算器上就设有功能键r,实验数据输入完毕,人们也习惯地首先读出相关系数来检查相关的显著性水平。表4中列除了相关系数的检验数据。











    表4 相关系数检验表

    a

    r

    n-2


    0.05


    0.01
    a

    r

    n-2


    0.05
    0.01

    1
    0.997
    1.000
    20
    0.423
    0.537

    2
    0.950
    0.990
    21
    0.413
    0.526

    3
    0.878
    0.959
    22
    0.404
    0.515

    4
    0.811
    0.917
    23
    0.396
    0.505

    5
    0.754
    0.874
    24
    0.388
    0.496

    6
    0.707
    0.834
    25
    0.381
    0.487

    7
    0.666
    0.798
    26
    0.374
    0.478

    8
    0.632
    0.765
    28
    0.361
    0.463

    9
    0.602
    0.735
    30
    0.349
    0.449

    10
    0.576
    0.708
    35
    0.325
    0.418

    11
    0.553
    0.684
    40
    0.304
    0.393

    12
    0.532
    0.661
    45
    0.288
    0.372

    13
    0.514
    0.641
    50
    0.273
    0.354

    14
    0.497
    0.623
    65
    0.250
    0.325

    15
    0.482
    0.606
    70
    0.232
    0.302

    16
    0.468
    0.590
    80
    0.217
    0.283

    17
    0.456
    0.575
    90
    0.205
    0.267

    18
    0.444
    0.561
    100
    0.195
    0.254

    19
    0.433
    0.549
    200
    0.138
    0.181

0
    +关注 私聊
  • zyl3367898

    第4楼2013/01/26

    应助达人

    把表格再排列一下,会更清晰。

0
  • 该帖子已被版主-透明加2积分,加2经验;加分理由:讨论
    +关注 私聊
  • 透明

    第5楼2013/01/28

    我准备找到WORD的传附件的

    zyl3367898(zyl3367898) 发表:把表格再排列一下,会更清晰。

0
    +关注 私聊
  • 透明

    第6楼2013/02/28

    最近很忙,等有空再传

0
    +关注 私聊
  • whuisvfg

    第7楼2013/03/05

    受教!谢谢透明版主!

0
    +关注 私聊
  • 福虎

    第8楼2013/03/06

    挺好,整理一下传上更好。

0
  • 该帖子已被版主-透明加2积分,加2经验;加分理由:讨论
    +关注 私聊
  • rains2000

    第9楼2013/03/28

    很不错的东西,表4排版一下吧!

0
  • 该帖子已被版主-透明加2积分,加2经验;加分理由:讨论
    +关注 私聊
  • 透明

    第10楼2013/03/28

    最近太忙了,等有空弄下

    rains2000(rains2000) 发表:很不错的东西,表4排版一下吧!

0
查看更多
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...