仪器信息网APP
选仪器、听讲座、看资讯
立即体验
APP内打开
回版面
评论
收藏
点赞
拍砖
举报
取消
发布
当前位置:
仪器社区
>
基础知识专区
>
数据处理
>
帖子详情
【我们不一YOUNG】做实验需要掌握哪些统计学知识(2)
Ins_c893613c
2024/07/16
私聊
数据处理
知识点汇总:
1.集中趋势
2.变异性
3.归一化
4.正态分布
5.抽样分布
6.估计
7.假设检验
8.T检验
一、集中趋势
1.众数
出现频率最高的数;
2.中位数
把样本值排序,分布在最中间的值;
样本总数为奇数时,中位数为第(n+1)/2个值;
样本总数为偶数时,中位数是第n/2个,第(n/2)+1个值的平均数;
3.平均数
所有数的总和除以样本数量;
现在大家接触最多的概念应该是平均数,但有时候,平均数会因为某些极值的出现收到很大影响。
举个小例子,你们班有20人,大家收入差不多,19人都是5000左右,但是有1个同学创业成功了,年入1个亿,这时候统计你们班同学收入的“平均数”就是500万了,这也很好的解释了,每年各地的平均收入数据出炉,小伙伴们直呼给祖国拖后腿了,那是因为大家收入被平均了,此时,“中位数”更能合理的反映真实的情况;
二、变异性
1.四分位数
上面说到了“中位数”,把样本分成了2部分,再找个这2部分各自的“中位数”,也就把样本分为了4个部分,其中1/4处的值记为Q1,2/4处的值记为Q2,3/4处的值记为Q3
2.四分位距 IQR=Q3-Q1
3.异常值
小于Q1-1.5(IQR)或者大于Q3+1.5(IQR);
对于异常值,我们在数据处理的环节就要剔除;
4.方差
5.平方偏差
方差的算术平方根
6.贝塞尔矫正:
修正样本方差
实际在计算方差时,分母要用n-1,而不是样本数量n。原因在于,比如在高斯分布中,我们抽取一部分的样本,用样本的方差表示满足高斯分布的大样本数据集的方差。由于样本主要是落在x=u中心值附近,那么样本如果用如下公式算方差,那么预测方差一定小于大数据集的方差(因为高斯分布的边沿抽取的数据也很少)。为了能弥补这方面的缺陷,那么我们把公式的n改为n-1,以此来提高方差的数值,这种方法叫贝塞尔矫正系数。
三、归一化
1.标准分数
一个给定分数 距离 平均数 多少个标准差?
标准分数是一种可以看出某分数在分布中相对位置的方法。
标准分数能够真实的反映一个分数距离平均数的相对标准距离。
四、正态分布
1.定义:随机变量X服从一个数学期望为μ,方差为σ?2;的正态分布,记为N(μ,σ?2;)
随机取一个样本,有68.3%的概率位于距离均值μ有1个标准差σ内;
有95.4%的概率位于距离均值μ有2个标准差σ内;
有99.7%的概率位于距离均值μ有3个标准差σ内;
五、抽样分布
1.
中心极限定理
设从均值为μ,方差为σ?2;的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ?2;/n的正态分布
2.抽样分布
设总体共有N个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有N·n种抽法,即可以组成N·n不同的样本,在不重复抽样时,共有N·n个可能的样本。每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。但现实中不可能将所有的样本都抽取出来,因此,样本均值的概率分布实际上是一种理论分布。数理统计学的相关定理已经证明:在重置抽样时,样本均值的方差为总体方差的1/n。
举个例子:
48盆MM豆,计算出每盆有几个蓝色的MM豆,48个数据构成了总体样本。然后随机选择五盆,计算五盆中含有蓝色MM豆的平均数,然后反复进行了50次。这就是n为5的样本均值抽样。
六、估计
1. 误差界限
2. 置信度
一般情况下,取95%的置信度就可以;
3. 置信区间
七、假设检验
1.
问题:什么是显著性水平?
显著性水平是估计总体参数落在某一区间内,可能犯错误的概率
2. 如何选择备选检验和零假设?
一个研究者想证明自己的研究结论是正确的,备择假设的方向就要与想要证明其正确性的方向一致;
同时将研究者想收集证据证明其不正确的假设作为原假设H0
八、
T检验
1. 主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。
流程如下:
是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著;
一般检验水准α取0.05即可;
计算检验统计量的方法根据样本形式不同;
2. 独立样本T检验:
现在要分析男生和女生的身高是否相同两者的主要区别在于数据的来源和要分析的问题。
问题:为什么T检验查表时候要n-1?
样本均值替代总体均值损失了一个自由度
3. 配对样本t检验
分析人的早晨和晚上的身高是否不同,于是找来一拨人测他们早上和晚上的身高,这里每个人就有两个值,这里出现了配对
4. Pooled variance
合并方差
当样本平均数不一样,但实际上认为他们的方差是一样的时候,需要合并方差
不要被公式吓到,他的本质是两个样本方差加权平均
5. Cohen’s d
效应量(effect size):提示组间真正的差异占统计学差异的比例,值越大,组间差异越可靠。
相关话题
1
【我们不一YOUNG】数字修约规则
2
【我们不一YOUNG】有效数字及其有效数字的保留
3
暖通空调系统中罗卓尼克温湿度变送器的监测
4
【我们不一YOUNG】数据为什么要进行修约
5
【我们不一YOUNG】系统误差和随机误差
近期热榜
注册默克生命科学购GO小程序即送10元话费!
9月发帖享好礼,送拍立得、京东卡
SEC技术挑战赛·江湖英雄帖
第三届微课大赛投票进行中ing
热门活动
9/12高端酶标仪进击之路
【仪采通】仪器采购更轻松
猜你喜欢
最新推荐
热门推荐
更多推荐
【求助】数据处理,急,谢谢
2009/08/22
关于混凝土强度检验评定的几点疑惑
2015/07/02
不确定度评估
原创
2022/03/30
【讨论】检出限和工作曲线
2013/07/27
“白糖”测量问题解析
第十四届原创
2021/11/03
【讨论】关于数值修约的问题
2010/06/13
平方项系数:0.000e+000 一次性系数: 2.154e-001 常数项:2.872e-003 相关系数:0.996 求助是什么意思?一次性方程是?
求助
2018/05/24
【分享】计算不确定度实例(英文)
2008/05/17
t值检验法中S怎么计算
已应助
2024/08/12
相图的软件绘制
求助
2024/08/06
什么是相对湿度,为什么它很重要?
分享
2024/07/22
【我们不一YOUNG】【建议收藏】十款常见的数据分析软件,工作学习必备!
原创
2024/07/21
【我们不一YOUNG】数据为什么要进行修约
分享
2024/07/20
【我们不一YOUNG】系统误差和随机误差
分享
2024/07/20
暖通空调系统中罗卓尼克温湿度变送器的监测
分享
2024/07/19
【我们不一YOUNG】数字修约规则
分享
2024/07/17
【金秋计划】+玻璃仪器能否只验收不校准?
第十七届原创
2024/09/03
求助PE icpms曲线做不出来
求助
2024/09/04
反向液相色谱柱使用过程中的常见问题及排查经验分享
第十七届原创
2024/09/02
极限测试,气相-FPD检测敌敌畏乐果农残能够做到的最低浓度是多少?
已应助
2024/08/30
【金秋计划】+内部质控使用的质控样来源都是有哪些?
第十七届原创
2024/09/03
液质求助贴
已应助
2024/08/30
实验室建设中天平室的建设细节注意事项
第十七届原创
2024/09/03
求助,关于盲样考核
求助
2024/09/03
【我们不一YOUNG】做实验需要掌握哪些统计学知识
分享
2024/07/16
【我们不一YOUNG】贵州省生态环境厅公开征求《贵州省排污许可质量管理办法(试行)》(征求意见稿)意见
分享
2024/07/16
【我们不一YOUNG】为什么分析方法无法重现
分享
2024/07/16
【我们不一YOUNG】怎么看能力验证报告
分享
2024/07/16
关于ms的驻留时间
原创
2024/07/16
全自动脂肪测定仪无水开机会怎么样
分享
2024/07/16
现场平行会参与均值计算报出吗?
已应助
2024/07/16
挥发性盐基氮检测仪如何看结果
分享
2024/07/16
品牌合作伙伴
生活垃圾填埋标准正式实施!
岛津
日立科学仪器
珀金埃尔默仪器(上海)有限公司(PerkinElmer)
日本电子株式会社
丹纳赫
安捷伦
赛默飞世尔科技
普析通用
欧波同
天美
天瑞仪器
德国耶拿
海能技术
马尔文帕纳科
磐诺科技
上海仪电科仪
梅特勒托利多
聚光科技
莱伯泰科
盛瀚
多宁生物
丹东百特
科哲
卓立汉光
屹尧科技
华谱科仪
宝德仪器
优莱博
HORIBA
布鲁克核磁
举报帖子
执行举报
点赞用户
好友列表
加载中...
正在为您切换请稍后...