摘要:
目前医学、社会学、生物等领域都存在尖峰、厚尾且偏斜的数据,针对这类数据,采用偏Laplace正态数据去拟合,得到的结果会更加精确。同时,在统计学中,异常点或强影响点对统计诊断的结果会产生很大的影响,因此对异常点或强影响点的诊断就显得尤为重要。常用的似然距离、Cook距离等研究删除一个(组)点对回归分析与预测值的影响,而Pena距离研究删除样本中各点对某一特定点回归值以及预测值的影响。基于此,在Pena距离下对偏Laplace正态数据下位置回归模型的影响分析进行了研究,利用EM算法对偏Laplace正态分布下的位置回归模型做了统计诊断。得到偏Laplace正态数据下位置回归模型下Pena距离的表达式以及高杠杆异常点的判别方法,并把Pena距离、Cook距离、似然距离进行比较,得到在某些情况下利用Pena距离检测异常点比Cook距离与似然距离更优。模拟与实例研究说明提出的模型与方法具有合理性。
中图分类号:
郑桂芬, 王丹璐, 吴刘仓. 基于Pena距离的偏Laplace正态数据下位置回归模型的统计诊断[J]. 工程数学学报, 2023, 40(1): 55-68.
ZHENG Guifen, WANG Danlu, WU Liucang. Statistical Diagnosis of Location Regression Model Based on Pena Distance under Skew Laplace Normal Data[J]. Chinese Journal of Engineering Mathematics, 2023, 40(1): 55-68.