一、引言 在生存分析研究中,一些个体生存时间的开始点在试验开始之前,所以人们无法观察到这些个体在进入试验之前的数据。这样所获得的个体数据就是左截断数据。如果个体一旦进入试验,人们可能在试验结束之前未能完全观察到这个个体的全部过程,因此引起了右删失的数据。这样的左截断右删失数据是生存分析中常常遇到的数据之一。具体地说,设(X,T,Y)表示三维的随机变量,其中X为感兴趣的随机变量,具有连续的分布函数F;T是左截断随机变量具有分布函数G,以及Y是右删失随机量具有分布L。假定X是与(T,Y)独立的,但T和Y可以是相关的。所谓左截断右删失数据是:如果Z≥T,(Z,T,δ)是可以观察的,其中Z=X∧Y=min(X,Y)和δ=I(X≤Y)。而当Z<T时,人们无法观察到任何数据。不失一般性,设α≡P(T≤Z)>0和W表示Z的分布函数,即有1-W=(1-F)(1-L)。在文中,设(Z[,i],T[,i],δ[,i])是一列独立同分布的观察样本且与(Z,T,δ),i=1,2,…,n具有相同的分布。又设表示分布函数的累积风险函数。周知,累积风险函数Λ与分布函数F是一对一的关系,具有如下表示式 附图 容易证明 附图 在左截断右删失数据下,固定宽度的分位数序贯置信区间估计是生存分析中的重要研究对象之一,一个例子是基于分位数估计对研究对象进行分类。有关的真实数据是心脏病的心率数据(数据见[8]),目的是进行它和正常人数据的比较,由于没有足够多的数据和所获数据的不完全性,难于对分位数进行准确估计。因此准确分类也是不可能的。但一个重要而有效的解决方法是进行序贯试验,在给定所要求的精度下,适当增加试验样本。在独立同分布情况下,Choudhury,Serfling[9]研究了相类似的固定长度的序贯置信区间。在右删失数据下,Gijbels,Veraverbeke[10,11]以及Wang,Hettmansperger[12]研究了这样的置信区间,Gürler,Stute,Wang[4]考虑了左截断的情况。 在生存分析中,序贯方法是生物统计中一种广泛应用的方法之一,它的优点是节约成本和试验时间,在试验中可以由它来控制所需的时间和成本进行抽样。在实际工作中,试验者往往要求在给定的置信水平和满足一定的精度下,对所感兴趣的量进行统计估计和推断,同时不要浪费太多的资源。因此,此时的序贯区间估计就是一种很好的选择。具体体现是,人们首先要求统计推断满足一定精度,即是给定固定区间的长度,当置信水平已知(即给定某个置信水平)的情况下进行抽样。这些方法在大多数的应用中是很乎合实际要求的。这就是所谓固定宽度的序贯置信区间估计。本文就在这方面进行研究。 为了证明分位数的固定宽度序贯置信区间的渐近性质,我们给出一个扩展的p[,n]分位估计的Bahadur的强表示定理,其中p[,n]可以是一个随机量。当ξ[,pn]是ξ[,p]强相合估计。在某些简单的条件下,的Bahadur表示是 附图 其中f=F'和R[,n]是剩余项。在下一节,我们给出剩余项R[,n]的几乎处处渐近收敛速度,其中是一列收敛于p的随机变量。对于特别的应用,p[,n]一般定义为乘积限估计的渐近方差的泛函。此表示定理在推导分位数估计的大样本性质上具有广泛的应用,此结果是[13]中重要结果的推广。为了获得分位数的置信区间估计,这种推广是必要的。在此节的最后,给出相合的渐近方差估计。为方便,假设Y和T是非负的随机变量。在本文,我们多次用到如下的积分条件,对于任意T<T[,W], 附图 根据[7]的结果,我们表述如下的引理 引理1.1 假定a[,G]<a[,W]或a[,G]=a[,W]和(3)成立。当a[,W]<x≤b<b[,W],一致地有 附图 其中表示概率收敛。 在右删失数据下,Cheng[14],Aly,,Horváth[15],Lo,Singh[16]研究了Bahadur表示中剩余项R[,n](p)的几乎处处收敛速度。Gijbels,Veraverbeke[10,11]给出了Ghosh型的弱表示定理。Zhou[17]考虑了光滑分位数估计和给出了其一致Bahadur表示定理。Padgett[18]获得了些核光滑的分位数估计的渐近性质。Gürler,Stute,Wang[4]首先考虑了左截数据下的分位数估计的各种渐近性质。 二、Bahadure表示定理及固定长度置信区间 在这节,给出分位数估计表示式(2)的结果。为些我们需要如下的条件。 条件(i) 对于T<T[,W][1] [2] [3] [4] [5] 下一页
|