本书较全面地介绍了小波方法在统计学中的应用以及R语言的实现过程。 书中首先介绍了小波理论,详细讨论了小波的重要特性,为小波方法在统计学中的应用奠定理论基础。然后以统计学的知识内容为背景,具体说明了小波在统计学中的应用方法:一是介绍了具有高斯噪声的等间隔数据在非参数回归问题中使用小波估计的多种方法;二是讨论了互相关联的非高斯数据问题,讨论了如何用小波进行置信区间估计、密度估计、生存和危险率估计等,以及相应逆问题的解决方案和函数稀疏性问题;三是分析了小波方法用于平稳和非平稳时间序列的问题;四是讨论了如何用小波的有效方差稳定性来估计非高斯数据的均值问题。
本书适合作为高等学校相关专业的教材,也可供相关领域的科研人员参考。
当有人问周恩来总理对法国大革命(1789—1799)的看法时,他回答说:“现在来说这件事还为时过早”(Rosenberg,1999)。我相信,对于小波来说也是如此。虽然在很多年前人们就提出了一些特定的小波,但是直到20世纪80年代才出现了构成“小波理论”的大量研究文献。小波理论在20世纪80年代末90年代初被引入到统计学,最初在曲线估计这类研究文献中得到广泛应用,并由此发展开来,且以多种方式扩展到统计学中的更多领域,例如生存分析、统计时间序列分析、统计图像处理、逆问题分析以及方差稳定化等。
据Westheimer(2001)所言,法国大革命是傅里叶级数引入及推广的历史大背景,
尽管在当时傅里叶级数本身遭到了科学界的强烈反对。傅里叶理论发展的早期充满质疑声,但在200多年后的今天看来,傅里叶理论及其发展得到的各种傅里叶方法在众多科学领域中得到了广泛应用。小波理论的发展可以说是一场科学革命。小波的一些有趣特性很容易理解,例如多尺度性、局部化和速率。其他一些重要性质,如无条件基性质,也应当进一步去了解。笔者希望,本书能在某种程度上帮助大家去创建更多的小波新方法,同时也希望小波方法能在下一个200年得到更大的发展,并发挥更重要的作用!
本书主要介绍小波方法的应用。 笔者撰写本书主要有两个目的:一个是想介绍统计学中已经应用了小波方法或具有应用小波方法潜力的主要领域;另一个是希望能推动小波方法的普及及应用。出于这样的目的, 本书的主要内容将围绕免费的统计软件R及WaveThresh软件包展开。 通过这些软件工具,读者不仅可以学习和应用统计学中的小波方法,还可以根据自己的需求修改及利用这些方法。本书试图以传统专著的方式覆盖较为广泛的技术领域,但在内容安排上仍不可避免地受限于笔者的学识以及WaveThresh的应用范围。本书的一个特点是书中几乎所有的计算都有相应的代码,并可从WaveThresh网站下载这些代码。因此,笔者希望本书至少在某种程度上达到了由Buckheit和Donoho(1995)所提出的可重复性研究(reproducible research)的标准。
本书中的大部分WaveThresh代码是笔者编写的,但书中也有许多他人编写的代码。 这些代码的编写者贡献并慷慨地同意在WaveThresh中发布这些代码。在此,笔者要感谢Felix Abramovich(FDR阈值处理)、Stuart Barber(复值小波和阈值处理,贝叶斯小波可信区间)、Tim Downie(多小波)、Idris Eckley(2D局部平稳小波过程)、Piotr Fryzlewicz(泊松过程的HaarFisz变换)、Arne Kovac(不规则数据的小波收缩)、Todd Ogden(变点阈值处理)、Theofanis Sapatinas(Donoho和Johnstone测试函数,一些小波包时间序列码,BayesThresh阈值)、Bernard Silverman(实数FFT)、David Herrick(小波密度估计)和Brani Vidakovic(DaubechiesLagarias算法)。还有许多其他人员,有的编写了附件,有的进行了改进和扩展。此外,我还要感谢Anthony Davison提供了他的团队编写的SBand代码。
感谢布里斯托尔大学麻醉科的A.Black和D.Moshal所提供的体积描记数据,感谢布里斯托尔儿童健康研究所的P.Fleming、A.Sawczenko和J.Young所提供的婴儿心电/睡眠状态数据,感谢蒙特塞拉特火山观测台和Aspinall and Associates的Willy Aspinall所提供的RSAM数据。
感谢Springer的John Kimmel鼓励笔者成为“Springer UseR!”系列图书的作者, 在此期间,笔者有幸与小波、数学和统计学领域的许多著名人士一起工作和讨论。最后,笔者还要感谢Felix Abramovich、Anestis Antoniadis、Dan Bailey*、 Rich Baraniuk、Stuart Barber、Jeremy Burn、Alessandro Cardinali、Nikki Carlton、Merlise Clyde、Veronique Delouille、David Donoho、Tim Downie、Idris Eckley、Piotr Fryzlewicz*、Gérard Grégoire、Peter Green、Peter Hall、David Herrick、Katherine Hunt、Maarten Jansen、Iain Johnstone、 Eric Kolaczyk、Marina Knight*、Gerald Kroisandt、Thomas Lee、Emma McCoy、David Merritt、Robert Morgan、Makis Motakis、 Mahadevan Naventhan、Matt Nunes*、Sofia Olhede、HeeSeok Oh、Marianna Pensky、Howell Peregrine、Don Percival、Marc Raimondo、Theofanis Sapatinas、Sylvain Sardy、Andrew Sawczenko、Robin Sibson、Glenn Stone、Suhasini Subba Rao、Kostas Triantafyllopoulos、Brani Vidakovic、Sebastien Van Bellegem、Rainer von Sachs、Andrew Walden、Xue Wang、Brandon Whitcher。特别感谢姓名上标有“*”的人士,他们阅读了本书的初稿,并提出了一系列宝贵建议。特别感谢Bernard Silverman引导笔者进入小波领域,在笔者职业生涯的早期阶段提供了很多明智的建议。
第1章 引言 1
1.1 什么是小波 1
1.2 为什么使用小波 2
1.3 小波在统计学中的应用 9
1.4 关于本书及其应用软件 11
第2章 小波 12
2.1 多尺度变换 12
2.1.1 序列的多尺度分析 12
2.1.2 离散Haar小波 17
2.1.3 矩阵表示 21
2.2 Haar小波 24
2.2.1 尺度和平移量 24
2.2.2 细尺度逼近 24
2.2.3 从较细尺度计算较粗尺度的c 26
2.2.4 尺度近似函数间的差——小波 28
2.2.5 Haar小波变换与离散表示之间的联系 29
2.2.6 离散小波变换的系数结构 30
2.2.7 离散Haar小波变换的例子 30
2.3 多分辨率分析 33
2.3.1 多分辨率分析 33
2.3.2 投影表示 34
2.3.3 扩张方程和小波构造 34
2.4 消失矩 36
2.5 WaveThresh小波 36
2.5.1 Daubechies的紧支撑小波 36
2.5.2 复值Daubechies小波 40
2.6 其他小波 41
2.6.1 Shannon小波 41
2.6.2 Meyer小波 42
2.6.3 样条小波 42
2.6.4 Coiflets小波 44
2.6.5 双正交小波 44
2.7 通用(快速)离散小波变换 45
2.7.1 正向变换 45
2.7.2 滤波、二元抽样和降采样 46
2.7.3 获得初始细尺度父系数 46
2.7.4 离散小波逆变换 48
2.8 边界条件 50
2.9 非抽样小波 51
2.9.1 ε-抽样小波变换 51
2.9.2 非抽样小波变换(NDWT) 52
2.9.3 时间和数据包NDWT排序 54
2.9.4 对非抽样小波的补充说明 58
2.10 多小波 58
2.11小波包变换 60
2.11.1 最佳基算法 61
2.11.2 WaveThresh示例 63
2.12 非抽样小波包变换 65
2.13 多元小波变换 66
2.14 其他问题 69
第3章 小波收缩 71
3.1 概述 71
3.2 小波收缩 72
3.3 一个假设 74
3.4 测试函数 75
3.5 通用阈值 76
3.6 初始分辨率 82
3.7 SURE阈值 82
3.8 交叉验证 83
3.9 错误发现率 85
3.10 贝叶斯小波收缩 86
3.10.1 先验高斯混合 87
3.10.2 点质量分布和高斯分布的混合 88
3.10.3 超参数和Besov空间 89
3.10.4 点质量分布和重尾分布的混合 90
3.11 线性小波平滑 93
3.12 非抽样小波收缩 94
3.12.1 平移不变小波收缩 94
3.12.2 基的选择 98
3.13 多小波收缩(多小波) 101
3.14 复小波收缩 103
3.15 分块阈值 109
3.16 杂项和讨论 111
第4章 小波平滑相关技术 113
4.1 概述 113
4.2 相关数据 113
4.3 非高斯噪声 118
4.4 多维数据 120
4.5 不规则间隔数据 124
4.6 置信区间 129
4.6.1 小波的幂近似 131
4.6.2 更精确的区间 131
4.7 分布密度估计 132
4.8 生存函数估计 135
4.9 反问题 140
第5章 多尺度时间序列分析 143
5.1 概述 143
5.2 平稳时间序列 144
5.2.1 平稳模型 144
5.2.2 平稳时间序列的尺度分析 147
5.3 局部平稳时间序列 149
5.3.1 离散非抽样小波 150
5.3.2 局部平稳小波(LSW)过程 151
5.3.3 LSW仿真 153
5.3.4 局部自协方差和自相关小波 155
5.3.5 LSW估计 156
5.3.6 更多关于小波周期图平滑的信息 160
5.3.7 婴儿心电图数据的LSW分析 160
5.3.8 RSAM数据的LSW分析 163
5.4 局部平稳小波模型在预测中的应用 163
5.4.1 LSW预测软件的应用 165
5.4.2 LSW非平稳预测的基础 167
5.5 基于小波包的时间序列分析 168
5.6 相关主题和讨论 169
第6章 多尺度方差稳定变换 170
6.1 平方根在泊松过程中的应用 170
6.2 Fisz变换 172
6.3 泊松分布密度估计 175
6.4 泊松数据的HaarFisz变换 175
6.4.1 最细尺度下小波系数的Fisz变换 175
6.4.2 较粗尺度下小波系数的Fisz变换 176
6.4.3 HaarFisz系数的均值 176
6.4.4 HaarFisz的多尺度性质 177
6.4.5 Haar小波逆变换 177
6.4.6 HaarFisz变换的公式 178
6.4.7 HaarFisz小波逆变换 178
6.4.8 WaveThresh中的HaarFisz变换 179
6.4.9 去噪和强度估计 183
6.4.10 循环移位 184
6.5 数据驱动的HaarFisz变换 185
6.5.1 h已知 185
6.5.2 h未知 186
6.5.3 例1:航空公司乘客数据 187
6.5.4 例2:GOES8 X射线数据 190
6.6 讨论 190
附录 191
附录A 用于小波和统计学的R软件 191
附录B 符号和数学概念 192
B.1 函数空间 192
B.2 函数的支集 193
B.3 内积、范数和距离 193
B.4 正交性和希尔伯特空间 193
B.5 向量空间的和 193
B.6 傅里叶变换 194
B.7 傅里叶级数 194
B.8 Besov空间 194
B.9 Landau符号 195
附录C 生存函数代码 195
参考文献 197