量化投资 数据挖掘技术实践 MATLAB 自动发货

量化投资 数据挖掘技术实践 MATLAB

发布时间: 2020-02-20

类型 视频 授权 免费 百度网盘 自动发货 发布者 itkec

¥免费

立即下载 加入收藏

综合评分:5.0   月销量:1 笔   关注度:784 ℃

开通VIP会员 享受全站资源免费下载

视频详情:

课程名称:量化投资 数据挖掘技术与实践 MATLAB


内容简介:

全书内容分为三篇。*篇为基础篇,主要介绍量化投资与数据挖掘的关系,以及数据挖掘的概念、实现过程、主要内容、主要工具等内容。第二篇为技术篇,系统介绍了数据挖掘的相关技术及这些技术在量化投资中的应用,主要包括数据的准备、数据的探索、关联规则方法、数据回归方法、分类方法、聚类方法、预测方法、诊断方法、时间序列方法、智能优化方法等内容。第三篇为实践篇,主要介绍数据挖掘技术在量化投资中的综合应用实战,包括统计套利策略的挖掘与优化、配对交易策略的挖掘与实现、数据挖掘在股票程序化交易中的综合应用,以及基于数据挖掘技术的量化交易系统的构建。本书的读者对象为从事投资、数据挖掘、数据分析、数据管理工作的专业人士;金融、经济、管理、统计等专业的教师和学生;希望学习MATLAB的广大科研人员、学者和工程技术人员。


课程目录:

第一篇 基础篇

第1章 绪论 2

1.1 量化投资与数据挖掘的关系 2

1.1.1 什么是量化投资 2

1.1.2 量化投资的特点 3

1.1.3 量化投资的核心——量化模型 5

1.1.4 量化模型的主要产生方法——

数据挖掘 7

1.2 数据挖掘的概念和原理 8

1.2.1 什么是数据挖掘 8

1.2.2 数据挖掘的原理 10

1.3 数据挖掘在量化投资中的应用 11

1.3.1 宏观经济分析 11

1.3.2 估价 13

1.3.3 量化选股 14

1.3.4 量化择时 14

1.3.5 算法交易 14

1.4 本章小结 15

参考文献 16

第2章 数据挖掘的内容、过程及

工具 17

2.1 数据挖掘的内容 17

2.1.1 关联 17

2.1.2 回归 19

2.1.3 分类 20

2.1.4 聚类 21

2.1.5 预测 22

2.1.6 诊断 23

2.2 数据挖掘过程 24

2.2.1 数据挖掘过程概述 24

2.2.2 挖掘目标的定义 25

2.2.3 数据的准备 26

2.2.4 数据的探索 28

2.2.5 模型的建立 29

2.2.6 模型的评估 33

2.2.7 模型的部署 35

2.3 数据挖掘工具 36

2.3.1 MATLAB 36

2.3.2 SAS 37

2.3.3 SPSS 38

2.3.4 WEKA 39

2.3.5 R 41

2.3.6 工具的比较与选择 42

2.4 本章小结 43

参考文献 43

第3章 MATLAB零基础入门 44

3.1 MATLAB零基础入门 44

3.1.1 MATLAB概要 44

3.1.2 MATLAB的功能 45

3.1.3 零基础入门案例 46

3.1.4 入门后的提高 55

3.2 MATLAB常用技巧 55

3.2.1 常用标点的功能 55

3.2.2 常用操作指令 56

3.2.3 指令编辑操作键 56

3.2.4 MATLAB数据类型 56

3.3 MATLAB开发模式 58

3.3.1 命令行模式 58

3.3.2 脚本模式 58

3.3.3 面向对象模式 58

3.3.4 三种模式的配合 58

3.4 小结 59

第二篇 技术篇

第4章 数据的准备 63

4.1 数据的收集 63

4.1.1 认识数据 63

4.1.2 数据挖掘的数据源 64

4.1.3 数据抽样 65

4.1.4 量化投资的数据源 67

4.1.5 从雅虎获取交易数据 69

4.1.6 从大智慧获取财务数据 71

4.1.7 从Wind中获取高质量数据 73

4.2 数据质量分析 75

4.2.1 数据质量分析的必要性 75

4.2.2 数据质量分析的目的 75

4.2.3 数据质量分析的内容 76

4.2.4 数据质量分析的方法 76

4.2.5 数据质量分析的结果及应用 82

4.3 数据预处理 82

4.3.1 为什么需要数据预处理 82

4.3.2 数据预处理的主要任务 83

4.3.3 数据清洗 84

4.3.4 数据集成 88

4.3.5 数据归约 89

4.3.6 数据变换 90

4.4 本章小结 92

参考文献 93

第5章 数据的探索 94

5.1 衍生变量 95

5.1.1 衍生变量的定义 95

5.1.2 变量衍生的原则和方法 96

5.1.3 常用的股票衍生变量 96

5.1.4 评价型衍生变量 101

5.1.5 衍生变量数据收集与集成 103

5.2 数据的统计 104

5.2.1 基本描述性统计 105

5.2.2 分布描述性统计 106

5.3 数据可视化 106

5.3.1 基本可视化方法 107

5.3.2 数据分布形状可视化 108

5.3.3 数据关联情况可视化 110

5.3.4 数据分组可视化 111

5.4 样本选择 113

5.4.1 样本选择的方法 113

5.4.2 样本选择应用实战 113

5.5 数据降维 116

5.5.1 主成分分析(PCA)基本

原理 116

5.5.2 PCA应用案例:企业综合

实力排序 118

5.5.3 相关系数降维 122

5.6 本章小结 123

参考文献 123

第6章 关联规则方法 124

6.1 关联规则概要 124

6.1.1 关联规则的提出背景 124

6.1.2 关联规则的基本概念 125

6.1.3 关联规则的分类 127

6.1.4 关联规则挖掘常用算法 128

6.2 Apriori算法 128

6.2.1 Apriori算法的基本思想 128

6.2.2 Apriori算法的步骤 129

6.2.3 Apriori算法的实战 129

6.2.4 Apriori算法的程序实现 132

6.2.5 Apriori算法的优缺点 135

6.3 FP-Growth算法 136

6.3.1 FP-Growth算法步骤 136

6.3.2 FP-Growth算法实战 137

6.3.3 FP-Growth算法的优缺点 139

6.4 应用实战:行业关联选股法 139

6.5 本章小结 141

参考文献 142

第7章 数据回归方法 143

7.1 一元回归 144

7.1.1 一元线性回归 144

7.1.2 一元非线性回归 148

7.1.3 一元多项式回归 153

7.2 多元回归 153

7.2.1 多元线性回归 153

7.2.2 多元多项式回归 157

7.3 逐步归回 160

7.3.1 逐步回归的基本思想 160

7.3.2 逐步回归步骤 161

7.3.3 逐步回归的MATLAB方法 162

7.4 Logistic回归 164

7.4.1 Logistic模型 164

7.4.2 Logistic回归实战 165

7.5 应用实战:多因子选股模型

的实现 168

7.5.1 多因子模型的基本思想 168

7.5.2 多因子模型的实现 169

7.6 本章小结 172

参考文献 172

第8章 分类方法 173

8.1 分类方法概要 173

8.1.1 分类的概念 173

8.1.2 分类的原理 174

8.1.3 常用的分类方法 175

8.2 K-近邻(KNN) 176

8.2.1 K-近邻原理 176

8.2.2 K-近邻实战 177

8.2.3 K-近邻特点 180

8.3 贝叶斯分类 181

8.3.1 贝叶斯分类原理 181

8.3.2 朴素贝叶斯分类原理 182

8.3.3 朴素贝叶斯分类实战 184

8.3.4 朴素贝叶斯特点 185

8.4 神经网络 185

8.4.1 神经网络的原理 185

8.4.2 神经网络的实战 188

8.4.3 神经网络的特点 188

8.5 逻辑斯蒂(Logistic) 189

8.5.1 逻辑斯蒂的原理 189

8.5.2 逻辑斯蒂的实战 189

8.5.3 逻辑斯蒂的特点 189

8.6 判别分析 190

8.6.1 判别分析的原理 190

8.6.2 判别分析的实战 191

8.6.3 判别分析的特点 191

8.7 支持向量机(SVM) 192

8.7.1 SVM的基本思想 192

8.7.2 理论基础 193

8.7.3 支持向量机的实战 196

8.7.4 支持向量机的特点 196

8.8 决策树 197

8.8.1 决策树的基本概念 197

8.8.2 决策树的建构的步骤 198

8.8.3 决策树的实战 201

8.8.4 决策树的特点 202

8.9 分类的评判 202

8.9.1 正确率 202

8.9.2 ROC曲线 204

8.10 应用实战:分类选股法 206

8.10.1 案例背景 206

8.10.2 实现方法 208

8.11 延伸阅读:其他分类方法 210

8.12 本章小结 211

参考文献 211

第9章 聚类方法 212

9.1 聚类方法概要 212

9.1.1 聚类的概念 212

9.1.2 类的度量方法 214

9.1.3 聚类方法的应用场景 216

9.1.4 聚类方法的分类 217

9.2 K-means方法 217

9.2.1 K-means的原理和步骤 218

9.2.2 K-means实战1:自主编程 219

9.2.3 K-means实战2:集成函数 221

9.2.4 K-means的特点 224

9.3 层次聚类 225

9.3.1 层次聚类的原理和步骤 225

9.3.2 层次聚类的实战 227

9.3.3 层次聚类的特点 229

9.4 神经网络聚类 229

9.4.1 神经网络聚类的原理和步骤 229

9.4.2 神经网络聚类的实战 229

9.4.3 神经网络聚类的特点 230

9.5 模糊C-均值(FCM)方法 230

9.5.1 FCM的原理和步骤 230

9.5.2 FCM的应用实战 232

9.5.3 FCM算法的特点 233

9.6 高斯混合聚类方法 233

9.6.1 高斯混合聚类的原理和步骤 233

9.6.2 高斯聚类的实战 236

9.6.3 高斯聚类的特点 236

9.7 类别数的确定方法 237

9.7.1 类别的原理 237

9.7.2 类别的实战 238

9.8 应用实战:股票聚类分池 240

9.8.1 聚类目标和数据描述 240

9.8.2 实现过程 240

9.8.3 结果及分析 242

9.9 延伸阅读 244

9.9.1 目前聚类分析研究的主要

内容 244

9.9.2 SOM智能聚类算法 245

9.10 本章小结 246

参考文献 246

第10章 预测方法 247

10.1 预测方法概要 247

10.1.1 预测的概念 247

10.1.2 预测的基本原理 248

10.1.3 量化投资中预测的主要

内容 249


10.1.4 预测的准确度评价及影响

因素 250

10.1.5 常用的预测方法 251

10.2 灰色预测 252

10.2.1 灰色预测原理 252

10.2.2 灰色预测的实战 254

10.3 马尔科夫预测 256

10.3.1 马尔科夫预测的原理 256

10.3.2 马尔科夫过程的特性 257

10.3.3 马尔科夫预测的实战 258

10.4 应用实战:大盘走势预测 262

10.4.1 数据的选取及模型的建立 263

10.4.2 预测过程 264

10.4.3 预测结果与分析 265

10.5 本章小结 265

参考文献 267

第11章 诊断方法 268

11.1 离群点诊断概要 268

11.1.1 离群点诊断的定义 268

11.1.2 离群点诊断的作用 269

11.1.3 离群点诊断方法分类 271

11.2 基于统计的离群点诊断 271

11.2.1 理论基础 271

11.2.2 应用实战 273

11.2.3 优点与缺点 275

11.3 基于距离的离群点诊断 275

11.3.1 理论基础 275


11.3.2 应用实战 276

11.3.3 优点与缺点 278

11.4 基于密度的离群点挖掘 278

11.4.1 理论基础 278

11.4.2 应用实战 279

11.4.3 优点与缺点 281

11.5 基于聚类的离群点挖掘 281

11.5.1 理论基础 281

11.5.2 应用实战 282

11.5.3 优点与缺点 284

11.6 应用实战:离群点诊断量化

择时 284

11.7 延伸阅读:新兴的离群点

挖掘方法 286

11.7.1 基于关联的离群点挖掘 286

11.7.2 基于粗糙集的离群点挖掘 286

11.7.3 基于人工神经网络的离群点

挖掘 287

11.8 本章小结 287

参考文献 288

第12章 时间序列方法 289

12.1 时间序列的基本概念 289

12.1.1 时间序列的定义 289

12.1.2 时间序列的组成因素 290

12.1.3 时间序列的分类 291

12.1.4 时间序列分析方法 292

12.2 平稳时间序列分析方法 292

12.2.1


课程截图:

1.png

版权信息:本站所有资源均收集于互联网或会员发布,仅供学习与参考,请勿用于商业用途,如有侵犯您的版权,请您出示版权证明及时联系客服,我们将在24小时之内删除。
  • tsen****

    tsen****

    未评价,系统默认好评!

更多评论

嘿,我来帮您!