统计学的重要性毋庸多说,基本上NGS数据分析的每个环节参数的把握,每个图表的理解背后都是统计学背景知识。当然了,对大量入门级别玩家,暂时可以不要考虑那么多,先跟着我在生信技能树的教程肝下去,走出一个完整项目再说。但是大量中高级玩家的需求我们也得满足啦,很久以前我们整理过:统计学回顾(精华目录收藏)(statquest+协和八+ NGSHotpot),可以说啃这块统计学硬骨头是提升自己的生信段位不二选择!
最近在朋友圈和各种群聊又看到了另外4个好课程,推荐给大家,文末有一个投票,大家可以参与一下。(估计你们没有那么多时间全部看完,就根据目录进行投票即可)
北京大学-席瑞斌
课程链接:http://www.chinesemooc.org/mooc/4979
1. 统计及生物统计概要(2学时)
2. 数据探索性分析、可视化(4学时)
3. 假设检验和置信区间估计(12学时)
- a) 参数假设检验
- b) 非参数假设检验
- c) Bootstrap方法、permutation 方法
- d) 多重假设检验
4. 回归分析方法(12 学时)
- a) 线性回归分析
- b) 广义线性回归
- c) 非线性回归方法、广义非线性回归方法
- d) 混合效应回归模型
5. 高维生物统计学方法 (12学时)
- a) 模型选择方法
模型衡量准则;传统变量选择方法,如前向选择方法、后向选择方法;罚函数方法 - b) 超高维数变量筛选方法
线性模型中的变量筛选、非线性模型中的变量筛选 - c) 降维方法
PCA, NMF,LLE,DiffusionMap, tSNE, UMAP等线性、非线性降维方法
6. 分类、聚类分析简介(6学时)
- a) 逻辑回归、支持向量机、随机森林等分类方法
- b) K-means、混合正态模型、隐马氏模型等聚类方法
初看这个目录我差点以为就是为生物信息学人才准备的,因为确实涵盖了我们生信分析过程的方方面面。
多元统计分析上海财经大学_中国大学MOOC(慕课)
可能因为是财经大学的课程,所以并不会可以强调这些统计学原理在生物信息学领域的应用,不过打基础也是极好的。链接是:https://www.icourse163.org/course/0712TUFC001-1003381022#/info
第一章 矩阵代数
- 1.1 矩阵的定义和运算
- 1.2 正交矩阵
- 1.3 矩阵的行列式、逆和秩
- 1.4 矩阵的特征值、特征向量和迹
- 1.5 正定矩阵、非负定矩阵和矩阵函数值的SAS输出
- 附录1.A 矩阵代数的R代码(选)
- 附录1.C 矩阵代数的本教材节选(选)
第二章 随机向量和多元正态分布
- 2.1 多元分布
- 2.2 数字特征
- 2.3 欧氏距离和马氏距离
- 2.4 多元正态分布
- 2.5 极大似然估计及估计量的无偏性
- 2.6 JMP入门
- 2.7 一个案例的JMP演示
- 附录2.A 多维数据描述及可视化等的R代码(选)
- 附录2.B SPSS在多维数据描述及可视化等中的应用(选)
- 附录2.C 随机向量的本教材节选(选)
- 附录2.D 多元正态分布的本教材节选(选)
- 第二章测验
第三章 判别分析
- 3.1 引言
- 3.2 两组距离判别
- 3.3 多组距离判别
- 3.4 贝叶斯判别——最大后验概率法
- 3.5 贝叶斯判别——最小期望误判代价法
- 3.6 费希尔判别
- 附录3.A 判别分析的R代码(选)
- 附录3.B SPSS在判别分析中的应用(选)
- 附录3.C 摘自本教材的若干数学证明(选)
- 第三章测验
第四章 聚类分析
- 4.1 引言
- 4.2 距离和相似系数
- 4.3 系统聚类法
- 4.4 聚类中的若干问题
-
4.5 动态聚类法——k均值法
-
附录4.A 聚类分析的R代码(选)
- 附录4.B SPSS在聚类分析中的应用(选)
- 第四章测验
第五章 主成分分析
- 5.1 引言
- 5.2 总体的主成分
- 5.3 样本的主成分
- 5.4 若干案例
- 5.5 若干补充及主成分应用中需注意的问题
- 附录5.A 主成分分析的R代码(选)
- 附录5.B SPSS在主成分分析中的应用(选)
- 附录5.C 摘自本教材的若干数学证明(选)
- 附录5.D 对主成分综合得分方法的质疑(摘自本教材,选)
- 第五章测验
第六章 因子分析
- 6.1 引言
- 6.2 正交因子模型
- 6.3 参数估计
- 6.4 因子旋转
- 6.5 因子得分
- 附录6.A 因子分析的R代码(选)
- 附录6.B SPSS在因子分析中的应用(选)
- 附录6.C 摘自本教材的若干数学证明(选)
- 第六章测验
第七章 对应分析
- 7.1 引言
- 7.2 行轮廓和列轮廓
- 7.3 总惯量
- 7.4 行、列轮廓的坐标
- 7.5 对应分析图
- 附录7.A 对应分析的R代码(选)
- 附录7.B SPSS在对应分析中的应用(选)
- 附录7.C 摘自本教材的若干数学证明(选)
- 第七章测验
厦门大学MOOC 多元统计分析
被搬运到了B站,之所以注意到这门课,是检查我自己的b站,被人工智能算法推荐的,应该是跟我的课程一样的优秀吧!
链接是: https://www.bilibili.com/video/av92489393 或者 https://www.icourse163.org/course/XMU-1206305809
01 多元统计分析概述
- 1.1 多元分析的定义
- 1.2 多元分析的方法简介
-
1.3 多元分析的应用领域
02 多元数据的描述与展示
-
2.1 一元随机变量回顾
- 2.2 随机向量
- 2.2.1 多元数据的数值特征及可视化
- 2.2.2 协方差矩阵的用途
-
2.3 随机向量的变换
03 多元正态分布
-
3.1 多元正态分布
- 3.2 多元正态分布的性质
- 3.3 多元正态的估计
-
3.4 评估多元正态性
04 均值向量的检验
-
4.1 多元检验的冬季
- 4.2 单样本均值向量检验
- 4.3 两样本均值向量检验
- 4.3.1 独立样本
-
4.3.2 成对样本
05 判别分析和分类分析
-
5.1 判别分析和分类分析概述
- 5.2 判别分析:分类规则
- 5.2.1 两群体Fisher线性判别分析
- 5.2.2 多群体Fisher线性判别分析
- 5.3 分类分析:分类结果
- 5.3.1 两群体Fisher分类
- 5.3.2 两群体贝叶斯分类
-
5.3.3 多群体分类
06 主成分分析
-
6.1 主成分分析思想
- 6.2 总体主成分分析
- 6.2.1 总体主成分推导
- 6.2.2 基于标准化的总体主成分分析
- 6.3 样本主成分分析
- 6.3.1 样本主成分推导
- 6.3.2 主成分个数的选择
-
6.3.3 R语言应用实例
07 因子分析
-
7.1 因子分析简介
- 7.2 载荷估计方法
- 7.2.1 主成分法
- 7.2.2 其他方法
- 7.2.3 估计因子得分
- 7.3 因子旋转
- 7.3.1 因子旋转的理解
- 7.3.2 正交旋转和斜交旋转
-
7.4 R语言示例
08 聚类分析
-
8.1 聚类分析概述
- 8.2 层次聚类
- 8.2.1 简介
- 8.2.2 层次聚类的类型
- 8.2.2.1 层次聚类的类型(上)
- 8.2.2.2 层次聚类的类型(下)
- 8.2.3 R语言示例
- 8.3 k-均值聚类
- 8.3.1 方法介绍
- 8.3.2 R语言示例
知乎孟大佬的多元统计
在疫情期间孟浩巍录制了一门网络课程,供大家学习——《生物信息学入门课:生信中常用的多元统计分析》,这个是需要付费的,购买链接:https://ke.qq.com/course/709956
目录的话,我只能以截图代替,不然可能会被举报非法原创!
投票开始
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
- 全国巡讲全球听(买一得五) ,你的生物信息学入门课
- 生信技能树的2019年终总结 ,你的生物信息学成长宝藏
- 2020学习主旋律,B站74小时免费教学视频为你领路