详解:如何用Python实现机器学习算法(5)
2017-12-25 MedSci MedSci原创
六、PCA主成分分析(降维) 全部代码 1、用处 数据压缩(Data Compression),使程序运行更快 可视化数据,例如3D-->2D等 ...... 2、2D-->1D,nD-->kD 如下图所示,所有数据点可以投影到一条直线,是投影距离的平方和(投影误差)最小 注意数据需要归一
详解:如何用Python实现机器学习算法(4) 六、PCA主成分分析(降维) 全部代码 1、用处 数据压缩(Data Compression),使程序运行更快 可视化数据,例如3D-->2D等 ...... 2、2D-->1D,nD-->kD 如下图所示,所有数据点可以投影到一条直线,是投影距离的平方和(投影误差)最小 注意数据需要归一化处理 思路是找1个向量u,所有数据投影到上面使投影距离最小 那么nD-->kD就是找k个向量, 所有数据投影到上面使投影误差最小 eg:3D-->2D,2个向量 就代表一个平面了,所有点投影到这个平面的投影误差最小即可 3、主成分分析PCA与线性回归的区别 线性回归是找x与y的关系,然后用于预测y PCA是找一个投影面,最小化data到这个投影面的投影误差 4、PCA降维过程 数据预处理(均值归一化) 公式: 就是减去对应feature的均值,然后除以对应特征的标准差(也可以是最大值-最小值) 实现代码: # 归一化数据 def featureNormalize(X):
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#机器#
0
好好学习.天天向上
71