干货 | 数据分析师进阶必备6大数学利器



【摘要】要想成为资深数据分析师,必须具备一定的数学知识,熟练应用数学技巧,才能更好地使用程序自带的算法。比如说,理解了算法背后的数学知识,能更好地理解用户推荐系统的机制。下面为大家总结了数据分析师进阶必备6大数学利器,希望对大家有所帮助。

三、线性代数

学什么

Facebook上的朋友推荐、Spotify上的歌曲推荐,通过深度学习把自拍照片转换为萨尔瓦多·达利风格的人像画,试问这些操作的共同点是什么?其实就是它们都离不开矩阵和矩阵代数的知识。

线性代数这一重要的数学分支,研究的是机器学习算法如何从数据流中获取有价值信息。下列是必学的线性代数知识:

矩阵和向量的基本性质:标量乘法、线性变换、转置、共轭、秩与行列式

内积与外积、矩阵乘法规则及其算法、逆矩阵

特殊矩阵:方阵、单位矩阵、三角矩阵、稀疏矩阵、密集矩阵、单位向量、对称矩阵、厄米矩阵(又称自共轭矩阵)、斜厄米矩阵和酉矩阵

矩阵分解概念:LU分解、高斯消元法、求解 Ax = b 线性方程组

向量空间、基向量、扩张空间、正交性、线性最小二乘法

特征值、特征向量、对角化与奇异值分解(SVD)

怎么用

使用降维技术实现主成分分析时,要用奇异值分解来缩减维度,让数据集参数变得更少。所有神经网络算法都使用线性代数处理网络结构和学习操作。

在哪儿学

线性代数:从基础到精通 — edX,UT Austin

机器学习中的数学知识:线性代数 — Coursera,帝国理工学院,伦敦[

四、微积分

学什么

在上大学的时候,微积分是最让人头疼的课程,不过,在数据科学和机器学习领域里,微积分可是无处不在,最简单的普通最小二乘法问题的分析解决方案离不开微积分,神经网络中用于学习新模式的反向传播里也少不了微积分。可以说,微积分是你的技能库里最有价(zhi)值(qian)的技能。下列是要掌握的微积分知识点:

单变量函数、极限与连续、可微性

均值定理、不定式和洛必达法则

最大值与最小值

乘积和链式法则

泰勒级数、无限级数求和与积分

积分中值定理与基本公式,定积分与不定积分方程式

Beta 和 Gamma 函数

多变量函数、极限与连续、偏导数

常微分方程与偏微分方程的基础知识(不必了解过于高级的内容)

怎么用

理解逻辑回归算法需要微积分的知识,比如怎样通过“梯度下降”找到最小损失函数。 要了解梯度下降的机制,就会用到微积分的概念 - 梯度、导数、极限和链式法则。

在哪儿学

大学预备课 - 微积分 — edX, TU Delft

可汗学院 - 微积分

机器学习中的数学知识:多变量微积分 — Coursera,帝国理工学院,伦敦




上一篇:世界欠他一个图灵奖,LSTM之父的深度学习“奇迹之年”
下一篇:香港食安中心跟进日本非法进口冷藏蛋白液