

Copyright ©2015-2025 海马课堂网络科技(大连)有限公司 办公地址:辽宁省大连市高新技术产业园区火炬路32A号创业大厦A座18层1801室

添加微信
咨询辅导

Linear Algebra是数学领域中被普遍认为是深入理解机器学习的先决条件的一门学科。
尽管线性代数是一个广泛的领域,包含许多深奥的理论和发现,但从该领域中提取出来的基本工具和符号对于机器学习从业者来说是实用的。拥有对线性代数的扎实基础,可以集中精力学习其中的重要或相关部分。
一、线性代数
线性代数是数学的一个分支,但事实上,线性代数是数据的数学。矩阵和向量是数据的语言。
线性代数涉及线性组合。也就是说,使用向量(称为列的数字)和矩阵(称为数字数组)的算术运算,以创建新的列和数字数组。线性代数是关于线和平面、向量空间和线性变换所需的研究。
这是一个相对年轻的研究领域,最初于19世纪初形式化,以解决线性方程组中的未知数。线性方程只是一系列术语和数学操作,其中一些术语是未知的,例如:
y = 4 * x + 1
像这样的方程在描述二维图上的线时是线性的。这条线是通过将不同的值代入未知的x来找出方程或模型对y值的影响。
我们可以列出一个具有两个或更多未知数的相同形式的方程系统,例如:
y = 0.1 * x1 + 0.4 * x2
y = 0.3 * x1 + 0.9 * x2
y = 0.2 * x1 + 0.3 * x2
...
y值的列可以被视为方程的输出的列向量。浮点值的两列是数据列,例如a1和a2,可以视为矩阵A。两个未知值x1和x2可以视为方程的系数,一起形成待解的未知数向量b。我们可以使用线性代数符号来紧凑地表示这一点:
y = A · b
这种形式的问题通常具有挑战性,因为未知数(这里有2个)多于要解的方程(这里有3个)。此外,通常没有单一的线可以在没有错误的情况下满足所有方程。描述我们通常感兴趣的问题(如线性回归)的系统可能具有无穷多个解。
这只是线性代数核心中我们作为机器学习从业者感兴趣的一小部分。其余的操作主要是为了更容易理解和解决这个问题和类似问题。
二、数值线性代数
在线性代数应用于计算机中通常被称为数值线性代数。“数值”线性代数实际上是应用线性代数。这不仅仅是将线性代数操作实现在代码库中,还包括谨慎处理应用数学问题,比如处理数字计算机的有限浮点精度。
计算机擅长执行线性代数计算,现代机器学习方法(如深度学习)对图形处理单元(GPU)的依赖很大,这是因为它们能够快速计算线性代数操作。
向量和矩阵操作的高效实现最早是在20世纪70年代和80年代用FORTRAN编程语言实现的,许多代码,或者是从这些实现中移植的代码,构成了使用现代编程语言(如Python)进行的大部分线性代数的基础。
三个流行的开源数值线性代数库,它们实现了这些函数,包括:
- 线性代数包(LAPACK)。
- 基本线性代数子程序(BLAS,是线性代数库的标准)。
- 自动调整的线性代数软件(ATLAS)。
通常,当您直接或间接地计算线性代数操作,通过高阶算法,您的代码很可能会下沉,使用其中一个或类似的线性代数库。如果您安装或编译过Python的数值库,如SciPy和NumPy,其中一个或多个这些底层库的名称可能对您不陌生。
三、线性代数与统计学
线性代数是数学的其他分支,尤其是统计学中的一个有价值的工具。通常,学习统计学的学生预计至少在本科阶段学习了一学期的线性代数(或应用代数)。要考虑的重要因素是,线性代数与统计学以及应用机器学习领域之间都具有基础性的关系。
线性代数对统计学和统计方法的一些明显影响包括:
- 使用向量和矩阵表示,特别是在多元统计中。
- 最小二乘和加权最小二乘的解法,如线性回归。
- 数据矩阵的均值和方差估计。
- 在多项高斯分布中起关键作用的协方差矩阵。
- 用于数据降维的主成分分析,整合了其中许多元素。
正如您所看到的,现代统计学和数据分析,至少就机器学习从业者的兴趣而言,依赖于对线性代数的理解和工具。
海马课堂专业课程辅导做出以下新改变啦:
⏩试听课全面升级,不满意退50%,
⏩课程辅导产品升级,赠送考前保障呦
⏩辅导不满意可以随心退!
海马课堂,3500+严选硕博学霸师资,针对学生的薄弱科目和学校教学进度,匹配背景相符的导师,根据学生情况进行1V1专属备课,上课时间灵活安排,中英双语详细讲解课程中的考点、 难点问题,并提供多方位的课后辅导,辅助学生掌握全部课程知识,补足短板。
阅读原文:https://www.highmarktutor.com/news/15924_62.html
版权作品,未经海马课堂 highmarktutor.com 书面授权,严禁转载,违者将被追究法律责任。
hmkt088