💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
# 第 2 章 数学基础 ## 标量、向量、矩阵和张量 (1) 标量(Scalar):标量其实就是一个独立存在的数,比如在线性代数中一个实数 5 就可以被看作一个标量,所以标量的运算相对简单,与我们平常做的数学算术运算类似。 (2) 向量(Vector):向量指一列按顺序排列的元素,我们通常习惯用括号将这一列元素括起来,其中的每个元素都由一个索引值来唯一地确定其在向量中的位置,假设向量中的第 1 个元素是`$ x_1 $`,它的索引值就是 1,第 2 个元素索引值是 2,依次类推。 如下所示就是一个由三个元素组成的向量,这个向量的索引值从 1 到 3 分别对应了从`$ x_1 $`到`$ x_3 $`的这三个元素: ```[tex] \begin{bmatrix} x_1\\ x_2\\ x_3 \end{bmatrix} ``` (3) 矩阵(Matrix):矩阵就是一个二维数组结构,我们会用括号将其中的全部元素括起来。向量的索引值是一维的,而矩阵的索引值是二维的。比如如下的矩阵: ```[tex] X = \begin{bmatrix} x_ {11}& x_{12}\\ x_{21} & x_{22}\\ x_{31} & x_{32} \end{bmatrix} ``` `$ x_{11} $`的索引值就是 11。 (4) 张量(Tensor):若数组的维度超过了二维,我们就可以用张量来表示,所以我们可以将张量理解为高维数组。同理,张量的索引值用两个维度的数字来表示已经不够了,其中的元素的索引值会随着张量维度的改变而改变。 ## 矩阵的转置及基本运算 矩阵`$ X $`的转置矩阵表示为:`$ X^T $` 我们对原矩阵`$ X $`中的元素在经过变换后得到的相应的转置矩阵做如下定义:`$ (X^T)_{i,j}=X_{j,i} $` 举例如下: ```[tex] X = \begin{bmatrix} x_ {11}& x_{12}\\ x_{21} & x_{22}\\ x_{31} & x_{32} \end{bmatrix} ``` 转置后的矩阵如下: ```[tex] X^T = \begin{bmatrix} x_ {11}& x_{21} & x_{31}\\ x_{12} & x_{22} & x_{32} \end{bmatrix} ``` <span style="font-size: 18px;">矩阵的基本运算</span> ***** 假设有矩阵 A、B,我们定义它们的算术运算后的结果都存储在矩阵 C 中,如下所示: ```[tex] A = \begin{bmatrix} a_ {11}& a_{12}\\ a_{21} & a_{22} \end{bmatrix} , B = \begin{bmatrix} b_ {11}& b_{12}\\ b_{21} & b_{22} \end{bmatrix} , C = \begin{bmatrix} c_ {11}& c_{12}\\ c_{21} & c_{22} \end{bmatrix} ``` 矩阵的加法运算公式如下: ```[tex] C=A+B ``` ```[tex] c_{ij}=a_{ij}+b_{ij} ``` 矩阵的减法运算公式如下: ```[tex] C=A-B ``` ```[tex] c_{ij}=a_{ij}-b_{ij} ``` 矩阵的乘法运算公式如下: ```[tex] C=A \times B ``` ```[tex] c_{ij}=\sum\limits_{k}a_{ik} \times b_{kj} ```