教育小百科为您分享以下优质知识
凸分析是数学领域中的一个分支,主要研究凸函数和凸集的性质。在优化理论、线性计划、最优控制等方面都有广泛的利用。
凸分析的核心概念之一是凸函数:如果一个函数在某个区域内对每一个点,其切线的斜率都小于或等于该点的函数值与切线交点的函数值之比,那末这个函数就是凸函数。换句话说,对一个凸函数f,如果存在一个实数λ >
= 1,使得对任意两个实数x1, x2,都有 fx2) ≤ λf + f,那末f就是一个凸函数。
凸分析的主要结果之一是拉格朗日乘数法,它可以帮助我们找到满足束缚条件的最优解。通过引入拉格朗日乘数,我们可以将原始问题转化为对偶问题,从而简化求解进程。
凸分析是一个研究凸函数和凸集性质的理论框架,它在许多实际问题中都有重要利用。
为了让您更深入了解,
更加精确的说,机器学习的定义如下:
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
一个(机器学习)的程序就是可以从经验数据E中对任务T进行学习的算法,它在任务T上的性能度量P会随着对于经验数据E的学习而变得更好
由于机器学习必然利用了某些经验,它们常常数据的形式存在,我们称之为数据集,其中的每个数据称为记录。例如我们通过一个人的性别、年龄和身高预测他是否患某种常见疾病,有以下数据:
(性别:男;年龄:
18;身高:
174;是否得病:否)
(性别:女;年龄:
17;身高:
164;是否得病:是)
(性别:男;年龄:20;身高:
181;是否得病:是)
(性别:女;年龄:
16;身高:
161;是否得病:是) ……
这可以被称为一个数据集,其中每个人的数据称为记录。在记录中,关于该对象的描述型数据称为属性,由于属性往往有很多个——如上文的年龄,身高等,可以构成属性向量,这些向量张成的空间称为属性空间。而我们的算法需要预测那个量被称为标记(label)——在上文中便是“得病与否”。在有的数据集中存在标记,有的不存在。标记构成的空间称为标记空间,也称为输出空间。
显然,由于我们只能得到整个总体数据的一部分——即训练样本,我们程序得到的模型却不能只适应于这个训练样本,它必须对整个总体数据都有比较好的预测效果。这就是说我们的模型必须具有泛化的能力。
我们训练得到的模型称为一个假设,所有的模型一起构成了假设空间。显然,可能有多种假设空间和训练数据一致——就好像对于一个知识点很少的课堂学习,有不少人能得到很高的分数,但是对于整个总体数据,学习的不同模型显然效果差别很大——真正考验很多难的知识点的考试,考验把上述表面上的学霸分开。
每个假设——也就是训练的模型,必然有其归纳偏好,也就是说,在训练集中没有见过的情况,或者两者皆可的情况,模型会选择哪种。归纳偏好是模型进行泛化的能力基础。