回归通常被称为确定两个或多个变量之间的关系。例如,假设您必须根据给定的输入数据 X 预测某人的收入。
这里,目标变量表示我们关心的预测的未知变量,连续表示 Y 可以取的值没有间隙(不连续性)。
预测收入是一个经典的回归问题。你的输入数据应该包含有关个人的所有信息(称为特征),这些信息可以预测收入,例如他的工作时间、教育经历、职位、居住地。
:
线性回归
逻辑回归
多项式回归
线性回归 使用最佳拟 香港电讯流动电话号码列表 合直线(也称为回归线)建立因变量(Y)和一个或多个独立变量(X)之间的关系。
从数学上来说,
h(xi) = βo + β1 * xi + e
其中 βo 是截距,β1 是直线的斜率,e 是误差项。
逻辑回归 是 一种算法,用于响应变量是分类的。逻辑回归的思想是找到特征与特定结果概率之间的关系。
从数学上来说,
p(X) = βo + β1 * X 其中 p(x) = p(y = 1 | x)
多项式回归是一种 回归分析形式 ,其中独立变量 x 和因变量 y 之间的关系被建模为 x 的 n 次多项式。
监督学习与无监督学习之间的区别
不同之处在于,在监督学习中,“类别”、“类”或“标签”是已知的。在无监督学习中,这些都不是已知的,学习过程会尝试找到合适的“类别”。在这两种学习中,都会考虑所有参数来确定哪些参数最适合执行分类。
选择监督学习还是无监督学习取决于你是否知道数据的“类别”。如果你知道,就使用监督学习。如果你不知道,就使用无监督学习。