当前位置: 首页 > news >正文

网站一键生成网络营销岗位描述的内容

网站一键生成,网络营销岗位描述的内容,企业手机网站建设信息,wordpress讲解普通的逻辑回归只能针对二分类问题,也就是分类结果为是和不是,好和不好等问题,而实际应用中还会有多分类的问题,例如金融行业信用评分中需要将用户分为好,中,差三类,对企业信用评级要划分为低风…

普通的逻辑回归只能针对二分类问题,也就是分类结果为是和不是,好和不好等问题,而实际应用中还会有多分类的问题,例如金融行业信用评分中需要将用户分为好,中,差三类,对企业信用评级要划分为低风险,中风险,高风险等等。要想实现多个类别的分类,我们必须要改进logistic回归,让其适应多分类问题。

逻辑回归多分类模型是二分类模型的拓展。主要有OVO/OVR和Softmax回归等拓展方法,其中,OVO/OVR是基于二分类模型的一种通用拓展方法。而Softmax回归是修改逻辑回归的损失函数,让其适应多分类问题。

OVO/OVR

一对一分类器(OvO,One Vs One)

​ 对于OvO策略,我们将训练样本中的 n n n 个类别两两配对,从而产生 n ( n − 1 ) / 2 n(n-1)/2 n(n1)/2 个分类任务(也就是就是组合 C n 2 C_n^2 Cn2)。我们每次拿其中的两类去训练一个分类器,最终将训练出 n ( n − 1 ) / 2 n(n-1)/2 n(n1)/2 个分类器。当预测一组数据时,分别用这 n ( n − 1 ) / 2 n(n-1)/2 n(n1)/2个分类器进行预测,最终的结果为所有预测结果中最多的那一个(即投票选出结果)。

接下来举一个栗子来帮助大家理解OvO的分类过程。

假设现在数据集的分布如下图所示(其中A,B,C代表训练数据的类别)
在这里插入图片描述

OvO首先从训练集中划分不同的两个类别的组合来训练出多个分类器。因为例子中是三类,所以两两分类后会有 C 3 2 C_3^2 C32=3 个分类器,如下图所示(其中每一个矩形框代表一种划分):
在这里插入图片描述
在预测阶段,只需要将样本分别扔给训练阶段训练好的3个分类器进行预测,相当于进行三次逻辑回归二分类,最后将3个分类器预测出的结果进行投票统计,票数最高的结果为预测结果。假设样本是符合A分类的,那么这一个样本在3个分类器中的结果如下图所示:
在这里插入图片描述
在三个分类器中会有两个分类结果为A分类,次数最多,所以最终结果就判断分类结果为A

一对其余分类器(OvR,One Vs Rest)

​ 对于OvR策略,枚举每一种类别,将枚举到的类别作为正例而其他的统一作为反例,这样只需要训练 n n n 个分类器。当预测一组数据时,分别用这 n n n个分类器进行预测,选取结果为正例 (只可能有一个为正例) 的类别作为最终结果。

同样来举一个栗子来帮助大家理解OvO的分类过程。和上面一样假设现在有A,B,C共3个分类的训练数据集:
在这里插入图片描述
OvR在训练阶段取一种样本作为一类,将剩余的所有类型的样本看做另一类,
在这里插入图片描述

这样就形成了3个二分类问题,对应有3个分类器。
在这里插入图片描述

在预测阶段,只需要将样本分别扔给训练阶段训练好的3个分类器进行预测,最后选概率最高的类别作为最终结果。如下图所示
在这里插入图片描述

区别

从具体的分类流程可以知道OvO用时较多,在类别较多的情况下 C n 2 C_n^2 Cn2个分类器个数远远多于OvR的 n n n个分类器。但OvO分类结果更准确,因为每一次二分类时都用真实的类型进行比较,没有混淆其它的类别;

Softmax

对于二分类问题,我们可以使用Sigmod函数(又称Logistic函数)。将 ( − ∞ , + ∞ ) (-\infty, +\infty) (,+)范围内的数值映射成为一个 ( − 1 , 1 ) (-1, 1) (1,1)区间的数值,一个 ( − 1 , 1 ) (-1, 1) (1,1)区间的数值恰好可以用来表示概率。

而为了能将线性回归后的数值进行多分类,需要输出每个类别的概率,这样就可以选择一个概率最高的类别作为预测结果,从而实现多分类。使用的Softmax的公式如下
Softmax ( z i ) = e z i ∑ j e z j \text{Softmax}(z_{i}) = \frac{e^{z_i}}{\sum_j e^{z_j}} Softmax(zi)=jezjezi

Softmax公式大致就是对数据做了归一化,可以让计算出的所有的值都是 [0, 1] 之间的(因为概率必须是 [0, 1]),且所有的值加起来等于 1。用实际数据举个栗子,如下:
在这里插入图片描述
可以看到softmax将原来输出是3,1,-3通过softmax函数一作用,就映射成为(0,1)的值,而这些值的累和为1(满足概率的性质),那么我们就可以将它理解成概率,在最后选取输出结点的时候,我们就可以选取概率最大(也就是值对应最大的)结点,作为我们的预测目标!

参考文章:
https://zhuanlan.zhihu.com/p/45230536
https://www.zhihu.com/question/273645014
https://blog.csdn.net/alw_123/article/details/98869193
https://blog.csdn.net/qq_44350242/article/details/112372860

在这里插入图片描述

http://www.laogonggong.com/news/36286.html

相关文章:

  • 怎么做网站注册的网页关键词seo
  • 建设网站那家公司好sem是什么意思职业
  • 建设一个网站草图营销推广方法有哪些
  • 网站必须兼容哪些浏览器php免费开源crm系统
  • 佛山选择免费网站优化徐州网页关键词优化
  • 清河做网站哪里便宜长春网站建设方案托管
  • wordpress体育直播网站怎么优化到首页
  • 上海建站费用百度快照怎么看
  • 网页设计课程安排seo研究中心vip教程
  • 怎样制作网站网络优化seo薪酬
  • 信阳网站建设汉狮怎么样成都关键词优化服务
  • 江阴服装外贸现状湖南好搜公司seo
  • 切片工具做网站怎么做网络营销推广策略有哪些
  • php动态网站开发唐四薪版答案下列关于seo优化说法不正确的是
  • 黄岐做网站软文营销的成功案例
  • 教育手机网站开发百度网盘怎么找片
  • 一站式网站建设平台篮网最新消息
  • 案例剖析网站百度指数的网址
  • 威海专业做网站公司本地推广平台有哪些
  • 北京企业网页网络优化的流程
  • 如何修改asp网站栏目福州整站优化
  • 网页特效源码网站seo中心
  • 怎么看网站的建站公司是哪个优化的含义
  • 南宁专业做网站方案百度网站优化工具
  • 网站建设的目的分析百度网络电话
  • 做视频网站视频文件都存放在哪时空seo助手
  • 手机如何制作一个网站域名在线查询
  • tk域名网站多少百度引流怎么推广
  • 顺企网企业名录seo是哪个国家
  • 好网站开发微信群推广平台有哪些