关于 OvR 的疑问

来源:9-8 OvR与OvO

lemonlxn

2019-03-12

老师好,关于 OvR ,我有些疑问。
您看看,下面我的理解,是否有误。

老师好,如果一个样本有5个,分别对应 A、B、B 、C、D 四个类别。
那么来一个新样本 :

那这个属于A类别概率是 (1+1) / (1+ 5)   = 1/3
那这个属于B类别概率是 (2+1) / (1+ 5)   = 1/2
那这个属于C类别概率是 (1+1) / (1+ 5)   = 1/3
那这个属于D类别概率是 (1+1) / (1+ 5)   = 1/3

由于属于B类别概率最高,所以这个新样本,属于 B类别 概率最大?
总觉得哪不对
图片描述

写回答

1回答

liuyubobobo

2019-03-13

一个样本属于哪个类别的概率,和样本总量没有关系。是你将某个类别的样本当做X类,其他类别的所有样本当做Y类,然后训练一个分类器,这个分类器预测出的这个样本属于X的概率和属于Y的概率谁高。


比如,有100个样本,25个属于A,25个属于B,25个属于C,25个属于D。

使用OVR解决这个四分类问题,你需要训练4个模型。


第一个模型,将25个属于A的样本分为一类;其他75个不属于A的样本分为一类。进行训练。

这个模型,可以判断出一个样本属于A的概率是多少(或者说不属于A的概率是多少)。


第二个模型,将25个属于B的样本分为一类;其他75个不属于B的样本分为一类。进行训练。

这个模型,可以判断出一个样本属于B的概率是多少(或者说不属于B的概率是多少)。


第三个模型,将25个属于C的样本分为一类;其他75个不属于C的样本分为一类。进行训练。

这个模型,可以判断出一个样本属于C的概率是多少(或者说不属于C的概率是多少)。


第四个模型,将25个属于D的样本分为一类;其他75个不属于D的样本分为一类。进行训练。

这个模型,可以判断出一个样本属于D的概率是多少(或者说不属于D的概率是多少)。


现在,来了一个新样本。这个新样本就可以分别进入四个模型,得到这个样本属于A,B,C,D的概率。取高者。


加油:)

1
4
liuyubobobo
回复
qq_AuspicousID_0
在数学推导中有预先定义的。比如我们这样一章介绍的逻辑回归,概率值指结果为1的概率,可以再从这一章的第一小节,仔细回顾一下我们整个逻辑回归损失函数的推导过程:)
2019-07-04
共4条回复

Python3入门机器学习 经典算法与应用  

Python3+sklearn,兼顾原理、算法底层实现和框架使用。

5851 学习 · 2437 问题

查看课程