多分类问题multicalss classification_weixin_34019929的博客-程序员宅基地

技术标签: 测试  

多分类问题:有N个类别C1,C2,...,Cn,多分类学习的基本思路是“拆解法”,即将多分类任务拆分为若干个而分类任务求解,最经典的拆分策略是:“一对一”,“一对多”,“多对多”

(1)一对一

给定数据集D={(x1,y1),(x2,y2),...,(xn,yn)},yi€{c1,c2,...,cN},一对一将这N个类别两两配对,从而产生N(N-1)/2个二分类任务,在测试阶段新样本将同时提交给所有的分类器,于是将得到N(n-1)/2个分类结果,最终把预测最多的结果作为投票结果。

算法:

(2)一对多

一对多则是将每一个样例作为正例,其他剩余的样例作为反例来训练N个分类器,如果在测试时仅有一个分类器产生了正例,则最终的结果为该分类器,如果产生了多个正例,则判断分类器的置信度,选择置信度大的分类别标记作为最终分类结果。

算法:

举例描述:

一对一问题:如果有4个类,首先从中任选两个类,进行标记,判断某一个样例更倾向于哪一个类,记录预测的结果,对所有的样例进行判断,看他应该属于两个类中的哪一个,然后选择其他的两个类,重复这个过程,最后收集某一个样例的全部判断结果,会得到不同的结果,找到其中的所占的比例最大的结果即为最终的结果。

(3)多对多问题:

有一种最常用的技术是:”纠错输出码“,分为两个阶段,编码阶段和解码阶段

编码阶段:对N个类别进行M次划分,每次将一部分类划分为正类,一部分类划分为反类,编码矩阵有两种形式:二元码和三元码,前者只有正类和反类,后者除了正类和和反类还有停用类,在解码阶段,各分类器的预测结果联合起来形成测试示例的编码,该编码与各类所对应的编码进行比较,将距离最小的编码所对应的类别作为预测结果。

例如:在上图(1)中,f1分类器使得所有的C2为正例,其他为反例,f2分类器使得C1,C3为正,剩余分类器如图所示,因此可以得到一串输入码,以C1为例,其输入码为(-1,+1,-1,+1,+1)对于测试用例(-1,-1,+1,-1,+1)计算它与其他类的距离,即计算输入码和测试用例的欧式距离以C1和测试用例为例=(-1-1)2+(+1-1)2+(-1-1)2+(+1+1)2+(+1-1)2=12½

海明距离:

计算海明距离的一种方法,就是对两个位串进行异或(xor)运算,并计算出异或运算结果中1的个数。例如110和011这两个位串,对它们进行异或运算,其结果是:
110⊕011=101
异或结果中含有两个1,因此110和011之间的汉明距离就等于2

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_34019929/article/details/85840985

智能推荐

微信朋友圈长视频服务器地址,微信朋友圈发布60秒+长视频教程_征昊的博客-程序员宅基地

最近看到一些朋友在求微信朋友圈发长视频方法,下面给大家大概解释一哈:1、下载好趣推等能压缩视频软件的APP,注册登录,打开微信小视频功能。ps:不用开什么vip,普通用户可以使用这个功能2、导入你要发在朋友圈的长视频,进入到压缩界面。为节省时间,点“自动压缩”。PS:这个软件只能实现4M以内的视频发布。根据你的视频大小和手机配置,压缩需要一定时间。耐心等待压缩完成,进行下一步。3、压缩完成后点击右...

android 获取mac 2017,VS 2017 for Mac 有这些新特性_网易蜗牛读书的博客-程序员宅基地

多平台应用模板现在,使用多平台 Xamarin.Forms 应用和本机应用项目模板可以快速创建多平台移动应用和其云后端。这些模板可以创建多个项目:通过共享的项目共享代码的 Xamarin.iOS 应用项目和 Xamarin.Android 应用项目,以及实现应用后端服务的 .NET Core Web API 项目(图 1)。(图 1)使用 .NET Core 调试将 ASP.NET Core We...

java:<显示两个字符串的相同前缀>_bensonrachel的博客-程序员宅基地_获取两个字符串相同前缀

编写一个方法,返回两个字符串共有的前缀。例如,“distance”,“disinfection” 的共同前缀是”dis“。如果两个字符串没有公共前缀,这个方法返回一个空字符串。

VMware安装_从入门到秃顶的博客-程序员宅基地

1.创建虚拟机(1)出现新建虚拟机向导,选择典型(自定义比较麻烦,所以选择自定义)下一步。(2)选择稍后安装操作系统,下一步。(3)客户机操作系统(选择Linux(L)) 版本 选择CentOS 7 64 位 下一步(4)虚拟机名称(自己取个名) 位置最好放在D盘中,位置目录后缀最好加个虚拟机命名的一个文件,下一步。如:(5)最大磁盘大小,默认为20个GB选择将虚拟磁盘拆分多个文件 ,下一步。(6)选择自定义硬件内存建议 选择4GB处理器1个就行新CD/DVD(IDE) 选择

android显示图片的原理_倪鹏的博客-程序员宅基地

android显示图片的原理,设计到几个方面:1.图片的

随便推点

php中文手册读书笔记_book2016的博客-程序员宅基地

1.浮点数之间不适合用等号比较,定界符...AA;[email protected]错误控制符3.&内存引用,类似于linux操作系统的软链接4.强制转化=(类型)变量5.常量define6.魔术常量:行文函类方7.=== 类型和值都等8.+数组联合,添加到前面数组的右边9.函数可以临时定义10.变量函数$aaa="fff";则 $aaa();会调用fff()函

解决安装Oracle 11g 遇到的坑_weixin_34409741的博客-程序员宅基地

一.Win10下安装Oracle 11g 报错 信息 [INS-30131] 执行安装程序验证所需的初始设置失败解决:在CMD(管理员身份运行)中使用如下带权限的创建c盘共享命令:net share C$=C: /GRANT:Everyone,READ /GRANT:BUILTIN\Administrators,FULL 就可以了。二.oracle 11g未找到文件WFMLRSVCApp.ea...

python常见基础编程题目_Python随笔30:Python基础编程练习题25~26_weixin_39880301的博客-程序员宅基地

注:本文所有代码均经过Python 3.7实际运行检验,保证其严谨性。注:本文所有代码均经过Python 3.7实际运行检验,保证其严谨性。Python编程Python基础练习题25:合并两个列表并去重输入两个列表alist和blist,要求列表中的每个元素都为正整数且不超过10(各自列表中不含重复元素);合并alist和blist,并将两个列表相互重复的元素去掉后输出一个新的列表clist。同时...

Element表格筛选下拉框数据过多时,显示滚动条_DONTWANTTOSLEEP的博客-程序员宅基地_下拉框超过数量变为滚动显示

效果如下:&lt;style scope&gt; &lt;/style&gt; 首先要将scope删除再写上如下内容即可&lt;style&gt;.el-table-filter { max-height: 300px; overflow: auto;}&lt;/style&gt;

微信小程序再放新能力,公众号关联小程序的主体不再受限_陈秋歌的博客-程序员宅基地

声明:本文来自阿拉丁互动社区公众号(微信号ALaDingWeChat)。 责编:陈秋歌,寻求报道或者投稿请发邮件至chenqg#csdn.net,或加微信:Rachel_qg。 了解更多前沿技术资讯,获取深度技术文章推荐,请关注CSDN研发频道微博。4月20日晚,微信又公布了小程序新能力,公众号可以关联不同主体的小程序了。主要有这三个变化:一、关联小程序的主体不再受限以前,小程...

shell-字符截取命令sed_思路清晰的小王的博客-程序员宅基地

cut是字段截取printf和awk是列截取sed:类似于vim命令。但是 vi 不可以直接修改命令的输出结果;必须把结果输入文件才可以用vi来编辑。sed可以直接修改命令的结果,还可以通过管道符。当然也可以处理文件。下面这个没加  -n  时把第二行重复了一遍后,把整个文件都输出了。所以在用p输出时一般都会加上  -n  选项。