分类与预测-LogisticRegression_avagogogo的博客-程序员宅基地_预测和分类

技术标签: python  机器学习  

1. 分类与预测

1.1 介绍与实现过程

  1. 分类和预测是预测问题两种主要类型
    • 分类主要是预测分类标号(离散属性),构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到预先定义好的类别中。
    • 预测主要是建立连续值函数模型,预测给定自变量对应的因变量的值,是指即那里两种或两种以上变量间相互依赖的函数模型,然后进行预测和控制。
  2. 实现过程
    • 第一步:学习,通过归纳分析训练样本集建立数据模型,得到相应规则
    • 第二步:分类/预测:先用已知的测试样本评估准确性,通过检验后对未知数据进行预测

1.2 常用的分类与预测的算法

  1. 方法介绍
    • 回归分析:是确定预测属性(数值型)与其他变量间相互依赖的定量关系最常用的统计学方法。包括:线性回归、非线性回归、logistics回归、岭回归、主成分回归、偏最小二乘回归等模型
    • 决策树:采用自顶向下的递归方式,在内部节点进行属性比较,并根据不同的属性值从该节点向下分支,最终得到的叶节点是学习划分的类
    • 人工神经网络:是一种模仿大脑神经网络结构和功能而建立的信息处理系统,表示神经网络输入与输出变量之间关系的模型
    • 贝叶斯网络:又被成为信度网络
    • 支持向量机:是一种通过某种非线性映射,把低维的非线性可分转化为高维的线性可分,在高维空间进行线性分析的算法

1.3 Logistic回归分析介绍

  1. Logistic回归的本质实际上是:假设数据服从这个分布,然后使用极大似然估计做参数估计
  2. 对于二分类问题,回归模型中只有1-0两种取值(如是和否、发生不发生)假设在p个独立自变量 x 1 x_1 x1 x 2 x_2 x2 x 3 x_3 x3 x p x_p xp作用下,记y取1的概率为 p = P ( y = 1 ∣ X ) p=P(y=1|X) p=P(y=1X),取0的概率为 1 − p 1-p 1p,取1和取0的概率之比为 p 1 − p \frac{p}{1-p} 1pp,称为事件的优势比odds,对优势比取对数,可得: L o g i t ( p ) = l n ( p 1 − p ) Logit(p)=ln(\frac{p}{1-p}) Logit(p)=ln(1pp),则 p = 1 1 + e − z p=\frac{1}{1+e-z} p=1+ez1即为Logistic函数

1.4 案例操作

import pandas as pd
from sklearn.linear_model import LogisticRegression as LR
filename = r"..\data\bankloan.xls"
data = pd.read_excel(filename)
x= data.iloc[:,:8].values
y = data.iloc[:,8].values
lr = LR()
lr.fit(x,y)
print('模型的平均准确度为:%s'%lr.score(x,y))
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/ava_zhang2017/article/details/108306518

智能推荐

ios mysql管理_IOS 数据库管理系统(SQLite)_深井冰323的博客-程序员宅基地

嵌入式数据库SQLite嵌入式数据库的优势1.支持事件,你并不需要配置,无需安装,不需要管理员2.支持部分脂肪SQL923.完整的数据库被存储在磁盘上的文件的顶部,相同的数据库文件可以在不同机器上面使用,最大支持数据库2T4.整个系统少于3万行,少于250KB的内存占用Linux系统级的SQLite技术实现框架libsqlite3.0.dylib開始使用SQLite1.引入头文件2.打开数据库3....

全国计算机二级java考试官网_全国计算机二级Java考试题库_佛十格格的博客-程序员宅基地

在一个面向对象的系统中,类(class)是数据和操作数据的方法的集合。数据和方法一起描述对象(object)的状态和行为。下面是关于全国计算机二级Java考试题库,希望大家认真阅读!全国计算机二级Java考试题库【1】1). 下列代码的执行结果是:public class Test2{public static void main(String args[]){System.out.println...

WebLogic 11g重置用户密码_weixin_33872660的博客-程序员宅基地

weblogic安装后,很久不用,忘记访问控制台的用户名或者密码,可通过以下步骤来重置用户名密码。 版本:WebLogic Server 11g 说明:%DOMAIN_HOME%:指WebLogic Server 域(Domain)目录 例如我的做测试的域的根目录 DOMAIN_HOME=D:/bea10/user_projects/domains/testcluster_d...

oracle windows 优化工具,Windows 2000下优化Oracle9i性能_席妙雅的博客-程序员宅基地

Windows 2000下的Oracle性能优化需要考虑磁盘I/O、CPU、网络子系统、内存几个子系统,这里着重介绍Oracle在Windows 2000环境下的内存调整。优化磁盘配置Oracle是一个磁盘I/O强烈的应用,要确保你恰当地配置磁盘和文件系统:在磁盘上建立数据文件前首先运行磁盘碎片整理程序为了安全地整理磁盘碎片,需关闭打开数据文件的实例,并且停止服务。如果你有足够的连续磁盘空间建立数...

cibc app for android,‎App Store 上的“CIBC Mobile Banking”_August丶Starten丶Sin的博客-程序员宅基地

CIBC MOBILE IS ON TOPCIBC received the overall highest customer satisfaction ranking from J.D. Power for our mobile banking app in a study that ran during March 2020. We’re always striving to make our...

一般linux报错的情况,Linux安装软件时90%的人会遇到这个报错,如何解决?_weixin_39533896的博客-程序员宅基地

提示 Could not get lock /var/lib/dpkg/lock 报错?有些小伙伴在使用 apt 包管理器更新或安装软件时,可能会遇到过诸如以下的错误提示:E:Couldnotgetlock/var/lib/dpkg/lock-frontend-open(11:Resourcetemporarilyunavailable)E:Unabletoacquirethe...

随便推点

python如何快速将代码变成注释_将python源代码转换为带有注释的AST的简单方法_于人士心的博客-程序员宅基地

只是为了给您提供一个上下文:我正在尝试将python源代码转换为一个XML文件(保留了注释),以便进一步处理一个“简单”的方法是使用一个已经做到这一点的工具,而不是重新设计它,特别是如果你时间紧迫的话。在我们的DMS软件重组工具包可以解析Python(和许多其他语言)、构建ast、捕获注释,并将生成的树转换为XML。参见下面的示例。在注:XML最初看起来不错,但在表示/分析/转换代码时是一种笨拙的...

iReport疑难杂症_落落叶叶无声的博客-程序员宅基地

文本自动适应高度报表 Print Order设为VerticalDetail Slipt Type设为Stretch文本 Position Type设为Fix Relative to Top Stretch With Overflow 打勾√生成pdf字段样式设置为粗体斜体设置textField的markup属性为styled修改textField的如下"...

c++ primer 第五版学习笔记-第十一章 关联容器_啃鸡翅的小白猫的博客-程序员宅基地

本文为转载,出处:https://blog.csdn.net/libin1105/article/details/48749231 https://blog.csdn.net/xiaoshuaisdl/article/details/7974364411.1 使用关联容器关联容器支持高效的查找和访问,它和其他容器类型不同,是...

SqlServer中插入无时间的日期_weixin_30847271的博客-程序员宅基地

很简单你可以用: SELECT DATEADD(dd, DATEDIFF(dd, '2000-01-01 00:00:00', GETDATE() ), '2000-01-01 00:00:00' );.csharpcode, .csharpcode pre{ font-size: small; color: black; font-family: consolas, "Cou...

微服务架构 基础(四)_一夜星尘的博客-程序员宅基地

微服务架构 基础(四) 持续更新… 继续前面的基础三工程进行扩展服务网关SpringCloud Gateway什么是SpringCloud Gateway?SpringCloud Gateway是Spring Cloud的一个全新项目,基于Spring 5+SpringBoot 2 和Project Reactor等技术开发网关,它旨在为微服务架构提供一种简单的有效的统一的API路由管理方式。SpringCloud Gateway作为Spring Cloud生态系统中的网关.

mmd python error_mmdetection踩坑安装指南_逝落之心的博客-程序员宅基地

进来实验室卡空着,想着以前只是阅读过mmdetection的代码,想着跑着试试然后我感觉我安装过程中遇到了无数坑。首先,实验室的卡是TITAN RTX的卡,但是由于某些原因,装了cuda9,所以这边考虑安装的是pytorch 1.1 cuda92torchvision 0.3建议大家还是安装anaconda,这边我们新建一个虚拟环境conda create -n mmdet python=3.6s...

推荐文章

热门文章

相关标签