百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

用Python计算ROC曲线(pythonroc曲线的绘制)

off999 2024-10-10 07:49 16 浏览 0 评论

ROC曲线典型特征是Y轴为真阳性率,X轴为假阳性率。这意味着图的左上角是“理想”点——假阳性率为0,真阳性率为1。这不是很现实,但它确实意味着曲线下更大的区域通常更好。ROC曲线通常用于机器学习二元分类,用于研究机器学习分类器的输出。为了将ROC曲线和ROC面积扩展到多类或多标签分类,需要对输出进行binarize。每个标签可以绘制一条ROC曲线,但也可以通过将标签指标矩阵的每个元素作为二元预测来绘制ROC曲线。将输入样本的预测类概率计算为集合中分类器的加权平均预测类概率。使用Python我们可以导入SkLearn库。用户可以安装Anaconda for Python3并立即开始使用。

在我们的示例中,我们将使用机器学习Python库(scikit)检测是否检测到了类1或类2。在这个例子中,我们将使用支持向量机(SVM)分类器。请创建一个python文件并测试代码。首先,我们必须导入我们的库。

from sklearn.svm import SVC
from sklearn.metrics import roc_curve
from sklearn.metrics import auc
import matplotlib.pyplot as plt
import numpy as np

在将标签与.txt文件中的特征分离之后,我们必须创建多个列表。在我们的用例中,我们使用一个列表,然后将它转换成numpy数组。

#READ TRAINING AND TESTING FILE
featureFile = input("Enter Training File: ")
featureTestFile = input("Enter Test File: ")
featureFile = open(featureFile, 'r')
featureTestFile = open(featureTestFile, 'r')
 
lines = featureFile.readlines()
 
linesTest = featureTestFile.readlines()
 
'''
X: 2D All Features Split Into Columns in a list for training
CF: 2D All Classes (1 or 2) in a list for training
TestX: 2D All Features Split Into Columns in a list for testing
TestCF: 2D All Classes Split Into Columns in a list for testing
'''
X, CF, TestCF, TestX = gatherFeatures(lines, linesTest)
 
#NORMALIZE DATA AND RUN THROUGH SVM OBJECT
runClassifiers(X, TestX, TestCF, CF)

我们读取了所有标记为1或2的训练和测试数据。这是二元分类,对于多类项目将是类似的。一旦收集了特征,我们就可以通过分类器运行所有内容。我将跳过本文的特征收集,只讨论预处理和分析数据。

'''
Pre Process Data and Create ROC Curve. 
'''
 
def runClassifiers(listX, listTestX, listTestCF, CF):
 
#CLASS ARRAY, STORES ALL CLASSES
 cf = np.array(CF)
 cfTest = np.array(listTestCF)
 
#Convert to Array
 X = np.array(listX)
 TestX = np.array(listTestX)
 
# NORMALIZE DATA
 X = preprocessing.scale(X)
 TestX = preprocessing.scale(TestX)
 
#SVM GATHER DATA
 rbf_svc = SVC(kernel='rbf', gamma=0.00001, C=1000,probability=True).fit(X, cf)
 
#PREDICT PROBABILITY SCORE = 2D ARRAY FOR EACH PREDICTION
 predictedprobSVC = rbf_svc.predict_proba(TestX)
 
#GET ROC DATA
 fpr, tpr, thresholds = roc_curve(cfTest, predictedprobSVC[:,1], pos_label=2)
 roc_auc = auc(fpr, tpr)
 
#GRAPH DATA
 plt.figure()
 plt.xlabel('False Positive Rate')
 plt.ylabel('True Positive Rate')
 plt.plot([0, 1], [0, 1], color='navy', linestyle='--')
 plt.xlim([0.0, 1.0])
 plt.ylim([0.0, 1.05])
 plt.title('SVM Classifier ROC')
 plt.plot(fpr, tpr, color='blue', lw=2, label='SVM ROC area = %0.2f)' % roc_auc)
 plt.legend(loc="lower right")
 plt.show()

ROC曲线经常用于以图形方式显示,用于测试或测试组合的每个可能截止值。此外,ROC曲线下的面积给出了使用测试的好处。一旦这个类被运行,我们的ROC曲线图形将会显示,并且看起来像下面的图表。

我们可以看到不同的分类器是如何执行的,并对我们的分析进行扩展。

相关推荐

真的没想到这个python装饰器还能这么写,见也没见过!

引言众所周知,python中,装饰器是非常好玩的,你能够在很多场景中看到它。有很多人可能经常会使用他人设计的装饰器,自己却很少设计过几个装饰器。当然也不乏有的大神非常善于设计装饰器。但不管如何,装饰...

Python 开发必知的 30 款工具(python语言的开发工具)

全面解析开发者在Python开发各个阶段可使用的核心工具热门开源工具Python开发涉及多个阶段,因此需要多种工具来管理:依赖管理:pip、Conda和Poetry是常见的选择。性能分析:...

快到飞起的Python包管理工具UV:从环境创建到PyPI发布的终极指南

尊敬的诸位!我是一名专注于嵌入式开发的物联网工程师。关注我,持续分享最新物联网与AI资讯和开发实战。期望与您携手探寻物联网与AI的无尽可能。"又在等pip安装包?配置国内镜像源也解决不了的...

Python输出语句print()(python输出语句print(3+5))

Python中的输出语句主要通过内置函数print()实现,它可以灵活输出文本、变量、表达式结果等内容到控制台或其他文件。以下是详细介绍及示例:一、print()基本语法print(*object...

Python range 函数实用指南(python range函数的用法)

对话实录小白:(抓狂)我写了foriinrange(5):,为什么只到4?专家:(推眼镜)range是左闭右开区间!记住:包含起点,不包含终点!基础用法三连击1.标准用法#生成0-4p...

3个实用的Pycharm小技巧(pycharm新手教程)

前言当我们用Pycharm来编写python代码的时候,你是否留意过以下三个技巧,接下来分享给大家。1.技巧一:Pycharm添加addsourcefolder操作1.1需求:我有一个项目,是...

python从入门到脱坑 输入与输出——print()函数

大家好今天开始系统的讲解一些入门课程,遇到不会的也不用想太多,跟着写一遍,学习到新内容是你就会明白.以下是针对Python初学者的print()函数详解,从基础到实用技巧,配合清晰示例:一、最基础用法...

Python进阶-day11:并发编程基础(python处理高并发)

一、学习目标理解线程和进程的区别及其应用场景。掌握Python中threading模块的基本用法。能够编写一个多线程下载器,应用并发编程知识。二、学习内容与时间安排上午(2小时):理论学习1....

Excel合并100个表格要1小时?Python3秒搞定!附代码

###**Python3秒合并100个Excel表格(附完整代码)****别再手动复制粘贴了!用Python一键批量合并,效率提升1200倍!**---####**适用场景**-每月汇...

GIL锁也拦不住!这个多进程方案让python速度提升400%

引言"你的python程序怎么卡死了?"当产品经理第3次拍我桌子时,我终于意识到——在200万行的数据清洗任务面前,GIL锁正在把我的8核CPU变成单核计算器...提前准备为了查看核心...

Python之进度条模块tqdm使用方法(python制作进度条可运行的代码)

tqdm是一个进度条模块,可以很好的描述一个任务的执行过程,并且使用起来也非常方便首先介绍tqdm常用参数:desc-进度条标题total-迭代总次数ncols-进度条总长度ascii-使用A...

Python 中制作神奇的动态进度条(python编写进度条)

在本教程中,我们将学习使用三个用于在Python中创建进度条的流行库:TQDM、alive-progress、progressbar。进度条可以在视觉上为用户提供有关任务进度的反馈,如文件下载、数...

用Python编制模拟简单的进度条(python2 进度条)

模拟实现进度条很多人经常在各种视频软件里面看到进度条对比,尤其是我们很多技术、数据走在世界的前列,通过这种展示出来,很是振奋、很激动、很有成就感。很多工具都能实现的,我们今天用python模拟看看。...

一日一技:python中的string.encode()方法

string.encode()方法string.encode()方法返回给定字符串的编码形式,从Python3.0开始,字符串以Unicode格式存储,即字符串中的每个字符都由一个代码点表示。因此...

python中字符串的操作(python字符串的基本处理)

字符串:英文str。表现形式有4种:‘xs’、“xs”、“”“xsxs”“”、‘’‘‘xxx’’’,三引号有个特殊功能,表示注释,跟#一样的功能,(如果字符串本身就有单则不可用单定义...

取消回复欢迎 发表评论: