百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

python机器学习:机器学习模型评价-交叉验证与留一验证

off999 2024-12-22 20:08 64 浏览 0 评论

一篇文章写清楚一个问题,关注我,自学python!

解决一个机器学习问题都是从问题建模开始,我们首先要收集问题资料,深入理解问题后将其抽象成机器可预测的问题。那么我们的学习模型表现究竟怎么样,该如何进行评估呢?今天就给大家写一写交叉验证与留一验证。

交叉验证

交叉验证有时也称为交叉比对,如:10折交叉比对。

交叉验证是一种统计学上将数据样本切割成较小子集的实用方法。首先在一个子集上做训练, 而其它子集则用来做后续对此分析的确认及验证。

为什么需要交叉验证呢?

假设有一个未知模型有一个或者多个未知的参数,并且有一个训练集。训练模型的过程就是对该模型的参数进行调整,使得该模型能够最大的反映出训练集的特征。

但是我们常常会因为训练集过小或者参数不合适而产生过度拟合的情况,测试集的测试效果就可以将这种过拟合验证出来。验证一次不够呀,这时我们就将样本循环分为训练集和测试集,而可以从多个角度去学习样本,避免陷入局部的极值。这就是交叉验证,在这个过程中,无论是训练样本还是测试样本都得到了尽可能多的学习。

一句话:交叉验证让学习更加透彻!

为了保证交叉验证结果的稳定性,对一个样本数据集需要多次不同的划分,得到不同的互补子集,进行多次交叉验证。取多次验证的平均值作为验证结果。

留一验证

留一法就是每次只留下一个样本做测试集,其它样本做训练集,如果有k个样本,则需要训练k次,测试k次。

如果设原始数据有N个样本,那么每个样本单独作为验证集,其余的N-1个样本作为训练集,留一验证会得到N个模型,用这N个模型最终的验证集的分类准确率的平均数作为性能指标。

k折交叉验证python实例操作

首先给大家带来一个10折交叉验证,代码如下:

import pandas as pd
col = ["num_preg", "plasma_glucose_conc", "D_blood_pressure", "skin_fold_thickness", "serum_insulin", "body_mass_index", "pedigree_func", "age", "diabetes"]
diabetes_data = pd.read_csv("dataset/diabetes.txt", names = col)

X = diabetes_data.drop('diabetes', axis = 1)
y = diabetes_data.diabetes


from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=3)

from sklearn.neural_network import MLPClassifier
mlp = MLPClassifier(max_iter=1000)
mlp.fit(x_train, y_train)

from sklearn.model_selection import cross_validate
cv_results = cross_validate(mlp, X, y, cv=10, scoring=["accuracy", "precision", "recall"])
cv_results

解释一下以上代码,首先读入数据(关注后私信获取),然后指定值和标签,然后划分训练集和测试集,然后训练模型(此处我训练了一个多层感知机模型,模型训练见之前文章),然后进行交叉验证。

此例子,我进行了10折,大家可以修改cv参数换成别的折。通过以下代码即可得到10折交叉验证后模型的平均准确度、精确度、召回率。

print("Accuracy: ", cv_results["test_accuracy"].mean())
print("Precision: ", cv_results["test_precision"].mean())
print("Recall: ", cv_results["test_recall"].mean())


留一验证python实例操作

from sklearn.model_selection import LeaveOneOut

cv_results = cross_validate(mlp, X, y,
                            cv=LeaveOneOut(), scoring=["accuracy"])
cv_results

import LeaveOneOut后同样还是改变cv参数为LeaveOneOut即可以实现留一验证,这个验证非常耗时间,我电脑跑这个用了快10分钟,大家可以试试看,得到结果如下图:


最后我们可以输出留一验证的平均模型正确率:

cv_results['test_accuracy'].mean()


小结

今天给大家介绍了机器学习模型验证的交叉验证与留一验证及代码实现方法。感谢大家耐心看完。发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。内容我都会写的很细,用到的数据集也会在原文中给出链接,你只要按照文章中的代码自己也可以做出一样的结果,一个目的就是零基础也能懂,因为自己就是什么基础没有从零学Python的,加油。

(站外链接发不了,请关注后私信回复“数据链接”获取本头条号所有使用数据)

往期内容:

python机器学习:如何储存训练好的模型并重新调用

python机器学习:分类问题学习模型的评价方法及代码实现

相关推荐

itunes下载的固件在哪个位置

可以刷机的将手机联入电脑电脑会自动下载符合手机的版本的固件是一样的,都是通过官方固件包来重装系统。操作步骤如下;1.电脑端下载最新版本的itunes,不然重装时可能会造成未知错误。2.iphone...

电脑重装系统后没声音(电脑重装系统后没声音怎么解决win7)

如果您在电脑重装系统后没有声音,可能是由于以下一些常见问题导致的:1.驱动程序问题:重装系统后,可能需要重新安装声卡驱动程序。您可以从电脑制造商的官方网站或声卡制造商的官方网站上下载并安装最新的声卡驱...

win10制作系统u盘(制作win10系统优盘)

方法一:使用微软官方工具制作u盘工具安装win101、首先电脑浏览器输入“windows10下载”,找到微软官方地址进入,然后选择立即下载工具到电脑上。2、鼠标右键选择以管理员身份运行,同意协议进入下...

苹果手机wlan设置在哪(苹果手机 wlan)

进入设置->Wi-Fi。如何设置iPhone的WIFI?2.选择Wi-Fi之后,会显示附近能搜索到的所有的Wi-Fi网络。如何设置iPhone的WIFI?3.选中其中网络Wi-F...

召唤系统游戏(召唤系统游戏排行)

亡灵进化专家:写的很不错了。猪脚可以用金属或骨头帮自己的亡灵进化升级挺有意思的。不过还没写完网游之审判:是英雄无敌类型的。不过写的很牛逼也写完了。推荐看看还有不死传说:虽然不是召唤的,主教是僵尸和吸血...

w7系统怎么样(电脑w7系统怎么样)

有以下几点理由来分析为什么win7受欢迎1、Windows7有望受到企业用户认可微软目前的最大担心是:企业用户认为Windows7性能同Vista相差不大,因此不会出手购买。微软当初发布Vist...

无敌系统流小说(无敌系统流的小说)

《嫡女之花开富贵》作者:伊人睽睽简介祖父是镇国将军,贵不可言;外公是帝师,才名满天下;父母亲琴瑟和鸣,恩爱无双,无妾室插足;穿越为书香门第的嫡小姐,且无任何庶兄妹,慕兰音认为,她这一生,必将佳期如梦...

键盘上windows键是哪个键(电脑键盘上windows键是哪个)
键盘上windows键是哪个键(电脑键盘上windows键是哪个)

一、台式机键盘。Windows键,简称“Winkey”或“Win键”,是在计算机键盘左下角Ctrl和Alt键之间的按键,台式机全尺寸键盘的主键盘区左下角和右下角各有一个,图案是MicrosoftWindows的视窗徽标。二、笔记...

2026-01-13 11:51 off999

笔记本电脑必备app(笔记本电脑必备管宿)
  • 笔记本电脑必备app(笔记本电脑必备管宿)
  • 笔记本电脑必备app(笔记本电脑必备管宿)
  • 笔记本电脑必备app(笔记本电脑必备管宿)
  • 笔记本电脑必备app(笔记本电脑必备管宿)
桌面图标设置在哪打开(桌面图标从哪里调出)
桌面图标设置在哪打开(桌面图标从哪里调出)

1、首先来到电脑桌面,此时桌面没有任何图标,如下图所示。2、我们先右键单击任务栏,会出现工具栏,这时我们在下拉的选项里选择“快速启动”按钮。3、单击快速启动按钮后会出现如图所示情况,这时在电脑屏幕的左下方会显示很多快捷按钮,一般情况下单击快...

2026-01-13 10:51 off999

windows如何进入启动项(怎么进入启动选项)

方法步骤如下:1.点击应用在Windows设置界面点击应用选项进入。2.选择启动在左侧分类中选择启动选项。3.点击开关点击软件后方的开关即可启动或关闭开机启动项。1、在Window的文件资...

win11下载安装

一、允许安装软件1、首先点击左下角的开始按键,然后点击“settings”进入设置。2、然后点击设置中的“应用”选项。3、在点击左侧任务栏中的“应用和功能”。4、点击下拉栏,然后选择其中的“任何来源”...

win7支持的最高配置(win7支持的最高配置是多少)

答案是支持win7的最高配置应该是i99900k加b365主板。 不过这套配置市面上价格偏高。这种机器比同等酷睿13代处理器的价格还要高至少一千元以上。而且就性能而言要超过i99900...

指令引用的内存不能为read(指令引用的0x0000000内存.该内存不能为read)

出现“指令引用内存不能为read”的错误可能有多种原因,包括软件冲突、驱动问题、内存质量问题等。以下是一些可能的解决方案:1.检查是否有软件冲突:尝试关闭可能冲突的软件,例如杀毒软件、优化软件等。2...

hp1010打印机驱动程序(hp deskjet1010打印机驱动)

1.把光盘到电脑里然后打开光盘找到“setup.exe”双击运行。2.这里点击“不用了,谢谢,我喜欢CD安装”;下载的驱动也点这个。3.到这个一步有6个软件需要安装,不用点选直接下一步即可。4.同意服...

取消回复欢迎 发表评论: