python决策树-3
off999 2024-11-26 07:24 38 浏览 0 评论
前两篇决策树已经给同学总结并用python代码实现了三种算法:C4.5信息增益算法、ID3信息增益率算法、CART基尼系数算法,这三种算法都是可以创建出决策树模型。并且还解释了过拟合问题以及解决过拟合的方法:预剪枝和后剪枝。
决策树代码
在这三种算法中,大家觉得哪种算法更加好呢!这里先留给大家思考。python的sklearn模块中也存在可以调用的类。
from sklearn import tree
CIC=tree.DecisionTreeClassifier()#构建分类决策树参数
CIC.fit(X,Y)#训练模型
CIC.predict(X_test)#模型预测主要设置的参数有:
criterion:表示节点字段的选择算法,参数有:gini;mes。
max_depth:决策树的最大深度,也就是预剪枝步骤。
min_samples_leaf:叶子结点的最小样本。
min_samples_split:表示根节点与中间节点的最小分割量。
以上的参数均具有防止过拟合的功能,上面参数如能合理的设置,那么过拟合问题会大大降低。至于如何设置参数要参考实际数据,通过大量的试错来验证哪类数据更好。以上的函数是解决分类性决策树问题,连续性可以使用DecisionTreeRegressor()参数设置大同小异。
随机森林
随机森林是决策树的扩展形式,从字面上来看,‘随机’就代表数据的选择是具有随机性的,‘森林’就代表具有很多的决策树,并且这里随机森林都是没有通过预剪枝和后剪枝的。决策树的生成过程采用Bootstrap抽样法。
随机森林的算法思想其实很简单,也就是少数决策服从多数决策。比如:当一个样本数据传入随机森林时,会有n个决策树进行预测,其中有p个决策树认为结果是:1,则有n-p个决策树认为是:0。如果n-p>p那么结果就为0,反之亦然。
Bootstrap采样法的思想就是重采样,假设你有1000条数据、10个自变量、1个因变量。
- 从数据中随机抽取100条数据加入你的第一个决策树数据集编号为‘1’,随后放回数据集。
- 重复步骤 "1." 10次那么就构建好你的第一个数据集‘1’,数据集‘1’中有1000条数据,10个自变量、1个因变量。
- 如果你要构建5个决策树加入随机森林,那么重复以上两个步骤则可以得到5个数据集,并且大小与原始数据集相同。
数据构建完成,接下来构建决策树,构建方法使用的是CART决策树算法。随机使用p个自变量(其中p小于10)。以此类推构建全部5个决策树,然后让5个决策树进行预测,票多者当选。
以上便是随机森林的算法运行步骤是不是很简单。
随机森林代码
为了照顾一些不学算法的同学也能用到这个模型,这里我直接使用python的sklearn模块提供的代码调用即可,就不给大家从头到尾写算法了。
from sklearn import ensemble #ensemble模块中包含了随机森林算法调用
SJ=ensemble.RandomForestClassifier()#分类决策树调用
SJ=ensemble.RandomForestRegressor()#回归决策树调用同样也可以根据决策数参数设置随机森林参数,随机森林增加了几个主要参数:
n_estimators:决策树个数,必须设置
bootstrap:bool类型数据,默认是True.即使用bootstrap随机抽样。
random_state:随机抽样生成器的种子,默认使用系统的随机数生成器
总结
前面给大家预留的一个问题,就是python的sklearn库是使用什么算法节选决策树节点的呢!相信看到这里的同学已经知道那就是CART基尼系数算法,至于为什么选择它当然是因为它名字好听啦!开玩笑的,实际上是因为它既可以处理离散型数据也可以处理连续性数据。
最后留给大家两个问题,问题1在构建决策树时自变量p的大小应该是多少呢?问题2在进行bootstrap抽样时,每次随机抽取的个数应该是多少,抽取的多少会影响决策树的数据结构吗?这在sklearn的随机森林中都为并未提及。在线求解!!!
每日日语语法:
时间的单位:时【じ】分【ぷん】
比如:6じ0ぷん。6時0分。
相关推荐
- win7系统破解激活工具(windows7破解激活)
-
方法如下:1、开机到欢迎界面时,按Ctrl+Alt+Delete,跳出帐号窗口,输入用户名:administrator,回车。2、如果这个帐号也有密码采用开机启动时按F8选“带命令行的安全模式”。...
- 怎么制作winpeu盘启动盘(制作winpe启动盘有什么作用)
-
我们应先理解U盘启动盘:简单理解就是用U盘启动盘代替电脑以前的光驱,所以它只有3个最基本的功能:1、帮助电脑正常启动。比如电脑无限在启动界面循环;2、格式化硬盘。格式化硬盘所有分区,再重新分区;3、重...
- 磁力搜索引擎入口(磁力搜索器引擎)
-
01.磁力熊磁力熊,是一个内容丰富、功能最为强大的一个磁力搜索网站,通过它不仅仅可以搜索到大量纯净的1080P高分电影,像一些比较小众的影视剧这里也都能找到。02.夕阳小站夕阳小站,虽然网站整体界面设...
- 手机变成安全模式怎么解除(手机变成安全模式是怎么回事)
-
解除比较安全模式的方法主要有三种:1、按电源键长按机器会弹出重启菜单,将手机重启即可解除比较安全模式。2、查询手机操作手册,进入设置里找到“比较安全模式”,可以改变比较安全模式的状态,即可解除比较安全...
-
- win7官方最小精简版(最小win7精简版系统239m)
-
推荐win7系统精简版一、雨林木风系统v1906雨林雨林木风GhostWin7SP1旗舰版一如既往注重稳定与安全,本次6月版本更新优化注册表增强系统运行效率,不对系统关键文件进行修改保证稳定性,关闭系统可能会感染病毒的端口,更新最新...
-
2026-01-11 14:51 off999
- 华硕牌子电脑怎么样(华硕牌子电脑怎么样值得买吗)
-
1、华硕笔记本电脑在市场上有很高的认知度和认可度。除了在零售市场有出色口碑外,在特殊领域华硕笔记本一样有惊人的表现;2、华硕笔记本电脑的优点在于它的主板性能好还有就是它的散热效果也不错,性能比较稳定;...
- 两个文件夹内容自动同步(两个文件夹内容自动同步,删除不了)
-
D:盘中点右键,新建公文包B,将文件夹A拖到公文包B中。如果以后文件夹A中的文件修改了,打开公文包B,点菜单上的“公文包、全部更新”。则公文包B就会自动更新文件,与文件夹A中的保持一致。这种方法可以有...
- 无法删除的文件夹怎么删(无法删除文件夹或文件的原因有哪些)
-
删除不了的软件、文件或文件夹的解决方法:1、开机按F8不动,到高级选项出现在松开手,用上下键选安全模式,按照提示进入到安全模式中删除即可(安全模式与正常模式操作一样)。2、如果使用其他办法无法删...
- win7重装系统不用u盘(不用u盘新手重装系统win7)
-
可以通过以下步骤在不使用U盘的情况下重装Win7系统:首先需要备份您的电脑中的重要数据,以免在系统重装时丢失。进入系统的“控制面板”,找到“系统与安全”选项并单击进入。在“系统与安全”页面中,找到“备...
- 扣扣安全中心怎么修改密码(扣扣安全中心修改不了密码)
-
1、首先,打开QQ面板左下角的三个条形图标,然后在弹出选项的“安全”中单击“安全中心主页”。2、然后在打开的QQ安全中心页面中,单击头像下方的“修改密码”。3、然后将弹出一个提示来确认该QQ号码,并单...
- win10两台电脑怎么共享文件(win10两台电脑怎么共享文件夹)
-
在Windows10中,您可以使用以下步骤共享文件:1.在要共享的文件夹上单击右键,选择“属性”。2.选择“共享”选项卡,然后选择“高级共享”。3.在“高级共享”对话框中,选中“共享此文件...
- 电脑复制粘贴不了是怎么回事
-
电脑无法复制粘贴原因分析及解决方法:如果是中病毒的话,会有以下的这些情况:1、系统不能上网,例如宽带账号无法登录,qq登录不上,网页无法打开。2、复制粘贴功能失效。3、电脑任务栏上的信息不能显示。4、...
- win7一键烟雾头(win7烟雾头设置)
-
要调整Win7系统的烟雾头,首先需要打开“显示设置”窗口,在这个窗口中可以找到“分辨率”、“屏幕比例”等选项。接着,在“高级设置”中找到“显示适配器属性”选项,点击进入。在这个界面中,可以找到“3D设...
- win7系统一键装机下载(w7一键安装操作系统)
-
可以在温十系统电脑上下载温七装机系统,但需要按照正确的步骤进行安装。以下是一个可能的安装步骤:1.在温十系统电脑上下载温七装机系统的ISO文件,可以从互联网上下载,也可以从其他媒体(如DVD或USB驱...
- qq互联管理中心(qq互联管理中心是干什么的)
-
QQ互联是基于Discuz!云平台的一项服务,因此在开通QQ互联之前首先需要开通Discuz!云平台。在Discuz!X2中已经内置了云平台和相关服务,无需安装,在后台直接开启即可。可以呀,有...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
