5 行代码实现图像分割(图像分割算法的源代码实现结果图)
off999 2024-10-20 08:06 32 浏览 0 评论
本文来自量子位
图像分割,作为计算机视觉的基础,是图像理解的重要组成部分,也是图像处理的难点之一。
那么,如何优雅且体面的图像分割?
5行代码、分分钟实现的库——PixelLib,了解一下。
当然,如此好用的项目,开源是必须的。
为什么要用到图像分割?
虽然计算机视觉研究工作者,会经常接触图像分割的问题,但是我们还是需要对其做下“赘述”(方便初学者)。
我们都知道每个图像都是有一组像素值组成。简单来说,图像分割就是在像素级上,对图像进行分类的任务。
图像分割中使用的一些“独门秘技”,使它可以处理一些关键的计算机视觉任务。主要分为2类:
语义分割:就是把图像中每个像素赋予一个类别标签,用不同的颜色来表示。
实例分割:它不需要对每个像素进行标记,它只需要找到感兴趣物体的边缘轮廓就行。
它的身影也经常会出现在比较重要的场景中:
无人驾驶汽车视觉系统,可以有效的理解道路场景。
医疗图像分割,可以帮助医生进行诊断测试。
卫星图像分析,等等。
所以,图像分割技术的应用还是非常重要的。
接下来,我们就直奔主题,开始了解一下PixelLib,这个神奇又好用的库。
快速安装PixelLib
PixelLib这个库可以非常简单的实现图像分割——5行代码就可以实现语义分割和实例分割。
老规矩,先介绍一下安装环境。
安装最新版本的TensorFlow、Pillow、OpenCV-Python、scikit-image和PixelLib:
pip3 install tensorflow
pip3 install pillow
pip3 install opencv-python
pip3 install scikit-image
pip3 install pixellib
PixelLib实现语义分割
PixelLib在执行语义分割任务时,采用的是Deeplabv3+框架,以及在pascalvoc上预训练的Xception模型。
用在pascalvoc上预训练的Xception模型执行语义分割:
import pixellib
from pixellib.semantic import semantic_segmentation
segment_image = semantic_segmentation
segment_image.load_pascalvoc_model(“deeplabv3_xception_tf_dim_ordering_tf_kernels.h5”)
segment_image.segmentAsPascalvoc(“path_to_image”, output_image_name = “path_to_output_image”)
让我们看一下每行代码:
import pixellib
from pixellib.semantic import semantic_segmentation
#created an instance of semantic segmentation class
segment_image = semantic_segmentation
用于执行语义分割的类,是从pixellib导入的,创建了一个类的实例。
segment_image.load_pascalvoc_model(“deeplabv3_xception_tf_dim_ordering_tf_kernels.h5”)
调用函数来加载在pascal voc上训练的xception模型(xception模型可以从文末传送门链接处下载)。
segment_image.segmentAsPascalvoc(“path_to_image”, output_image_name = “path_to_output_image”)
这是对图像进行分割的代码行,这个函数包含了两个参数:
path_to_image:图像被分割的路径。
path_to_output_image:保存输出图像的路径,图像将被保存在你当前的工作目录中。
接下来,上图,实战!
图像文件命名为:sample1.jpg,如下图所示。
执行代码如下:
import pixellib
from pixellib.semantic import semantic_segmentation
segment_image = semantic_segmentation
segment_image.load_pascalvoc_model(“deeplabv3_xception_tf_dim_ordering_tf_kernels.h5”)
segment_image.segmentAsPascalvoc(“sample1.jpg”, output_image_name = “image_new.jpg”)
可以看到,在执行代码后,保存的图像中,所有对象都被分割了。
也可以对代码稍作修改,获取一张带有目标对象分割重叠(segmentation overlay)的图像。
segment_image.segmentAsPascalvoc(“sample1.jpg”, output_image_name = “image_new.jpg”, overlay = True)
添加了一个额外的参数,并设置为True,就生成了带有分隔叠加的图像。
可以通过修改下面的代码,来检查执行分割所需的推理时间。
import pixellib
from pixellib.semantic import semantic_segmentation
import time
segment_image = semantic_segmentation
segment_image.load_pascalvoc_model(“pascal.h5”)
start = time.time
segment_image.segmentAsPascalvoc(“sample1.jpg”, output_image_name= “image_new.jpg”)
end = time.time
print(f”Inference Time: {end-start:.2f}seconds”)
输出如下:
Inference Time: 8.19seconds
可以看到,在图像上执行语义分割,只用了8.19秒。
这个xception模型是用pascalvoc数据集训练的,有20个常用对象类别。
对象及其相应的color map如下所示:
PixelLib实现实例分割
虽然语义分割的结果看起来还不错,但在图像分割的某些特定任务上,可能就不太理想。
在语义分割中,相同类别的对象被赋予相同的colormap,因此语义分割可能无法提供特别充分的图像信息。
于是,便诞生了实例分割——同一类别的对象被赋予不同的colormap。
PixelLib在执行实例分割时,基于的框架是Mask RCNN,代码如下:
import pixellib
from pixellib.instance import instance_segmentation
segment_image = instance_segmentation
segment_image.load_model(“mask_rcnn_coco.h5”)
segment_image.segmentImage(“path_to_image”, output_image_name = “output_image_path”)
同样,我们先来拆解一下每行代码。
import pixellib
from pixellib.instance import instance_segmentation
segment_image = instance_segmentation
导入了用于执行实例分割的类,创建了该类的一个实例。
segment_image.load_model(“mask_rcnn_coco.h5”)
这是加载 Mask RCNN 模型来执行实例分割的代码(Mask RCNN模型可以从文末传送门链接处下载)。
segment_image.segmentImage(“path_to_image”, output_image_name = “output_image_path”)
这是对图像进行实例分割的代码,它需要两个参数:
path_to_image:模型所要预测图像的路径。
output_image_name:保存分割结果的路径,将被保存在当前的工作目录中。
上图,实战第二弹!
图像文件命名为:sample2.jpg,如下图所示。
执行代码如下:
import pixellib
from pixellib.instance import instance_segmentation
segment_image = instance_segmentation
segment_image.load_model(“mask_rcnn_coco.h5”)
segment_image.segmentImage(“sample2.jpg”, output_image_name = “image_new.jpg”)
上图便是保存到目录的图片,现在可以看到语义分割和实例分割之间的明显区别——在实例分割中,同一类别的所有对象,都被赋予了不同的colormap。
若是想用边界框(bounding box)来实现分割,可以对代码稍作修改:
segment_image.segmentImage(“sample2.jpg”, output_image_name = “image_new.jpg”, show_bboxes = True)
这样,就可以得到一个包含分割蒙版和边界框的保存图像。
同样的,也可以通过代码查询实例分割的推理时间:
import pixellib
from pixellib.instance import instance_segmentation
import time
segment_image = instance_segmentation
segment_image.load_model(“mask_rcnn_coco.h5”)
start = time.time
segment_image.segmentImage(“former.jpg”, output_image_name= “image_new.jpg”)
end = time.time
print(f”Inference Time: {end-start:.2f}seconds”)
输出结果如下:
Inference Time: 12.55 seconds
可以看到,在图像上执行实例分割,需要12.55秒的时间。
传送门
PixelLib项目地址:https://github.com/ayoolaolafenwa/PixelLib
相关推荐
- 磁力种子(磁力种子搜索器怎么用)
-
BT的种子是指在BitTorrent文件分享协议中的一个文件或者目录,其中包含有一个或多个文件的元数据,例如文件名、大小、哈希值等信息。一个种子文件可以看做是一个索引,用来描述一个或多个文件的组成和布...
- windows图片查看器无法显示此图片
-
是因为没有正确配置Windows颜色系统默认设备文件造成的,解决该问题的具体步骤是:打开控制面板,查看方式选择“大图标”,单击打开“颜色管理”对话框,单击选中“高级”选项卡,将Windows颜色系统设...
- 深度技术的win7系统怎么样(深度技术win7系统怎么安装教程)
-
所谓的纯净的win7系统应该说的就是原版的win7系统,相对于Ghost版的系统来说,原版的win7系统是微软发布的未经过第三方修改过的纯净版系统,安装好后,它所有的功能和软件都是微软官方的,不会添加...
- 电脑怎么安全模式开机(电脑怎么安全模式开机启动)
-
电脑开机后进入安全模式的步骤如下:重启电脑:在开机时,狂按F8键,即可进入启动菜单选择界面。选择安全模式:在启动菜单选择界面中,可以看到三个版本的安全模式可以选择,方向键上下调整,然后按下回车键即可。...
- win10企业版长期服务版(win10企业版 长期服务版)
-
Windows10企业版和企业长期服务版是微软为企业用户提供的两个版本,二者主要区别如下:1.版本周期不同。企业版(Enterprise)每年更新两次,每个版本的支持期限仅为18个月,而企业长期服...
- mercury管理页面网址(mercury设置网址是什么)
-
要进入mercury路由器的管理页面,首先需要将电脑与路由器连接,确保网络连接正常。接着在浏览器中输入路由器的默认IP地址(通常为192.168.1.1),按下回车键。输入用户名和密码(默认用户名和密...
- qq手机版官方(qq手机版官方免费下载安装)
-
z.qq.com可以通过以下方式登录手机QQ空间:1、使用手机登录手机腾讯网3g.qq.com,点击“空间”,根据提示QQ号码和QQ密码就可以登录;2、通过手机直接输入手机QQ空间网址z.qq.co...
- w7旗舰版系统怎么恢复出厂设置啊
-
方法一:1、左键单击任务栏开始按钮2、在启动项菜单右侧找到“控制面板”并左键单击3、在打开的界面中找到“区域和语言”选项并左键单击4、在弹出窗口中选择“键盘和语言”,在“选择显示语言”下...
- ubuntu下载安装(Ubuntu下载安装包)
-
要在Ubuntu上从官方网站下载和安装Evolution,您可以按照以下步骤进行操作:1.打开您的网页浏览器,访问Ubuntu的官方网站:https://ubuntu.com。2.点击页面顶部的“...
- 联想显示器售后服务电话(lenovo人工客服24小时)
-
联想显示器保修期限在1~2年之内,一,联想“三包”服务承诺联想按国家有关部门颁布的《微型计算机商品修理更换退货责任规定》(以下称“三包”规定)中的内容和范围,向用户提供“三包”服务。联想承担法定“...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
