百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

基于Python查找图像中最常见的颜色

off999 2024-12-03 00:15 21 浏览 0 评论

如果我们能够得知道一幅图像中最多的颜色是什么的话,可以帮助我们解决很多实际问题。例如在农业领域中想确定水果的成熟度,我们可以通过检查水果的颜色是否落在特定范围内,来判断它们是否已经成熟。

接下来我们将使用Python和一些常用库(例如Numpy,Matplotlib和OpenCV)来解决这个问题。

01. 准备工作

第一步:添加程序包

我们将在此处加载基本软件包。另外,由于我们要使用Jupyter进行编程,因此小伙伴们不要忘记添加%matplotlib inline命令。

第二步:加载并显示示例图像


我们将并排显示两个图像,因此我们需要做一个辅助函数。接下来我们将加载一些在本教程中将要使用的示例图像,并使用上述功能对其进行显示。


02. 常用方法

方法一:平均值

第一种方法是最简单(但无效)的方法-只需找到平均像素值即可。使用numpy的average功能,我们可以轻松获得行和宽度上的平均像素值-axis=(0,1)

img_temp = img.copy()
img_temp[:,:,0], img_temp[:,:,1], img_temp[:,:,2] = np.average(img, axis=(0,1))

img_temp_2 = img_2.copy()
img_temp_2[:,:,0], img_temp_2[:,:,1], img_temp_2[:,:,2] = np.average(img_2, axis=(0,1))

show_img_compar(img, img_temp)
show_img_compar(img_2, img_temp_2)

从上面图像中可以看出,平均方法可能会产生错误结果,它给出的最常见的颜色可能并不是我们想要的颜色,这是因为平均值考虑了所有像素值。当我们具有高对比度的图像(一张图像中同时包含“浅色”和“深色”)时这个问题会很严重。在第二张图片中,这一点更加清晰。它为我们提供了一种新的颜色,该颜色在图像中根本看不到。

方法二:最高像素频率

第二种方法将比第一种更加准确。我们的工作就是计算每个像素值出现的次数。numpy给我们提供了一个函数可以完成这个任务。但是首先,我们必须调整图像数据结构的形状,以仅提供3个值的列表(每个R,G和B通道强度一个)。

我们可以使用numpy的reshape函数来获取像素值列表。

现在我们已经有了正确结构的数据,可以开始计算像素值的频率了,使用numpy中的unique函数即可。

img_temp = img.copy()
unique, counts = np.unique(img_temp.reshape(-1, 3), axis=0, return_counts=True)
img_temp[:,:,0], img_temp[:,:,1], img_temp[:,:,2] = unique[np.argmax(counts)]

img_temp_2 = img_2.copy()
unique, counts = np.unique(img_temp_2.reshape(-1, 3), axis=0, return_counts=True)
img_temp_2[:,:,0], img_temp_2[:,:,1], img_temp_2[:,:,2] = unique[np.argmax(counts)]

show_img_compar(img, img_temp)
show_img_compar(img_2, img_temp_2)

比第一个更有意义吗?最常见的颜色是黑色区域。但是如果我们不仅采用一种最常见的颜色,还要采用更多的颜色怎么办?使用相同的概念,我们可以采用N种最常见的颜色。换句话说,我们要采用最常见的不同颜色群集该怎么办。

方法三:使用K均值聚类

我们可以使用著名的K均值聚类将颜色组聚类在一起。

def palette(clusters):
    width=300
    palette = np.zeros((50, width, 3), np.uint8)
    steps = width/clusters.cluster_centers_.shape[0]
    for idx, centers in enumerate(clusters.cluster_centers_): 
        palette[:, int(idx*steps):(int((idx+1)*steps)), :] = centers
    return palette


clt_1 = clt.fit(img.reshape(-1, 3))
show_img_compar(img, palette(clt_1))

clt_2 = clt.fit(img_2.reshape(-1, 3))
show_img_compar(img_2, palette(clt_2))

容易吧!现在,我们需要的是一个显示上面的颜色簇并立即显示的功能。我们只需要创建一个高度为50,宽度为300像素的图像来显示颜色组/调色板。对于每个颜色簇,我们将其分配给我们的调色板。

是不是很漂亮?就图像中最常见的颜色而言,K均值聚类给出了出色的结果。在第二张图像中,我们可以看到调色板中有太多的棕色阴影。这很可能是因为我们选择了太多的群集。让我们看看是否可以通过选择较小的k值来对其进行修复。

def palette(clusters):
    width=300
    palette = np.zeros((50, width, 3), np.uint8)
    steps = width/clusters.cluster_centers_.shape[0]
    for idx, centers in enumerate(clusters.cluster_centers_): 
        palette[:, int(idx*steps):(int((idx+1)*steps)), :] = centers
    return palette

clt_3 = KMeans(n_clusters=3)
clt_3.fit(img_2.reshape(-1, 3))
show_img_compar(img_2, palette(clt_3))

由于我们使用K均值聚类,因此我们仍然必须自己确定适当数量的聚类。三个集群似乎是一个不错的选择。但是我们仍然可以改善这些结果,并且仍然可以解决集群问题。我们还如何显示群集在整个图像中所占的比例?

方法四:K均值+比例显示

我们需要做的就是修改我们的palette功能。代替使用固定步骤,我们将每个群集的宽度更改为与该群集中的像素数成比例。

from collections import Counter

def palette_perc(k_cluster):
    width = 300
    palette = np.zeros((50, width, 3), np.uint8)

    n_pixels = len(k_cluster.labels_)
    counter = Counter(k_cluster.labels_) # count how many pixels per cluster
    perc = {}
    for i in counter:
        perc[i] = np.round(counter[i]/n_pixels, 2)
    perc = dict(sorted(perc.items()))

    #for logging purposes
    print(perc)
    print(k_cluster.cluster_centers_)

    step = 0

    for idx, centers in enumerate(k_cluster.cluster_centers_): 
        palette[:, step:int(step + perc[idx]*width+1), :] = centers
        step += int(perc[idx]*width+1)

    return palette

clt_1 = clt.fit(img.reshape(-1, 3))
show_img_compar(img, palette_perc(clt_1))

clt_2 = clt.fit(img_2.reshape(-1, 3))
show_img_compar(img_2, palette_perc(clt_2))

它不仅为我们提供了图像中最常见的颜色。这也给了我们每个像素出现的比例。


03. 结论


我们介绍了几种使用Python以及最知名的库来获取图像中最常见颜色的技术。另外,我们还看到了这些技术的优缺点。到目前为止,使用k> 1的K均值找到最常见的颜色是找到图像中最频繁的颜色的最佳解决方案之一。

相关推荐

安卓手机玩pc游戏模拟器(安卓手机运行pc模拟器)
  • 安卓手机玩pc游戏模拟器(安卓手机运行pc模拟器)
  • 安卓手机玩pc游戏模拟器(安卓手机运行pc模拟器)
  • 安卓手机玩pc游戏模拟器(安卓手机运行pc模拟器)
  • 安卓手机玩pc游戏模拟器(安卓手机运行pc模拟器)
物理内存占用过高怎么解决(物理内存占用过高怎么解决win7)

你要搞清楚你电脑是为什么100%,一般来说三个方面原因既硬件因素,也有软件因素,还有操作习惯因素。一硬件如电脑购置较早,随便软件发展给内存占用越来越高,增加物理内存如果主板有多余内存插槽,可通...

word打不开应用程序无法正常启动

原因:软件冲突手机上安装的软件过多,因为各自优化的程度不同,很容易出现冲突导致无法启动此应用程序请尝试,特别是同类型的软件安装过多,就更容易出现这种现象。处理方法:定期检查自己的手机,不用的应用可以及...

电脑键盘有几个键失灵(电脑键盘有几个键失灵了怎么办笔记本)

如果您的电脑键盘有多个键失灵了,可能是由于灰尘或污垢积累、键盘本身损坏等原因引起的。以下是一些您可以尝试的修复方法:1.清洁键盘:使用清洁喷雾剂或压缩空气吹掉键盘上的灰尘和污垢。也可以用拆开键帽的方...

新电脑无法打开网络的解决方法

win11系统进不去:  1.首先我们可以重启电脑,然后在开机的时候按F8进入到系统修复页面,选择“疑难解答”。  2.我们在疑难解答页面中,点击高级选项。  3.在页面中,我们找到卸载更新并点击它,...

电脑连接投影仪快捷键(笔记本电脑如何连接投影仪)

电脑如何设置于投影的仪连接的电脑快捷键电脑连接投影仪的快捷键: 1、可以通过使用“FN+F4”或“FN+F8”组合键来切换投影仪画面。 2、如果使用的是WIN7及以上系统,可以按“WIN+P”组合键,...

手机远程桌面连接电脑(手机远程桌面连接电脑app)

想要使用手机远程桌面连接电脑,需要使用一款支持远程桌面协议的应用,比如MicrosoftRemoteDesktop或TeamViewer等。首先,需要在电脑上安装相应的远程桌面服务,并开启远程桌面...

itunes备份文件(itunes备份文件把c盘爆满了)
  • itunes备份文件(itunes备份文件把c盘爆满了)
  • itunes备份文件(itunes备份文件把c盘爆满了)
  • itunes备份文件(itunes备份文件把c盘爆满了)
  • itunes备份文件(itunes备份文件把c盘爆满了)
ghost系统之家win10(windows ghost)

Ghost备份系统Win10可以通过使用Ghost软件来完成。首先,需要下载和安装Ghost软件。然后,将系统文件和数据备份到外部硬盘或其他存储设备中。接下来,打开Ghost软件,选择备份选项,并按照...

免费cad制图软件(电脑版cad免费怎么下载)

迅捷cad编辑器永久免费版全面支持图纸的编辑功能,软件体积小巧功能强大,他支持几乎所有主流的图片格式,让用户不会出现无法打开图纸的困扰,也不会让用户收到领域的困扰,包括电气、机械、建筑等等领域的cad...

笔记本电脑没声音是什么原因

笔记本电脑没有声音的原因是:1.声音是否被调到最小了。2.音频是否被禁用了。3.声卡驱动是不是有问题。4.如果电脑既没有声音也没有小喇叭的图标,则表示电脑的音频设备未启用。笔记本电脑没有声音的原因是:...

melogin路由器设置登录入口(192.168.1.1直接进入)

melogincn路由器的设置步骤如下第一、路由器线路连接1、请把你的.水星双频路由器上的WAN接口,用网线连接到猫的网口。如果你家宽带没有用到猫,就把入户的宽带网线,插在路由器的WAN口。2、把你的...

如何优化电脑性能
如何优化电脑性能

可以通过以下几个步骤来提高电脑运行速度和游戏流畅度:1.清理垃圾文件和无用程序,可以使用系统自带的清理工具或第三方软件;2.关闭开机自启动项,只保留必要的程序开机启动;3.升级硬件,比如增加内存、更换硬盘等;4.优化系统设置,如关闭不必要的...

2026-01-02 06:51 off999

ie8以上版本浏览器(ie8及以上版本浏览器)

浏览器IE8版本以上的意思就是当浏览的网页不支持低版本的IE浏览器,就会提示需要版本较高的IE8以上的版本才可以打开浏览网页。IE浏览器是美国微软公司推出的一款网页浏览器,原名MicrosoftIn...

适合电脑的应用商店(电脑最好的应用商店)

1.MicrosoftToDo推荐理由:微软出品,必属精品2.Microsoft便笺推荐理由:又是一款微软官方出品的良心免费应用,相比MicrosoftToDo,Microsoft便笺更加...

取消回复欢迎 发表评论: