百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

独家 | 使用TensorFlow 2创建自定义损失函数

off999 2024-09-14 07:11 37 浏览 0 评论

本文带你学习使用Python中的wrapper函数和OOP来编写自定义损失函数。


图1:梯度下降算法

神经网络利用训练数据,将一组输入映射成一组输出,它通过使用某种形式的优化算法,如梯度下降、随机梯度下降、AdaGrad、AdaDelta等等来实现,其中最新的算法包括Adam、Nadam或RMSProp。梯度下降中的“梯度”是指误差梯度。每次迭代之后,网络将其预测输出与实际输出进行比较,然后计算出“误差”。

通常,对于神经网络,寻求的是将误差最小化。将误差最小化的目标函数通常称之为成本函数或损失函数,由“损失函数”计算出的值称为“损失”。在各种问题中使用的典型损失函数有:


均方误差;

均方对数误差;

二元交叉熵;

分类交叉熵;

稀疏分类交叉熵。

Tensorflow已经包含了上述损失函数,直接调用它们即可,如下所示:

1. 将损失函数当作字符串进行调用

model.compile (loss = ‘binary_crossentropy’,optimizer = ‘adam’, metrics = [‘accuracy’])

2. 将损失函数当作对象进行调用

from tensorflow.keras.losses importmean_squared_errormodel.compile(loss = mean_squared_error,optimizer=’sgd’)

将损失函数当作对象进行调用的优点是可以在损失函数中传递阈值等参数。

from tensorflow.keras.losses import mean_squared_errormodel.compile (loss=mean_squared_error(param=value),optimizer = ‘sgd’)

利用现有函数创建自定义损失函数:

利用现有函数创建损失函数,首先需要定义损失函数,它将接受两个参数,y_true(真实标签/输出)和y_pred(预测标签/输出)。

def loss_function(y_true, y_pred):***some calculation***return loss

创建均方误差损失函数 (RMSE):

定义损失函数名称-my_rmse。目的是返回目标(y_true)与预测(y_pred)之间的均方误差。

RMSE的公式为:

误差:真实标签与预测标签之间的差异。

sqr_error:误差的平方。

mean_sqr_error:误差平方的均值。

sqrt_mean_sqr_error:误差平方均值的平方根(均方根误差)。

创建Huber损失函数:

图2:Huber损失函数(绿色)和平方误差损失函数(蓝色)(来源:Qwertyus— Own work,CCBY-SA4.0,https://commons.wikimedia.org/w/index.php?curid=34836380)

Huber损失函数的计算公式:

在此处,δ是阈值,a是误差(将计算出a,即实际标签和预测标签之间的差异)。

当|a|≤δ时,loss = 1/2*(a)2

当 |a|>δ时,loss = δ(|a|—(1/2)*δ)

源代码:

详细说明:

首先,定义一个函数—— my huber loss,它需要两个参数:y_true和y_pred,

设置阈值threshold = 1。

计算误差error a = y_true-y_pred。接下来,检查误差的绝对值是否小于或等于阈值,is_small_error返回一个布尔值(真或假)。

当|a|≤δ时,loss= 1/2*(a)2,计算small_error_loss, 误差的平方除以2。否则,当|a| >δ时,则损失等于δ(|a|-(1/2)*δ),用big_error_loss来计算这个值。

最后,在返回语句中,首先检查is_small_error是真还是假,如果它为真,函数返回small_error_loss,否则返回big_error_loss,使用tf.where来实现。

可以使用下述代码来编译模型:

在上述代码中,将阈值设为1。

如果需要调整超参数(阈值),并在编译过程中加入一个新的阈值的话,必须使用wrapper函数进行封装,也就是说,将损失函数封装成另一个外部函数。在这里需要用到封装函数(wrapper function),因为损失函数在默认情况下只能接受y_true和y_pred值,而且不能向原始损失函数添加任何其他参数。


使用封装后的Huber损失函数

封装函数的源代码:

此时,阈值不是硬编码,可以在模型编译过程中传递该阈值。

使用类实现Huber损失函数(OOP)

其中,MyHuberLoss是类名称,随后从tensorflow.keras.losses继承父类“Loss”, MyHuberLoss继承了Loss类,之后可以将MyHuberLoss当作损失函数来使用。

__init__ 初始化该类中的对象。执行类实例化对象时调用函数,init函数返回阈值,调用函数得到y_true和y_pred参数,将阈值声明为一个类变量,可以给它赋一个初始值。

在__init__函数中,将阈值设置为self.threshold。在调用函数中,self.threshold引用所有的阈值类变量。在model.compile中使用这个损失函数:

创建对比性损失(用于Siamese网络):

Siamese网络可以用来比较两幅图像是否相似,Siamese网络使用的损失函数为对比性损失。

在上文的公式中,Y_true是关于图像相似性细节的张量,如果图像相似,则为1,如果图像不相似,则为0。

D是图像对之间的欧氏距离的张量。边际为一个常量,用它来设置将图像区别为相似或不同的最小距离。如果为Y_true=1,则方程的第一部分为D2,第二部分为0,所以,当Y_true接近1时,D2的权重则更重。

如果Y_true=0,则方程的第一部分变为0,第二部分会产生一些结果,这给了最大项更多的权重,给了D平方项更少的权重,此时,最大项在损失计算中占了优势。

使用封装器函数实现对比损失函数:

结论

在Tensorflow中没有的损失函数都可以利用函数、包装函数或类似的类来创建。


原文标题:

Creating custom Loss functionsusing TensorFlow 2

原文链接:

https://towardsdatascience.com/creating-custom-loss-functions-using-tensorflow-2-96c123d5ce6c

编辑:黄继彦

校对:林亦霖

相关推荐

阿里云国际站ECS:阿里云ECS如何提高网站的访问速度?

TG:@yunlaoda360引言:速度即体验,速度即业务在当今数字化的世界中,网站的访问速度已成为决定用户体验、用户留存乃至业务转化率的关键因素。页面加载每延迟一秒,都可能导致用户流失和收入损失。对...

高流量大并发Linux TCP性能调优_linux 高并发网络编程

其实主要是手里面的跑openvpn服务器。因为并没有明文禁p2p(哎……想想那么多流量好像不跑点p2p也跑不完),所以造成有的时候如果有比较多人跑BT的话,会造成VPN速度急剧下降。本文所面对的情况为...

性能测试100集(12)性能指标资源使用率

在性能测试中,资源使用率是评估系统硬件效率的关键指标,主要包括以下四类:#性能测试##性能压测策略##软件测试#1.CPU使用率定义:CPU处理任务的时间占比,计算公式为1-空闲时间/总...

Linux 服务器常见的性能调优_linux高性能服务端编程

一、Linux服务器性能调优第一步——先搞懂“看什么”很多人刚接触Linux性能调优时,总想着直接改配置,其实第一步该是“看清楚问题”。就像医生看病要先听诊,调优前得先知道服务器“哪里...

Nginx性能优化实战:手把手教你提升10倍性能!

关注△mikechen△,十余年BAT架构经验倾囊相授!Nginx是大型架构而核心,下面我重点详解Nginx性能@mikechen文章来源:mikechen.cc1.worker_processe...

高并发场景下,Spring Cloud Gateway如何抗住百万QPS?

关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。高并发场景下网关作为流量的入口非常重要,下面我重点详解SpringCloudGateway如何抗住百万性能@m...

Kubernetes 高并发处理实战(可落地案例 + 源码)

目标场景:对外提供HTTPAPI的微服务在短时间内收到大量请求(例如每秒数千至数万RPS),要求系统可弹性扩容、限流降级、缓存减压、稳定运行并能自动恢复。总体思路(多层防护):边缘层:云LB...

高并发场景下,Nginx如何扛住千万级请求?

Nginx是大型架构的必备中间件,下面我重点详解Nginx如何实现高并发@mikechen文章来源:mikechen.cc事件驱动模型Nginx采用事件驱动模型,这是Nginx高并发性能的基石。传统...

Spring Boot+Vue全栈开发实战,中文版高清PDF资源

SpringBoot+Vue全栈开发实战,中文高清PDF资源,需要的可以私我:)SpringBoot致力于简化开发配置并为企业级开发提供一系列非业务性功能,而Vue则采用数据驱动视图的方式将程序...

Docker-基础操作_docker基础实战教程二

一、镜像1、从仓库获取镜像搜索镜像:dockersearchimage_name搜索结果过滤:是否官方:dockersearch--filter="is-offical=true...

你有空吗?跟我一起搭个服务器好不好?

来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。昨天闲的没事的时候,随手翻了翻写过的文章,发现一个很严重的问题。就是大多数时间我都在滔滔不绝的讲理论,却很少有涉及动手...

部署你自己的 SaaS_saas如何部署

部署你自己的VPNOpenVPN——功能齐全的开源VPN解决方案。(DigitalOcean教程)dockovpn.io—无状态OpenVPNdockerized服务器,不需要持久存储。...

Docker Compose_dockercompose安装

DockerCompose概述DockerCompose是一个用来定义和管理多容器应用的工具,通过一个docker-compose.yml文件,用YAML格式描述服务、网络、卷等内容,...

京东T7架构师推出的电子版SpringBoot,从构建小系统到架构大系统

前言:Java的各种开发框架发展了很多年,影响了一代又一代的程序员,现在无论是程序员,还是架构师,使用这些开发框架都面临着两方面的挑战。一方面是要快速开发出系统,这就要求使用的开发框架尽量简单,无论...

Kubernetes (k8s) 入门学习指南_k8s kubeproxy

Kubernetes(k8s)入门学习指南一、什么是Kubernetes?为什么需要它?Kubernetes(k8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序。它...

取消回复欢迎 发表评论: