百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python如何读写json数据(python可以读取json)

off999 2025-07-21 17:01 40 浏览 0 评论

先介绍一下什么是json,还是先看一下百度百科怎么说。

JSON(JavaScript Object Notation,JavaScript对象表示法)是基于ECMAScript的一个子集设计的,是一种开放标准的文件格式和数据交换格式,它易于人阅读和编写,同时也易于机器解析和生成。JSON独立于语言设计,很多编程语言都支持JSON格式的数据交换。

按照上面百科词条的说法,json和用什么语言没有什么关系,他就是一种数据交换格式。

JSON 的数据结构

JSON 由两种数据结构组成:对象数组

对象(object)是由键值对组成的无序集合,键是字符串,值可以是任何类型,包括对象和数组。对象由一对花括号{ }包围,键和值之间用冒号:分隔。键值对之间用逗号,分隔。

数组(array)是值(value)的有序集合,每个值可以是任何类型,包括对象和数组。数组由一对方括号[ ]包裹,值之间用逗号,分隔。

值(value)可以是花括号{ }括起来的字符串(String)、数值(Number)、布尔值(true/false)、 null、对象(Object)或者数组(Array),这些结构可以嵌套。

# 对象结构
{
    "name": "John",
    "age": 30,
    "isStudent": false
}
# 数组结构
[ "apple",  "banana",  "orange"]

看似和python中的字典差不多,但是你要知道他们是不一样的,数据类型都不同。

JSON 的优点和缺点

优点

  1. 与 JavaScript 完美兼容:JSON 格式源自 JavaScript,因此它与 JavaScript 非常兼容,并且易于在 JavaScript 应用程序中使用。
  2. 轻量级:JSON 格式非常轻量级,因此它非常适合在网络中传输大量数据。相比于 XML,它的数据量更小,传输速度更快。
  3. 跨平台和语言无关性:JSON 格式是一种跨语言的格式,它可以被许多不同语言的程序支持,易于解析和生成,几乎所有编程语言都支持 JSON。
  4. 易于阅读和操作:JSON 格式非常易于阅读和编写,因为它具有简单的语法和结构,格式清晰,具有良好的可读性。

缺点

  1. 不支持注释: JSON 格式不支持注释,这可能使得编写和维护复杂数据时变得有些困难。
  2. 不适合存储大量数据 JSON 格式无法直接表示二进制数据,这意味着它无法用于存储和传输图像、视频等二进制数据。并且,相比较于二进制,JSON的文本格式,在储存大量数据的时候会在占用非常多的储存空间。
  3. 不支持命名空间: JSON 不支持命名空间,这可能会导致不同的应用程序之间发生命名冲突。
  4. 不支持DTD: JSON 不支持 DTD,这使得在验证 JSON 数据格式时不太方便。

JSON 和 XML 的区别

其实现在数据交换,大家都是用JSON了,逐渐成为主流,xml用的越来越少了,不过还是有它自己独特的特性,在程序中没有好与坏,只有适不适合。

JSON 和 XML都是常用的数据交换格式。它们之间有什么区别呢?

  1. 简洁性与可读性:
    JSON 比 XML 更加简洁和易读。相比于 XML 的繁琐闭合标签,JSON 采用更为紧凑的表示形式,使得数据结构更清晰明了。
  2. 解析速度与带宽占用:
    JSON 的解析速度通常比 XML 更快,因为它的结构简单,不需要解析复杂的标签。总体内容变少了,导致JSON 数据通常占用的带宽更少,有助于提高传输效率。
  3. 数据复杂性:
    XML 比 JSON 更适合描述复杂的数据类型和嵌套结构。XML 支持命名空间和多种数据格式,这使得它在处理复杂数据和配置文件时具有优势。
  4. 注释支持:
    JSON 不支持注释,这意味着在数据中不能嵌入注释说明。而 XML 则支持注释,可以在数据文档中添加解释说明,便于维护和理解。

Python中如何读写JSON数据

只要你充分认识了JSON格式,其实也可以使用字符串拼接的形式构建一些简单的JSON字符串,但是局限性特别强,并且容易出错。

Python标准库中的json模块,提供了很多读写JSON数据的方法,下面我们来认识一下。

1、JSON模块的dump() 或 dumps() 函数将 Python 对象转换为 JSON 对象

dumps是将字典类型的数据转换为字符串,参数如下:

  • dictionary – 需要转换为 JSON 对象的字典。
  • indent – 定义缩进。

dump是将json数据写进文件,参数如下:

  • dictionary – 需要转换为 JSON 对象的字典。
  • file pointer – 在写入或追加模式下打开的文件。

当然你也可以通过文件的 write 方法写入json字符串

import json
data = {'name': 'zhangsan'}
# 返回字符串
json_str = json.dumps(data)
print(json_str)
# 写入文件
with open('data.json', 'w') as f:
    json.dump(data, f)

2、JSON模块的load() 或 loads() 函数将 JSON 字符串转换为 Python 对象

loads() 是将 JSON 对象的字符串转为Python字典,load() 函数可将 JSON 内容从 JSON 文件加载到字典中。

import json
dictionary = '{"name": "zhangsan"}'
json_obj = json.loads(dictionary)
print(json_obj) #{'name': 'zhangsan'}

with open('data.json', 'r') as f:
    json_obj = json.load(f)
print(json_obj) #{'name': 'zhangsan'}
print(type(json_obj)) #<class 'dict'>

Python中JSON的一些高级处理

上面介绍了最常用的功能,就那四个方法,下面认识一下json模块都有哪些高级功能。

自定义编码和解码

在一些复杂的场景中,你可能需要对Python对象进行自定义的序列化和反序列化。通过继承json.JSONEncoder和json.JSONDecoder类并重写相应的方法,你可以实现自定义的JSON编码和解码逻辑。

import json
class CustomEncoder(json.JSONEncoder):
    def default(self, obj):
        if isinstance(obj, complex):
            return [obj.real, obj.imag]
        return json.JSONEncoder.default(self, obj)
# 使用自定义编码器
encoded_json = json.dumps(2 + 3j, cls=CustomEncoder)
print(encoded_json)  # 输出: [2.0, 3.0]

class CustomDecoder(json.JSONDecoder):
    def __init__(self):
        json.JSONDecoder.__init__(self, object_hook=self.object_hook)
    def object_hook(self, dct):
        if '__complex__' in dct:
            return complex(dct['__complex__'][0], dct['__complex__'][1])
        return dct
# 使用自定义解码器
decoded_obj = json.loads('{"__complex__": [2.0, 3.0]}', cls=CustomDecoder)
print(decoded_obj)  # 输出: (2+3j)

使用indent参数美化输出

在将Python对象转换为JSON字符串时,可以使用indent参数来指定缩进的空格数,从而使输出的JSON字符串更易读。这对于调试和查看复杂的JSON数据结构非常有帮助。

data = {'name': 'zhangsan'}
json_str = json.dumps(data, indent=4, ensure_ascii=False)
print(json_str)
#{
#    "name": "zhangsan"
#}

格式校验与异常处理

在我们使用json模块的过程中有时候会遇到一些异常情况,比如:数据格式不正确、编码问题、文件路径错误、数据类型不支持等。尤其是数据格式问题,这是经常遇到的,在解析日志文件时遇到一些数据存在多余的逗号或者括号位置出错等等问题。这需要我们特别注意,不要传输不合法的JSON数据。

当然,即使遇到了上述问题,通过恰当的异常处理机制,能够确保程序的健壮性。在编写处理JSON数据的代码时,应该始终记得对相关操作加上try-except块,以便捕获并处理异常。

  • 对于json.loads()和json.load()使用json.JSONDecodeError来捕获格式相关的错误。
  • 对于json.dumps()和json.dump()使用TypeError来捕获不支持类型的错误。
  • 对于编码错误,捕获UnicodeDecodeError或UnicodeEncodeError。
  • 对于文件访问错误,捕获FileNotFoundError。
json_str = "不是有效的JSON字符串"
try:
    # 尝试解析JSON
    data = json.loads(json_str)
except json.JSONDecodeError:
    print("输入的字符串不是有效的JSON格式")
except TypeError:
    print("解析函数需要一个字符串类型的参数")
except ValueError:
    print("输入字符串中包含无法解析的值")

相关推荐

Linux 网络协议栈_linux网络协议栈

前言;更多学习资料(包含视频、技术学习路线图谱、文档等)后台私信《资料》免费领取技术点包含了C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,Z...

揭秘 BPF map 前生今世_bpfdm

1.前言众所周知,map可用于内核BPF程序和用户应用程序之间实现双向的数据交换,为BPF技术中的重要基础数据结构。在BPF程序中可以通过声明structbpf_map_def...

教你简单 提取fmpeg 视频,音频,字幕 方法

ffmpeg提取视频,音频,字幕方法(HowtoExtractVideo,Audio,SubtitlefromOriginalVideo?)1.提取视频(ExtractVi...

Linux内核原理到代码详解《内核视频教程》

Linux内核原理-进程入门进程进程不仅仅是一段可执行程序的代码,通常进程还包括其他资源,比如打开的文件,挂起的信号,内核内部的数据结构,处理器状态,内存地址空间,或多个执行线程,存放全局变量的数据段...

Linux C Socket UDP编程详解及实例分享

1、UDP网络编程主要流程UDP协议的程序设计框架,客户端和服务器之间的差别在于服务器必须使用bind()函数来绑定侦听的本地UDP端口,而客户端则可以不进行绑定,直接发送到服务器地址的某个端口地址。...

libevent源码分析之bufferevent使用详解

libevent的bufferevent在event的基础上自己维护了一个buffer,这样的话,就不需要再自己管理一个buffer了。先看看structbufferevent这个结构体struct...

一次解决Linux内核内存泄漏实战全过程

什么是内存泄漏:程序向系统申请内存,使用完不需要之后,不释放内存还给系统回收,造成申请的内存被浪费.发现系统中内存使用量随着时间的流逝,消耗的越来越多,例如下图所示:接下来的排查思路是:1.监控系统中...

彻底搞清楚内存泄漏的原因,如何避免内存泄漏,如何定位内存泄漏

作为C/C++开发人员,内存泄漏是最容易遇到的问题之一,这是由C/C++语言的特性引起的。C/C++语言与其他语言不同,需要开发者去申请和释放内存,即需要开发者去管理内存,如果内存使用不当,就容易造成...

linux网络编程常见API详解_linux网络编程视频教程

Linux网络编程API函数初步剖析今天我们来分析一下前几篇博文中提到的网络编程中几个核心的API,探究一下当我们调用每个API时,内核中具体做了哪些准备和初始化工作。1、socket(family...

Linux下C++访问web—使用libcurl库调用http接口发送解析json数据

一、背景这两天由于一些原因研究了研究如何在客户端C++代码中调用web服务端接口,需要访问url,并传入json数据,拿到返回值,并解析。 现在的情形是远程服务端的接口参数和返回类型都是json的字符...

平衡感知调节:“系统如人” 视角下的架构设计与业务稳定之道

在今天这个到处都是数字化的时代,系统可不是一堆冷冰冰的代码。它就像一个活生生的“数字人”,没了它,业务根本转不起来。总说“技术要为业务服务”,但实际操作起来问题不少:系统怎么才能快速响应业务需求?...

谈谈分布式文件系统下的本地缓存_什么是分布式文件存储

在分布式文件系统中,为了提高系统的性能,常常会引入不同类型的缓存存储系统(算法优化所带来的的效果可能远远不如缓存带来的优化效果)。在软件中缓存存储系统一般可分为了两类:一、分布式缓存,例如:Memca...

进程间通信之信号量semaphore--linux内核剖析

什么是信号量信号量的使用主要是用来保护共享资源,使得资源在一个时刻只有一个进程(线程)所拥有。信号量的值为正的时候,说明它空闲。所测试的线程可以锁定而使用它。若为0,说明它被占用,测试的线程要进入睡眠...

Qt编写推流程序/支持webrtc265/从此不用再转码/打开新世界的大门

一、前言在推流领域,尤其是监控行业,现在主流设备基本上都是265格式的视频流,想要在网页上直接显示监控流,之前的方案是,要么转成hls,要么魔改支持265格式的flv,要么265转成264,如果要追求...

30 分钟搞定 SpringBoot 视频推拉流!实战避坑指南

30分钟搞定SpringBoot视频推拉流!实战避坑指南在音视频开发领域,SpringBoot凭借其快速开发特性,成为很多开发者实现视频推拉流功能的首选框架。但实际开发中,从环境搭建到流处理优...

取消回复欢迎 发表评论: