百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python之数据输出:你真的会用print函数吗

off999 2024-10-05 19:46 24 浏览 0 评论

引言

在前一篇关于Python文章的结尾,简单提到了关于print()函数的用法。似乎有不少新手、甚至已经用Python好长时间的老手,都对print()函数有一个刻板的印象,觉得print()函数就是用于把需要的内容在显示器上输出显示而已,然后就不再深究了。当然,输出到显示器上进行显示,当然,是print()最核心、最常用的功能,但是,还有些不一样的用法,我们有必要了解一下,以便将这个后续会高频使用的函数,用得更加得心应手。



回到最初print()的定义

在Python的builtins.py中,可以看到print()函数的定义:

def print(*args, sep=' ', end='\n', file=None): # known special case of print
    """
    Prints the values to a stream, or to sys.stdout by default.
    
      sep
        string inserted between values, default a space.
      end
        string appended after the last value, default a newline.
      file
        a file-like object (stream); defaults to the current sys.stdout.
      flush
        whether to forcibly flush the stream.
    """
    pass

说明:在builtin.py中看到的print()函数的第一个参数是self,似乎有点奇怪,这里我暂时隐去了。

print()函数的作用

从print()函数的定义描述中,可以看到,print()函数的真正要实现的作用是将内容输出到一个流中,如果不指定流,则默认情况下,是输出到标准输出流,即sys.stdout,也可以粗略地理解为等价于显示器。
所以,print()更本质的作用是把内容输出到一个叫“流”的东西中,只是很多时候,我们只用了它的默认使用场景而已。

print()函数的参数

第一个参数:*args

函数定义中第一个参数*args,这个参数表示要输出的内容,由于是个可变参数,所以输出的内容可以是多个,虽然我们大部分时候,可能只输出了一个:

# 同时输出多个内容,而且是不同类型的
print(1, 'abc', ['d', 'e', 'f'])

第二个参数:sep

第二个参数sep是一个带默认值的参数,在函数定义中,带有默认值的参数,必须放到函数定义形参列表中的最后(不理解的小伙伴,自己再品一下,如果不这样规定,怎么传参?),由此可知,print()函数从第二个参数开始,都是带默认值的参数,所以,很多时候我们在调用print()函数时,都只传递了第一个参数,只使用了默认场景。
sep参数只有在要输出的内容是多个时,才会发生作用,用于把多个内容分别转换为字符串之后,拼接为一个完整的字符串。默认值为一个空格。

# 同时输出多个内容,而且是不同类型的,使用逗号拼接
print(1, 'abc', ['d', 'e', 'f'], sep=',')

第三个参数:end

第三个参数end,默认值为'\n',拼接在输出内容的最后,默认为'\n',所以,在默认情况下,我们每调用一次,都会自动换行。

# 同时输出多个内容,而且是不同类型的
value = 'hello python'
print(value, end=' ')
print(value, end=' ')
print(value, end=' ')

第四个参数:file

第四个参数file,默认值为None,此时,要输出的内容会被输出到sys.out。当file不为None时,则默认的行为将被覆盖,内容会被输出到file参数指定的文件流中。这也是在前一篇文章中,我们可以直接通过print()函数,直接把测试数据保存到文件中的原因。

# 将数组中的内容解包,传递给print,输出到文件中
values = ['hello', 'Python', 'world']
print(*values, sep=',', file=open('print_out.csv', 'a'))
print(*values, sep=',', file=open('print_out.csv', 'a'))

输出文件print_out.csv中的内容:

hello,Python,world
hello,Python,world

第五个参数:flush

这个参数也有点奇怪,在定义文档的描述中,有体现,但是在函数的参数列表中,却没有给出……
flush参数,用于决定是否将要输出的内容,flush写到流中。
不了解操作系统的IO的小伙伴,可能会有点疑惑,“我本来就是要把内容写到流中啊,你还问我要不要干嘛”。这是因为,很多时候IO操作,都是成本比较高的操作,相比较读写内存来说。所以,很多时候,要写到流中的内容,不会立即写入,而是先写到内存中的输出缓冲区,当缓冲区中内容积累到一定的大小或者达到一定的时间延迟,再真正批量写到流中,从而提高吞吐。
需要注意的是:该参数似乎没有生效。关于该参数的作用,可以在后续中涉及到读写文件的操作中,再行展开描述。

字符串格式化

Python的print()函数,是把所有的内容转换为字符串,然后写入到指定的流中。通过前面函数相关参数的介绍,我们能初步控制内容的简单拼接方式、内容的结束符。
要想实现更加灵活的格式化,就需要涉及到字符串格式化的内容了。Python中提供了,很多种进行字符串格式化的方法,下面就几种比较常用的方法,做一下简单的介绍。
需要说明的是,如同关于Python系列文章之初,所提到的学习编程的宗旨,我们不是为了考试,而是为了实用,够用就足够了,不要强行记忆,不必如孔乙己一样,把“茴”的各种写法,都一一记下来。笔者在日常使用中,其实也更多地使用其中第一种用法,根据个人偏好,自行选择即可。

f-string

Python自3.6开始,支持f-string语法,在一个字符串前面添加f,则后续字符串内容中,{}中的内容会被当做变量标识符进行内容替换:

# 格式化输出学生信息
name = '张三'
age = 18
gender = '女'
# f-string语法
fmt = f"""学生信息:
    姓名:{name}
    年龄:{age}
    性别:{gender}
"""
print(fmt)

输出内容:

学生信息:
    姓名:张三
    年龄:18
    性别:女

format()方法

Python中的字符串本身是一个类,我们定义的每个字符串,都是该类的一个对象,该类提供了format()方法,用于按顺序将字符串中的{}替换为format函数传入的参数:

# 格式化输出学生信息
name = '张三'
age = 18
gender = '女'
fmt = """学生信息:
    姓名:{}
    年龄:{}
    性别:{}
"""
print(fmt.format(name, age, gender))

通过比较f-string和format()方法的使用,可以简单理解f-string是Python为我们提供的一个语法糖,用于简化format()方法的使用,直接将要替换的内容放到{}中,从而降低传参次序颠倒导致的错误格式化问题。

%操作

这种方法,类似于其他编程语言中的printf()函数的使用,说实话,笔者自己实际使用中用的比较少,不太便捷,简单举一个例子:

# 格式化输出学生信息
name = '张三'
age = 18
gender = '女'
fmt = """学生信息:
    姓名:%s
    年龄:%d
    性别:%s
"""
print(fmt % (name, age, gender))

其中,%s、%d等被称为格式控制符,%s表示要输出的为字符串,%d表示要输出的是整数。还有很多种别的输出控制符,控制位数等,感兴趣的、有实际使用场景的可以借助ChatGPT或者其他工具,自行进行研究。
再多说一句,f-string也是可以支持灵活定义输出格式的,比如,按照指定的小数位数进行输出:

# 格式化输出学生信息
name = '张三'
age = 18
gender = '女'
# f-string语法
fmt = f"""学生信息:
    姓名:{name}
    年龄:{age : .2f}
    性别:{gender}
"""
print(fmt)

其中,age字段在f-string中,添加了格式控制:{age : .2f}
输出内容:

学生信息:
    姓名:张三
    年龄: 18.00
    性别:女

关于字符串的格式化就简单介绍这么多,感兴趣的自行研究。

关于"流"

在编程语言中,一般都会有关于流的定义,因为数据的输入输出,一般可以理解为是流动的形式,所以一般被用于标识IO操作,所以也被成为IO流或者输入输出流。
比如,我们要向一个文件中写入数据,可以理解为向一个文件输出流中写数据;再比如,像一个网络接口发送数据,则可以理解为向一个网络输出流中写数据。
在所有流中,最常见的有三种流,这三种流被叫做标准IO流,分别是:

  • 标准输入流
  • 标准输出流
  • 标准错误输出流

在Python中,通过sys内建模块,可以找到这三个标准IO流,分别是:

  • sys.stdin
  • sys.stdout
  • sys.stderr

回顾上面提到的关于Python的更本质的用法,“把内容输出到指定的流中”。如果我们能找到对应的流,是否可以不通过print()函数,自行向流中写入内容呢,当然是可以的。
对应的输出流,一般提供写的方法:write()/writelines();
对应的输入流,一般提供读的方法:read()/readline()/readlines()
下面,我们试着直接操作标准IO流,来进行数据的输入输出:

import sys

fmt = "Hello Python world\n"
sys.stdout.write(fmt)
sys.stderr.writelines(fmt)
a = sys.stdin.readline()
print(a)

在笔者的Mac终端中,sys.stderr的输出,会被处理为红色显示。
执行到sys.stdin.readline()那一行时,可以在终端中输入内容,这些内容会被保存到变量a中。
代码运行的结果:


相关推荐

python爬取电子课本,送给居家上课的孩子们

在这个全民抗疫的日子,中小学生们也开启了居家上网课的生活。很多没借到书的孩子,不得不在网上看电子课本,有的电子课本是老师发的网络链接,每次打开网页去看,既费流量,也不方便。今天我们就利用python的...

高效办公!Python 批量生成PDF文档是如何做到的?

前言:日常办公中,经常会使用PDF文档,难免需要对PDF文档进行编辑,有时候PDF文档中的大部分内容都是一样的,只是发送对象不同。这种模板套用的场景下,使用Python进行自动化就尤为方便,用最短的时...

如何用Python将PDF完整的转成Word?

PDF文件完整的转为Word,转换后格式排版不会乱,图片等信息完整显示不丢失。这个很简单,有很多方法都可以实现。方法一:Python利用Python将PDF文件转换为Word,有许多库可以帮你实现这一...

使用Python拆分、合并PDF(python合并多个pdf)

知识点使用Python操作PDF!主要内容有:1、PDF拆分;2、PDF合并。在工作中,难免会和PDF打交道,所以掌握一点处理PDF的技能非常有必要,本文将介绍几个常用的功能。PDF拆分很多时候,获取...

10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人

开篇痛点每个被PDF折磨过的职场人都懂——领导发来的扫描件要修改,手动抄到Word需要2小时;网上下载的报告想复制数据,却变成乱码…今天我们用Python+DeepSeek,10分钟打造一个智能转换工...

《Python知识手册》,高清全彩pdf版开放下载

Python编程还不懂?今天我要把我参与编写的这套《Python知识手册》免费分享出来,看完文末有惊喜哦。...

利用python进行数据分析,PDF文档给你答案

本书详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。虽然本书的标题是“数据分析”,重点却是Python编程、库,以及用于数据分析的工具。兄弟,毫无套路!PDF版无偿获...

OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!

简介在日常工作中,我们经常会接触到各种PDF文件,其中不少是扫描版文档。处理这些扫描PDF时,尽管内容看似完整,但往往无法直接复制或搜索其中的文本。尤其是在需要对大量文档进行文本分析、存档或后期编辑时...

高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!

在工作中,我们常常遇到各种各样的PDF文件,其中不乏一些扫描版的文档。而在处理扫描的PDF文件时,虽然文件内容看似完整,但你却无法复制、搜索其中的文本。特别是对大量文档需要进行文本分析、存档、或者...

三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!

面对100页以上的大型PDF文件时,阅读和搜索往往效率低下。传统关系型数据库在处理此类数据时容易遇到性能瓶颈,而Elasticsearch凭借其强大的全文检索和分布式架构,成为理想解决方案。通过...

用 Python 去除 PDF 水印,你学会吗?

今天介绍下用Python去除PDF(图片)的水印。思路很简单,代码也很简洁。首先来考虑Python如何去除图片的水印,然后再将思路复用到PDF上面。这张图片是前几天整理《数据结构和算法...

扫描PDF档案效率提升300%!OCRmyPDF:告别无法搜索的PDF噩梦,这款26K Star的开源神器让文本识别轻松上手!

要在PDF中搜索某个关键词,结果发现啥也找不到?这种情况大多数人都遇到过吧,特别是处理扫描文档或图片PDF时。就在前几天,我还在为这事抓狂呢!后来无意中发现了OCRmyPDF这个宝藏项目...简直就...

Python自动化办公之PDF版本发票识别并提取关键信息教程(上篇)

大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公发票数据处理的问题,一起来看看吧。二、实现过程这个问题在实际工作中还是非常常见的,实用性和通用性都比...

PDF解锁神器:用PyMuPDF与pdfplumber告别手动提取

前言大家好,今天咱们来聊聊如何用Python中的PyMuPDF和pdfplumber库,轻松提取PDF文件里的文本和元数据。你是否曾经在处理一个复杂的PDF文件时,感到信息难以触及,提取过程让人抓狂?...

《Python知识手册》,高清pdf免费获取

今天我要把我参与编写的这套《Python知识手册》免费分享出来,真正弘扬Python开源精神!手册的部分页面如下:获取方式:...

取消回复欢迎 发表评论: