「oeasy」python0020换行字符_feed_line_lf_反斜杠n_B语言_安徒生
off999 2024-10-05 19:45 17 浏览 0 评论
换行字符
回忆上次内容
- struct包可以让我们使用封包格式
- 把数字封包到字节里
- pack函数负责封包
- unpack函数负责解封
- 我们通过封到不同的字节状态
- 遍历了一次ascii码
- 还是有那片黑色的区域
- 好像是一片黑暗森林!
- 那里面到底有些什么秘密?
- 我们这次向黑暗森林区域进发!!
- 整理行装
- 出发!
chr
- 先看看"oeasy"这个字符串是如何存在的
- 字符都对应着一个数字
- 数字在计算机上究竟是如何存储的呢?
- 用二进制形式存储在字节中的
- 可以看看这个二进制形式么?
chr
- 8bit 构成 byte
- 上图的字节为
- (0011 0101)2
- (35)16
- 对应着字符'5'
- 那字母呢?
- abcd在内存里长什么样子?
文件编码
- 编写一个文件
- 写下 abcd
- 用 :%!xxd
- :%!xxd -r 变回来
- 可以看到文件是用 2进制 方式存储的
- 0x61 - a
- 0x62 - b
- 0x63 - c
- 0x64 - d
- 不论是内存、硬盘还是网络传输
- a 对应
- (0x61)16
- (0b01100001)2
- 图中最后的那个 0x0a 对应什么字符???
善用函数
- 使用chr得到相关字符
- 0x0a对应的是'\n'这个字符
- 这个字符好像在哪里见过?
回到最初
- 想要了解这个'\n'
- 我们还得回到最初
- 我们回到开始的时候
- 前面介绍过
- BWK写的 c 语言的第一个程序
\n
- 注意到hello world后面的\n了么?
- 注意到hello world后面的\n了么?
- 特别注意斜杠的方向
- 这个方向\叫反斜杠
- 键盘位置在回车键附近
- 那\n到底是什么??
输出"\n"
- \n 是一个整体
- 占一个字节
- 算一个字符
- 序号是(10)10进制
- 也就是(0x0a)16进制
- 这就是在开篇时的abcd后面的字符
- \n在内存里显示为一个.
- 我们直接把他输出看看
输出
- 输出
#输出\n
print("\n")
#直接print
print()
#查看序号
ord("\n")
#查看十六进制的序号
hex(ord("\n"))
- 输出结果
- 好像换了 2 行
- 如果没\n的话,只换 1 行
- 如果有\n的话, 就换 2 行
- 我们看看ascii码表是如何定义的这第10个字符的
找到位置
- 我们已经身在在黑暗森林中
- 找到了一个落脚点
- 十进制的10 就是 十六进制的 0x0A
- 这个数值在 ascii 码表中意思是 LF
- 啥意思?
搜索
- 搜索\n得到的结果是这样的
- LF 意味着 Line Feed
- 喂行
- 喂一行纸
- 那我真的可以用这个\n在字符中间换行嘛?
尝试换行
#输出字符串中带有\n
print("Hello\nWorld")
- 在游乐场中尝试
- 中途换行成功!
- 可以多来几个换行符吗?
多来几个
- 就往里面加\n
#输出字符串中带有\n
print("He\nllo\nWor\nld")
- 显然这个 \n 就是一个换行
- 字符串里面有个 \n 就意味着需要换 1 行
- 他的英文是 Line Feed
- 意思就是 新换1行
- 这个东西其实比 ascii 的历史还要悠久
- 从打字机的时代就有了
- 为什么要有换行符呢?
换行符
- 最最开始的时候分段落
- 都是靠打字机输出空格完成换行
- 自从有了这个LineFeed
- 一个键就直接换行了
- 所以LineFeed 极大地提高了效率
- 两个换行符就换两行
- 可以使用chr函数么?
使用序号得到换行符
#输出ascii值为10的字符
chr(10)
#把这个字符放在print里面输出
print("hello"+chr(10)+"world")
- 纯文本中也会有回车符么?
- 我们去看看纯文本文件
打开文本文档
https://github.com/overmind1980/oeasy-python-tutorial.git
vi oeasy-python-tutorial/samples/000016/anderson_fairy_tales.txt
- 首先下载这个仓库
- 然后找到其中的安德森仙话这个本书
- 我们发现这个东西是318K
- 那他有多少字符呢?
字符数量
- 1个英文字符占一个字节
- 318k大概有318000个字节
- 大概是31.8万个字符
- 这就是文本文件的形式
- 第一行的Andersen后面有应该有两个换行符
- 是不是呢真有换行符呢?
字节形式
- 所有行转化为字节形式
- %!xxd
- 查找0a
- /0a
- 确实能够找到那两个换行符(0a)
- 这可以和纯文本方式对应起来吗?
纯文本方式
- 文本中的换行
- 其实就是换行符的效果
- 在文本观看模式下是换行
- 在字节观看模式下是0a
- 这本书后来被翻译成安徒生童话
安徒生童话
- 里面有很多耳熟能详的故事
- 《皇帝的新装》
- 《海的女儿》
- 《丑小鸭》
- 《红舞鞋》
- 《卖火柴的小女孩》
- 《拇指姑娘》
- 在安徒生所处的时代(1805-1875)
- 丹麦仍是一个君主专制主义社会
- 20年代经济衰退
- 童话用儿童视角透视复杂生活
- 万物有灵
- 风趣幽默
- Jean Hersholt
- 将160个故事从丹麦文翻译成英文
- 刘半农 1914年
- 翻译了《皇帝的新衣》开始
- 叶君健 1944年到1949年
- 翻译了 安徒生童话全集
- 互联网时代
- 英文版安徒生童话被谷腾堡项目所收录
落实
- 文档当中就是用0和1来表示字符的
- 如下图所示
- 文字是蓝色的
- 字节是黑色的
- 为什么\n会用来表示换行(Line-Feed)呢?
追溯历史
- c语言 中的 \n 来自于什么呢?
- 来自于 B语言
- B语言 是里奇和汤普逊最早开发 unix 的语言
- B语言 1969 年 就 运行在bell实验室 的 PDP-8 上
- 1971 年里奇和汤普逊开始对于 B语言 进行改造
- 在新买的 PDP-11 上用 B语言 给 B语言 写扩展,称之为 NewB
- 1973 年 NewB 基本主体完成
- 改名叫 c语言
- 所以 c 其实是 NewB
- 他们用手头的编译器和c语言给 PDP-11 重写了一个 Unix Kernel
- 机器语言和汇编语言本来不具有移植性
- 就像x86的二进制程序不能直接运行在arm上
- 需要移植
- c语言 程序却可以在 很多架构 的处理器上编译运行
- 只要那种架构的处理器具有对应的 c语言编译器和库
- 那就能顺利编译成针对该处理器架构的二进制程序
- 甚至能实现跨平台编译
- 也就是今天所说的交叉编译
- 这就是 c语言 在当时能够发展的原因
- c语言 源自 B语言
- B语言 也不是凭空创造的
- 源自什么呢?
Basic Combined Programming Language(BCPL)
- B语言 源自BCPL(Basic Combined Programming Language)
- 1967 年由剑桥大学的 Matin Richards 制作
- 在同样由剑桥大学开发的 CPL语言 上改进而来
- BCPL 最早被用做牛津大学的 OS6操作系统 上面的开发工具
- 后来通过美国贝尔实验室的改进和推广成为了 UNIX 上的常用开发语言
- 最早 BCPL 语言的样子就有个类似于l(ine)f(eed)的符号
- 这是关于换行符表示法 最早的记录
- 当时的换行符长什么样呢?
BCPL的换行符
- 当时的换行符长成这样
- !*n
- 上述程序的目是
- 输出 hello,world
- 然后再来个回车
- 所以hello world
- 并不是c语言的发明
- 而是从c语言的爷爷bcpl那时候就有了
- 并且从bcpl时代就已经作为迷因(meme)开始传播
- python虚拟机的可执行文件
- 也就是pyc文件是如何理解换行符的呢?
反汇编(disassemble)
- 观察一下
- \n出现在字符串常量中
- 能在pyc中找到这个常量么?
先编译
- 将py文件编译成pyc文件
- 再观察
pyc文件
- 打开pyc文件
- 确实能够找到a和s之间的\n
- 也就是(0a)16进制
- 任务完成!!!
总结
- \n 就是换行符号
- 换行符对应着 ascii 字符的代码是(10)10进制
- 换行符的英文是 LF
- 意思是Line Feed
- 我们可以在《安徒生童话》的文本中
- 找到每个字符对应的字节形态
- 不光txt文件是文件
- 我们的python游乐场本质上也是一个二进制可执行的文件
- 这个文件在哪?
- 我们可以读懂这个可执行文件吗?
- 我们下次再说!
- 蓝桥->https://www.lanqiao.cn/teacher/3584
- github->https://github.com/overmind1980/oeasy-python-tutorial
- gitee->https://gitee.com/overmind1980/oeasypython
- 视频->https://www.bilibili.com/video/BV1CU4y1Z7gQ 作者:oeasy
相关推荐
- python爬取电子课本,送给居家上课的孩子们
-
在这个全民抗疫的日子,中小学生们也开启了居家上网课的生活。很多没借到书的孩子,不得不在网上看电子课本,有的电子课本是老师发的网络链接,每次打开网页去看,既费流量,也不方便。今天我们就利用python的...
- 高效办公!Python 批量生成PDF文档是如何做到的?
-
前言:日常办公中,经常会使用PDF文档,难免需要对PDF文档进行编辑,有时候PDF文档中的大部分内容都是一样的,只是发送对象不同。这种模板套用的场景下,使用Python进行自动化就尤为方便,用最短的时...
- 如何用Python将PDF完整的转成Word?
-
PDF文件完整的转为Word,转换后格式排版不会乱,图片等信息完整显示不丢失。这个很简单,有很多方法都可以实现。方法一:Python利用Python将PDF文件转换为Word,有许多库可以帮你实现这一...
- 使用Python拆分、合并PDF(python合并多个pdf)
-
知识点使用Python操作PDF!主要内容有:1、PDF拆分;2、PDF合并。在工作中,难免会和PDF打交道,所以掌握一点处理PDF的技能非常有必要,本文将介绍几个常用的功能。PDF拆分很多时候,获取...
- 10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人
-
开篇痛点每个被PDF折磨过的职场人都懂——领导发来的扫描件要修改,手动抄到Word需要2小时;网上下载的报告想复制数据,却变成乱码…今天我们用Python+DeepSeek,10分钟打造一个智能转换工...
- 《Python知识手册》,高清全彩pdf版开放下载
-
Python编程还不懂?今天我要把我参与编写的这套《Python知识手册》免费分享出来,看完文末有惊喜哦。...
- 利用python进行数据分析,PDF文档给你答案
-
本书详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。虽然本书的标题是“数据分析”,重点却是Python编程、库,以及用于数据分析的工具。兄弟,毫无套路!PDF版无偿获...
- OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!
-
简介在日常工作中,我们经常会接触到各种PDF文件,其中不少是扫描版文档。处理这些扫描PDF时,尽管内容看似完整,但往往无法直接复制或搜索其中的文本。尤其是在需要对大量文档进行文本分析、存档或后期编辑时...
- 高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!
-
在工作中,我们常常遇到各种各样的PDF文件,其中不乏一些扫描版的文档。而在处理扫描的PDF文件时,虽然文件内容看似完整,但你却无法复制、搜索其中的文本。特别是对大量文档需要进行文本分析、存档、或者...
- 三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!
-
面对100页以上的大型PDF文件时,阅读和搜索往往效率低下。传统关系型数据库在处理此类数据时容易遇到性能瓶颈,而Elasticsearch凭借其强大的全文检索和分布式架构,成为理想解决方案。通过...
- 用 Python 去除 PDF 水印,你学会吗?
-
今天介绍下用Python去除PDF(图片)的水印。思路很简单,代码也很简洁。首先来考虑Python如何去除图片的水印,然后再将思路复用到PDF上面。这张图片是前几天整理《数据结构和算法...
- 扫描PDF档案效率提升300%!OCRmyPDF:告别无法搜索的PDF噩梦,这款26K Star的开源神器让文本识别轻松上手!
-
要在PDF中搜索某个关键词,结果发现啥也找不到?这种情况大多数人都遇到过吧,特别是处理扫描文档或图片PDF时。就在前几天,我还在为这事抓狂呢!后来无意中发现了OCRmyPDF这个宝藏项目...简直就...
- Python自动化办公之PDF版本发票识别并提取关键信息教程(上篇)
-
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公发票数据处理的问题,一起来看看吧。二、实现过程这个问题在实际工作中还是非常常见的,实用性和通用性都比...
- PDF解锁神器:用PyMuPDF与pdfplumber告别手动提取
-
前言大家好,今天咱们来聊聊如何用Python中的PyMuPDF和pdfplumber库,轻松提取PDF文件里的文本和元数据。你是否曾经在处理一个复杂的PDF文件时,感到信息难以触及,提取过程让人抓狂?...
- 《Python知识手册》,高清pdf免费获取
-
今天我要把我参与编写的这套《Python知识手册》免费分享出来,真正弘扬Python开源精神!手册的部分页面如下:获取方式:...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- python爬取电子课本,送给居家上课的孩子们
- 高效办公!Python 批量生成PDF文档是如何做到的?
- 如何用Python将PDF完整的转成Word?
- 使用Python拆分、合并PDF(python合并多个pdf)
- 10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人
- 《Python知识手册》,高清全彩pdf版开放下载
- 利用python进行数据分析,PDF文档给你答案
- OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!
- 高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!
- 三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python自定义函数 (53)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python人脸识别 (54)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)