在开发系统的过程中,经常会用到XML存储和传输数据,XML是一种用于标记电子文件使其具有结构性的标记语言,在博客中经常会见到。
JSON是一种轻量级的数据交换格式,常被用在后端和前端的数据交互上,如你用Python提供后端WebService数据接口,App在调用这个接口时,收到的数据就是JSON文件。
txt是最常见的一种文件格式 ,主要存文本信息,即为文字信息,现在的操作系统大多使用记事本等程序保存,大多数软件可以查看,如记事本,浏览器等。
10.1 XML文件
XML指可扩展标记语言(eXtensible Markup Language)。由成对标签如<book></book>或闭环标签<book/>组成,最外部标签称为根节点。在根节点里面,可以包含很多子节点,子节点有自己的属性和文本。如下样例:book为根节点,name有自己的属性name,author的文本值为老陈,price为闭环标签。
<book>
<name name="书名">12天搞定Python</name>
<author>老陈</author>
<price price="0.00元" />
</book>
在自带的标准库中,Python提供了大量可以用于处理XML语言的包和工具,经我和同事测试、比较,发现ElementTree模块是最好用的,所有我推荐你也用它来处理XML文件。
1. 创建XML
XML文件,从创建节点(book)开始,之后创建里面的子节点,并对子节点进行属性和内容添加。
import xml.etree.ElementTree as ET
# 创建根节点
book = ET.Element("book")
# 创建子节点,并添加属性和数据
title = ET.SubElement(book, "name")
title.attrib = {"name": "书名"}
title.text = "12天搞定Python"
# 创建子节点,并添加数据
author = ET.SubElement(book, "author")
author.text = "老陈"
price = ET.SubElement(book, "price")
# 创建子节点,并添加数据
price.attrib = {"price": "0.00元"}
# 创建tree对象,写文件
tree = ET.ElementTree(book)
tree.write("book.xml", encoding="UTF-8")
输出结果(book.xml文件)
<book>
<name name="书名">12天搞定Python</name>
<author>老陈</author>
<price price="0.00元" />
</book>
2. 修改XML
修改book.xml文件,新增创建日期,修改name的属性名为arr,价格调整为0.01元。
import xml.etree.ElementTree as ET
tree = ET.parse("book.xml") # 读取待修改文件
book = tree.getroot()
# 创建新节点并添加为root的子节点
createDate = ET.Element("createDate")
createDate.attrib = {"name": "创建日期"}
createDate.text = "2020-10-01"
book.append(createDate)
# 修改书名的属性
name = book.find("name")
name.attrib = {"name": "arr"}
# 修改价格
price = book.find("price")
price.text = "0.01元"
# 写回原文件
tree.write("book.xml", encoding="UTF-8")
输出结果(book.xml文件)
<book>
<name name="arr">12天搞定Python</name>
<author>老陈</author>
<price price="0.00元">0.01元</price>
<createDate name="创建日期">2020-10-01</createDate>
</book>
3. 删除XML节点
删节点,先找到,再用remove()方法进行删除。
import xml.etree.ElementTree as ET
tree = ET.parse("book.xml") # 读取待修改文件
book = tree.getroot()
for price in book.findall('price'):
book.remove(price)
tree.write('book.xml', encoding="UTF-8")
输出结果(book.xml文件)
<book>
<name name="arr">12天搞定Python</name>
<author>老陈</author>
<createDate name="创建日期">2020-10-01</createDate>
</book>
4. 读取XML
循环读取节点内容,输出不为None的节点。
import xml.etree.ElementTree as ET
tree = ET.parse("book.xml") # 读取待修改文件
book = tree.getroot()
for node in book.iter():
if node.text is not None:
print(node.tag, ":", node.text)
好了,有关XML文件的内容,老陈讲完了,如果觉得对你有所帮助,希望老铁能转发点赞,让更多的人看到这篇文章。你的转发和点赞,就是对老陈继续创作和分享最大的鼓励。
10.2 JSON文件
JSON文件数据由一系列键值对组成并用逗号隔开和我们学过的字典可进行化互相转换。Python 中可以使用json模块对JSON 数据进行编解码。
1. 创建JSON文件
json.dumps()对字符串数据进行编码, json.dump()对文件数据进行编码。
import json
# 字典转换为JSON对象
book = {
'name': "12天搞定Python",
'author': '老陈',
'price': 0.00
}
# 生成json格式
json_str = json.dumps(book, ensure_ascii=False)
# 写入 JSON 数据
with open('book.json', 'w') as f:
json.dump(json_str, f)
输出结果(book.json文件内容)
"{"name": "12天搞定Python", "author": "老陈", "price": 0.0}"
2. 读取JSON文件
json.loads()对字符串数据进行解码, json.load() 对JSON文件进行解码。
import json
# 将JSON对象转换为字典
json_str = '{"name": "12天搞定Python", "author": "老陈", "price": 0.0}'
dic = json.loads(json_str)
print("dic['name']: ", dic['name'])
# 读取数据
f = open('book.json', encoding="UTF-8")
data = ""
for line in f:
data += line
print(data)
输出结果(book.json文件内容)
dic['name']: 12天搞定Python
"{"name": "12天搞定Python", "author": "老陈", "price": 0.0}"
10.3 txt文件
对文本文件的操作,跟对XML和JSON操作,其实并没有多大的区别,只是内容格式不同而已。操作文件,最简单的方式,就是用open(file, mode='r')类,其中mode参数也可以省略,默认值就是r,即read的意思,详细内容如下
1. 创建book.txt
创建并写文件时,记得mode参数指定为w(默认是r),如果内容中有中文,指定encoding="UTF-8"。写入数据方法为write。
# 创建文件并写入数据
f = open("boy.txt", "w", encoding="UTF-8")
f.write("Good boy!\n")
f.write("你真帅!\n")
f.write("那是不可能的?\n")
f.write("可能呀!")
f.close()
输出结果(boy.txt文件内容)
Good boy!
你真帅!
那是不可能的?
可能呀!
在写入数据时,如果总是一行一行的写,那也太费事的。不懂偷懒的程序员,不是好工匠,好的工匠会想更优的办法。将多行内容组成列表,并用writelines方法写入。
ls = ["Good boy!\n", "你真帅?\n", "是的,你看我做事效率就知道了。"]
# 创建文件并写入数据
f = open("boy.txt", "w", encoding="UTF-8")
f.writelines(ls)
f.close()
输出结果(boy.txt文件内容)
Good boy!
你真帅?
是的,你看我做事效率就知道了。
2. 文件读取
可写便可读,可逐行写,就可逐行读,可用列表的方式写入,就可读出列表(即读出多行并转成列表)。
# 逐行读取,包括换行
f = open("boy.txt", "r+", encoding="UTF-8")
print(f.readline())
print(f.readline())
print(f.readline())
f.close()
# 多行读取,并转成列表
m = open("boy.txt", "r+", encoding="UTF-8")
print(m.readlines())
m.close()
输出结果
Good boy!
你真帅?
是的,你看我做事效率就知道了。
['Good boy!\n', '你真帅?\n', '是的,你看我做事效率就知道了。']
3. 修改文件
如果想对文件中的某部分内容进行修改的话,可先读取,修改之后再写入就好了。
f = open("boy.txt", "r+")
r = f.read()
line = r.replace("你真帅?\n", "一点也不帅?\n")
f.close()
f2 = open("boy.txt", "w")
f2.write(line)
f2.close()
输出结果(boy.txt文件内容)
Good boy!
一点也不帅?
是的,你看我做事效率就知道了。
好了,有关文件操作的内容,老陈讲完了,如果觉得对你有所帮助,希望老铁能转发点赞,让更多的人看到这篇文章。你的转发和点赞,就是对老陈继续创作和分享最大的鼓励。
一个当了10年技术总监的老家伙,分享多年的编程经验。想学编程的朋友,可关注今日头条:老陈说编程。我将分享Python,前端(小程序)和App方面的编程知识。关注我,没错的。