回顾
在上一篇《Python集合详解》中,我们介绍了集合的相关方法,简单回顾一下:
- 创建集合:{ } 和set()函数两种方式
- 集合添加元素:setname.add(element)
- 集合删除元素:setname.remove(element)
- 清空集合:setname.clear()
- 集合求交集:& 或 intersection()
- 集合求并集:| 或 union()
- 集合求差集:- 或 difference()
- 复制集合:setname.copy()
这次的主题是Python中很重要的一个数据类型:字符串。
一、字符串切片
从本质上讲,字符串是由多个字符构成的,字符之间是有顺序的,这个顺序号称为索引(index)。
1.获取单个字符
在方括号[ ]中使用索引即可访问对应的字符,具体的语法格式为:
strname[index]
Python 允许从字符串的两端使用索引:
- 当以字符串的左端(字符串的开头)为起点时,索引是从 0 开始计数的;字符串的第一个字符的索引为 0,第二个字符的索引为 1,第三个字符串的索引为 2 ……以此类推
- 当以字符串的右端(字符串的末尾)为起点时,索引是从 -1 开始计数的;字符串的倒数第一个字符的索引为 -1,倒数第二个字符的索引为 -2,倒数第三个字符的索引为 -3 ……以此类推
str1 = "life is short,i need PYTHON"
# 字符串查找
print(str1.find('s', 0, -1)) # 查找指定范围内是否存在某字符,是返回下标,不存在返回-1
# 获取单个字符
a = str1[0] # 第一个字符
b = str1[-1] # 最后一个字符
print(a) # 1
print(b) # N
2.获取多个字符(字符串截取/切片)
使用[ ]除了可以获取单个字符外,还可以指定一个范围来获取多个字符,也就是一个子串或者片段,具体格式为:
strname[start : end : step]
# 获取多个字符(字符串切片)
c = str1[0:3] # 获取str1的第1个到第3个之间的字符,步长默认为1
d = str1[0:5:2] # 获取str1的第1个到第5个之间的字符,指定默认为2
二、len():获取对象长度和字节长度
Python 中,要想知道一个对象长度,或者一个字符串占用多少个字节,可以使用 len 函数。len 函数的基本语法格式为:
len(obj)
其中 obj用于指定要进行长度统计的对象,可以是字符串、列表、元组、字典等。 通过使用 encode() 方法,将字符串进行编码后再获取它的字节数。例如,采用 UTF-8 编码方式,计算“人生苦短,我用Python”的字节数,可以执行如下代码:
# 获取对象长度
str2 = "人生苦短,我用PYTHON"
print(len(str2)) # 13
print(len(str2.encode())) # 27,使用encode()方法转码为字节,一个中文字符占用3个字节
三、join()方法:合并字符串
Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。语法格式:
newstr = str.join(iterable)
此方法中各参数的含义如下:
- newstr:表示合并后生成的新字符串;
- str:用于指定合并时的分隔符;
- iterable:做合并操作的源字符串数据,允许以列表、元组等形式提供。
# 合并字符串
list_a = ['a', 'b', 'c', 'd', 'e']
print("".join(list_a)) # abcde 默认连接符
print("#".join(list_a)) # a#b#c#d#e 指定连接符
# 字符串拼接
str_a = "人生苦短"
str_b = "我用PYTHON"
print(str_a + str_b) # 人生苦短我用PYTHON
# 字符串追加字符
print(str_b.join(str_a)) # 人我用PYTHON生我用PYTHON苦我用PYTHON短 输出的为无序的字符串
四、split()方法:字符串分隔
# 字符串分隔
str2 = "life is short,i need python"
print(str1.split(' ')) # ['life', 'is', 'short,i', 'need', 'PYTHON']
五、替换与删除指定字符
- str.replace(old, new,count),替换指定字符(不加count默认全替换)
- str.replace(old, '',count),将指定字符用空字符代替、从而达到删除的目的(不加count默认全替换)
# 字符串替换指定字符(用大写的LIFE字符代替小写的life)
print(str2.replace('life', 'LIFE')) # LIFE is short,i need python
# 字符串删除指定字符(用空字符代替字符i,从而达到删除目的)
print(str2.replace('i', '')) # lfe s short, need python
六、字符串格式化输出
1.来自C语言的%方式
%号格式化字符串的方式继承自古老的C语言,这在很多编程语言都有类似的实现。%s是一个占位符,它仅代表一段字符串,并不是拼接的实际内容。实际的拼接内容在一个单独的%号后面,放在一个元组里。 类似的占位符还有:
- %d(代表一个整数)
- %f(代表一个浮点数)
- %x(代表一个16进制数)
%占位符既是这种拼接方 式的特点,同时也是其限制因为每种占位符都有特定意义,实际使用起来较为麻烦。
# 使用占位符
name = "dang"
age = 5
print("我叫%s,我今年%s岁了" % (name, age)) # 我叫dang,我今年5岁了
print("%d" % (20)) # 八进制 20
print("%o" % (20)) # 十进制 24
print("%x" % (20)) # 十六进制 14
2.format()拼接方式
# format()拼接方式
name1 = "当当"
name2 = "刚刚"
age = 5
print("我叫{},我今年{}岁了".format(name1, age)) # 我叫当当,我今年5岁了
print("我叫{1},我叫{0}".format(name1, name2)) # 使用编号指定顺序 "我叫刚刚,我叫当当"
print("我叫{name},我今年{age}岁了".format(name=name1, age=age)) # 使用变量名指定顺序 "我叫当当,我今年5岁了"
3.f-string方式
f-string方式出自PEP 498(Literal String Interpolation,字面字符串插值),从Python3.6版本引入。其特点是在字符串前加 f 标识,字符串中间则用花括号{}包裹其他字符串变量。
# f-string方式
name3 = "jigang.chen"
age = 28
print(f"我叫{name3},我今年{age}岁了") # 我叫jigang.chen,我今年28岁了
print(f"a total number is {20 * 2 + 8}") # 处理表达式 a total number is 48
name = "PYTHON"
print(f"my name is {name.lower()}") # 处理方法调用 my name is python
七、字符串其他方法
str1 = "life is short,i need PYTHON"
# 计算某个字符出现的次数
print(str1.count('i')) # 3
# 在指定区间内查找某个字符,并返回该字符的索引
print(str1.find('f', 0, -1)) # 2
# 将字符串全部转换为小写
print(str1.lower()) # life is short,i need python
总结
列表、元组、字符串都是有序序列,而字典、集合都是无序序列,无法通过下标获取元素;
列表、字典、集合都是可变序列,而元组、字符串是不可变序列,一旦创建,就无法更改;