标准格式:[起始偏移量start:终止偏移量end:步长step]
| 操作和说明 | 示例 | 结果 |
|---|---|---|
| [:] 提取整个字符串 | “abcdef”[:] | “abcdef” |
| [start:]从 start 索引开始到结尾 | “abcdef”[2:] | “cdef” |
| [:end]从头开始知道 end-1 | “abcdef”[:2] | “ab” |
| [start:end]从 start 到 end-1 | “abcdef”[2:4] | “cd” |
| [start: end:step]从 start 提取到end-1,步长是 step | “abcdef”[1:5:2] | “bd” |
| [:: -1]从最后反向提取到第一个字符,步长是-1 | “abcdef”[::-1] | “fedcba” |
| [-1:: -2]从最后反向每隔一个字符提取到第一个字符,步长是-1 | “abcdef”[::-2] | “fdb” |
注:字符串切片不支持字符串修改
1) Python3编码格式
python 3.x默认的字符串编码是unicode,即程序中类型是str的字符串编码都是unicode;默认的代码文件编码是utf-8,即.py文件的编码是utf-8。
在py3上 把你的代码以utf-8编写, 保存,然后在windows上执行,加载到了内存里python解释器把utf-8转成了unicode。如下图:

2)计算机常用编码如下:
3) Python编程进行编码转换

#unicode码编码成utf-8或gb2312字节码
s="python程序设计" s_utf_8=s.encode(encoding='utf-8') #默认是utf-8或UTF-8编码,utf8也行 s_gb2312=s.encode(encoding='gb2312') print(s_utf_8) print(s_gb2312)#字节码解码成unicode码 s1=s_utf_8.decode() s2=s_gb2312.decode(encoding='gb2312') print(s1) print(s2)
字符串类型的名称是(也是字符串类):str
可以使用str调用字符串方法,比如:str.upper("python")
一般都使用字符串对象调用方法:"python".upper()
| 方法 | 参数 | 描述 |
|---|---|---|
| 关于字母的内置函数 | ||
| capitalize() | 无 | 将字符串的第一个字符转换为大写 |
| title() | NA | 单词都是以大写开始,其余字母均为小写 |
| upper() | NA | 转换字符串中的小写字母为大写 |
| swapcase() | NA | 将字符串中大写转换为小写,小写转换为大写 |
| max(str) | str – 字符串 | 方法返回字符串中最大的字母 |
| min(str) | str – 字符串 | 方法返回字符串中最小的字母 |
| 关于判断的内置函数 | ||
| isalnum() | 无 | 字符串中只有字母或数字则返 回 True,否则返回 False |
| isalpha() | 无 | 检测字符串是否只由字母组成。是则返回 True, 否则返回 False |
| isdigit() | 无 | 字符串是否只由数字组成,是则返回 True 否则返回 False。 |
| islower() | 无 | 检测字符串是否由小写字母组成,是则返回 True,否则返回 False |
| isnumeric() | 无 | 字符串是否只由数字组成。这种方法是只针对unicode对象。是返回 True, False |
| isdecimal() | 无 | 字符串是否只包含十进制字符。这种方法只存在于unicode对象.是返回 True, False |
| isspace() | 无 | 字符串是否只由空白字符组成。是返回 True, 否则False |
| istitle() | 无 | 检测字符串中所有的单词拼写首字母是否为大写,且其他字母为小写。是返回 True, 否则False |
| isupper() | 无 | 字符串中所有的字母是否都为大写 .是返回 True, 否则False |
| 替换 | ||
| replace(old, new[, max]) | old – 将被替换的子字符串。new – 新字符串,用于替换old子字符串。max – 可选字符串, 替换不超过 max 次 | 把字符串中的 old(旧字符串) 替换成 new(新字符串),如果指定第三个参数max,则替换不超过 max 次。 |
| expandtabs(tabsize=8) | tabsize – 指定转换字符串中的 tab 符号(’\t’)转为空格的字符数。 | 把字符串中的 tab 符号(’\t’)转为空格,tab 符号(’\t’)默认的空格数是 8。 |
| maketrans(intab, outtab) | intab – 字符串中要替代的字符组成的字符串。outtab – 相应的映射字符的字符串。 | 用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。两个字符串的长度必须相同,为一一对应的关系。 返回字典 |
| 位置对齐 | ||
| zfill(width) | width – 指定字符串的长度。原字符串右对齐,前面填充0。 | 返回指定长度的字符串,原字符串右对齐,前面填充0。 |
| rjust(width[, fillchar]) | 1.width – 指定填充指定字符后中字符串的总长度.2.fillchar – 填充的字符,默认为空格。返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串。如果指定的长度小于字符串的长度则返回原字符串。 | |
| center(width[, fillchar]) | width – 字符串的总宽度。fillchar – 填充字符。 | 返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。 |
| ljust(width[, fillchar]) | width – 指定字符串长度。fillchar – 填充字符,默认为空格。 | 返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串。如果指定的长度小于原字符串的长度则返回原字符串。 |
| 检查查找 | ||
| startswith(substr, beg=0,end=len(string)) | str – 检测的字符串。substr – 指定的子字符串。strbeg – 可选参数用于设置字符串检测的起始位置。strend – 可选参数用于设置字符串检测的结束位置。 | 用于检查字符串是否是以指定子字符串开头,如果是则返回 True,否则返回 False。如果参数 beg 和 end 指定值,则在指定范围内检查。 |
| endswith(suffix[, start[, end]]) | suffix – 该参数可以是一个字符串或者是一个元素。start – 字符串中的开始位置。end – 字符中结束位置。 | 用于判断字符串是否以指定后缀结尾,如果以指定后缀结尾返回 True,否则返回 False。可选参数 “start” 与 “end” 为检索字符串的开始与结束位置。 |
| find(str, beg=0, end=len(string)) | str – 指定检索的字符串beg – 开始索引,默认为0。end – 结束索引,默认为字符串的长度 | 检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,如果指定范围内如果包含指定索引值,返回的是索引值在字符串中的起始位置。如果不包含索引值,返回-1。 |
| rfind(str, beg=0 end=len(string)) | str – 查找的字符串beg – 开始查找的位置,默认为0end – 结束查找位置,默认为字符串的长度。 | 返回字符串最后一次出现的位置,如果没有匹配项则返回-1 |
| index(str, beg=0, end=len(string)) | str – 指定检索的字符串beg – 开始索引,默认为0。end – 结束索引,默认为字符串的长度。 | 检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,该方法与 python find()方法一样,只不过如果str不在 string中会报一个异常。 |
| rindex(str, beg=0 end=len(string)) | str – 查找的字符串beg – 开始查找的位置,默认为0end – 结束查找位置,默认为字符串的长度。 | 返回子字符串 str 在字符串中最后出现的位置,如果没有匹配的字符串会报异常,你可以指定可选参数[beg:end]设置查找的区间。 |
| 删除 | ||
| rstrip([chars]) | chars – 指定删除的字符(默认为空格) | 删除 string 字符串末尾的指定字符(默认为空格) |
| lstrip([chars]) | chars – 指定删除的字符(默认为空格) | 删除 string 字符串开头的指定字符(默认为空格) |
| strip([chars]) | chars – 移除字符串头尾指定的字符序列。 | 用于移除字符串头尾指定的字符(默认为空格)或字符序列。 |
| 拼接 | ||
| join(sequence) | sequence – 要连接的元素序列。 | 用于将序列中的元素以指定的字符连接生成一个新的字符串。 |
| 分割 | ||
| split(str="", num=string.count(str)) | 1.str – 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。2.num – 分割次数。默认为 -1, 即分隔所有。 | 通过指定分隔符对字符串进行切片,如果第二个参数 num 有指定值,则分割为 num+1 个子字符串。 |
| 返回元素列表 | ||
| splitlines([keepends]) | keepends – 在输出结果里是否去掉换行符(’\r’, ‘\r\n’, \n’),默认为 False,不包含换行符,如果为 True,则保留换行符。 | 按照行(’\r’, ‘\r\n’, \n’)分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。 |
| 计算数量 | ||
| count(sub, start= 0,end=len(string)) | sub – 搜索的子字符串start – 字符串开始搜索的位置。默认为第一个字符,第一个字符索引值为0。end – 字符串中结束搜索的位置。字符中第一个字符的索引为 0。默认为字符串的最后一个位置。 | 用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。 |
| len( s ) | s – 对象。 | 返回对象(字符、列表、元组等)长度或项目个数。 |
| 过滤 | ||
| 1.translate(table) 2.bytes.translate(table[, delete]) 3.bytearray.translate(table[, delete]) | table – 翻译表,翻译表是通过 maketrans() 方法转换而来。 deletechars – 字符串中要过滤的字符列表。 | 根据参数table给出的表(包含 256 个字符)转换字符串的字符,要过滤掉的字符放到 deletechars 参数中。 |
| 编码解码 | ||
| bytes.decode(encoding=“utf-8”, errors=“strict”) | encoding – 要使用的编码,如"UTF-8"。errors – 设置不同错误的处理方案。默认为 ‘strict’,意为编码错误引起一个UnicodeError。 其他可能得值有 ‘ignore’, ‘replace’,‘xmlcharrefreplace’, ‘backslashreplace’ 以及通过 codecs.register_error() 注册的任何值。 | 以指定的编码格式解码 bytes 对象。默认编码为 ‘utf-8’。 |
| encode(encoding=‘UTF-8’,errors=‘strict’) | encoding – 要使用的编码,如: UTF-8。errors – 设置不同错误的处理方案。默认为 ‘strict’,意为编码错误引起一个UnicodeError。 其他可能得值有 ‘ignore’, ‘replace’,‘xmlcharrefreplace’, ‘backslashreplace’ 以及通过 codecs.register_error() 注册的任何值。 | 以指定的编码格式编码字符串。errors参数可以指定不同的错误处理方案。 |