Python 字符串操作
文章目录
Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)
1. 去空格及特殊符号
1s.strip()
2s.lstrip()
3s.rstrip()
4s.strip().lstrip().rstrip(',')
声明:s为字符串,rm为要删除的字符序列
s.strip(rm) 删除s字符串中开头、结尾处,位于 rm删除序列的字符
s.lstrip(rm) 删除s字符串中开头处,位于 rm删除序列的字符
s.rstrip(rm) 删除s字符串中结尾处,位于 rm删除序列的字符
2. 复制字符串
1#strcpy(str1,str2)
2str1 = 'strcpy'
3str2 = str1
4str1 = 'strcpy2'
5print str2
3. 连接字符串
1#strcat(str1,str2)
2str1 = 'strcat'
3str2 = 'append'
4str1 += str2
5print str1
4. 查找字符
1#strchr(str1,str2)
2# < 0 为未找到
3str1 = 'strchr'
4str2 = 's'
5nPos = str1.index(str2)
6print nPos
5. 比较字符串
1#strcmp(str1,str2)
2str1 = 'strchr'
3str2 = 'strch'
4print cmp(str1,str2)
6. 扫描字符串是否包含指定的字符
1#strspn(str1,str2)
2str1 = '12345678'
3str2 = '456'
4#str1 and chars both in str1 and str2
5print len(str1 and str2)
7. 字符串长度
1#strlen(str1)
2str1 = 'strlen'
3print len(str1)
8. 将字符串中的大小写转换
1S.lower() #小写
2S.upper() #大写
3S.swapcase() #大小写互换
4S.capitalize() #首字母大写
5String.capwords(S) #这是模块中的方法。它把S用split()函数分开,然后用capitalize()把首字母变成大写,最后用join()合并到一起
6#实例:
7#strlwr(sStr1)
8str1 = 'JCstrlwr'
9str1 = str1.upper()
10#str1 = str1.lower()
11print str1
9. 追加指定长度的字符串
1#strncat(str1,str2,n)
2str1 = '12345'
3str2 = 'abcdef'
4n = 3
5str1 += str2[0:n]
6print str1
10. 字符串指定长度比较
1#strncmp(str1,str2,n)
2str1 = '12345'
3str2 = '123bc'
4n = 3
5print cmp(str1[0:n],str2[0:n])
11. 复制指定长度的字符
1#strncpy(str1,str2,n)
2str1 = ''
3str2 = '12345'
4n = 3
5str1 = str2[0:n]
6print str1
12. 将字符串前n个字符替换为指定的字符
1str1 = '12345'
2ch = 'r'
3n = 3
4str1 = n * ch + str1[3:]
5print str1
13. 扫描字符串
1#strpbrk(str1,str2)
2str1 = 'cekjgdklab'
3str2 = 'gka'
4nPos = -1
5for c in str1:
6if c in str2:
7nPos = str1.index(c)
8break
9print nPos
14. 翻转字符串
1#strrev(str1)
2str1 = 'abcdefg'
3str1 = str1[::-1]
4print str1
15. 查找字符串
1#strstr(str1,str2)
2str1 = 'abcdefg'
3str2 = 'cde'
4print str1.find(str2)
16. 分割字符串
1#strtok(str1,str2)
2str1 = 'ab,cde,fgh,ijk'
3str2 = ','
4str1 = str1[str1.find(str2) + 1:]
5print str1
6#或者
7s = 'ab,cde,fgh,ijk'
8print(s.split(','))
17. 连接字符串
1delimiter = ','
2mylist = ['Brazil', 'Russia', 'India', 'China']
3print delimiter.join(mylist)
18. PHP 中 addslashes 的实现
1def addslashes(s):
2d = {'"':'\\"', "'":"\\'", "\0":"\\\0", "\\":"\\\\"}
3return ''.join(d.get(c, c) for c in s)
4
5s = "John 'Johny' Doe (a.k.a. \"Super Joe\")\\\0"
6print s
7print addslashes(s)
19. 只显示字母与数字
1def OnlyCharNum(s,oth=''):
2s2 = s.lower();
3fomart = 'abcdefghijklmnopqrstuvwxyz0123456789'
4for c in s2:
5if not c in fomart:
6s = s.replace(c,'');
7return s;
8
9print(OnlyStr("a000 aa-b"))
20. 截取字符串
1str = '0123456789'
2print str[0:3] #截取第一位到第三位的字符
3print str[:] #截取字符串的全部字符
4print str[6:] #截取第七个字符到结尾
5print str[:-3] #截取从头开始到倒数第三个字符之前
6print str[2] #截取第三个字符
7print str[-1] #截取倒数第一个字符
8print str[::-1] #创造一个与原字符串顺序相反的字符串
9print str[-3:-1] #截取倒数第三位与倒数第一位之前的字符
10print str[-3:] #截取倒数第三位到结尾
11print str[:-5:-3] #逆向截取,倒数第一位与倒数第五位之间的字符,步长为3
21. 字符串在输出时的对齐
1S.ljust(width,[fillchar])
2#输出width个字符,S左对齐,不足部分用fillchar填充,默认的为空格。
3S.rjust(width,[fillchar]) #右对齐
4S.center(width, [fillchar]) #中间对齐
5S.zfill(width) #把S变成width长,并在右对齐,不足部分用0补足
22. 字符串中的搜索和替换
1S.find(substr, [start, [end]])
2#返回S中出现substr的第一个字母的标号,如果S中没有substr则返回-1。start和end作用就相当于在S[start:end]中搜索
3S.index(substr, [start, [end]])
4#与find()相同,只是在S中没有substr时,会返回一个运行时错误
5S.rfind(substr, [start, [end]])
6#返回S中最后出现的substr的第一个字母的标号,如果S中没有substr则返回-1,也就是说从右边算起的第一次出现的substr的首字母标号
7S.rindex(substr, [start, [end]])
8S.count(substr, [start, [end]]) #计算substr在S中出现的次数
9S.replace(oldstr, newstr, [count])
10#把S中的oldstar替换为newstr,count为替换次数。这是替换的通用形式,还有一些函数进行特殊字符的替换
11S.strip([chars])
12#把S中前后chars中有的字符全部去掉,可以理解为把S前后chars替换为None
13S.lstrip([chars])
14S.rstrip([chars])
15S.expandtabs([tabsize])
16#把S中的tab字符替换没空格,每个tab替换为tabsize个空格,默认是8个
23. 字符串的分割和组合
1S.split([sep, [maxsplit]])
2#以sep为分隔符,把S分成一个list。maxsplit表示分割的次数。默认的分割符为空白字符
3S.rsplit([sep, [maxsplit]])
4S.splitlines([keepends])
5#把S按照行分割符分为一个list,keepends是一个bool值,如果为真每行后而会保留行分割符。
6S.join(seq) #把seq代表的序列──字符串序列,用S连接起来
24. 字符串的mapping
这一功能包含两个函数
1String.maketrans(from, to)
2#返回一个256个字符组成的翻译表,其中from中的字符被一一对应地转换成to,所以from和to必须是等长的。
3S.translate(table[,deletechars])
4# 使用上面的函数产后的翻译表,把S进行翻译,并把deletechars中有的字符删掉。需要注意的是,如果S为unicode字符串,那么就不支持 deletechars参数,可以使用把某个字符翻译为None的方式实现相同的功能。此外还可以使用codecs模块的功能来创建更加功能强大的翻译表。
25. 字符串还有一对编码和解码的函数
1S.encode([encoding,[errors]])
2# 其中encoding可以有多种值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支持。errors默认值为"strict",意思是UnicodeError。可能的值还有'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 和所有的通过codecs.register_error注册的值。这一部分内容涉及codecs模块,不是特明白
3S.decode([encoding,[errors]])
26. 字符串的测试、判断函数
这一类函数在string模块中没有,这些函数返回的都是bool值
1S.startswith(prefix[,start[,end]])
2#是否以prefix开头
3S.endswith(suffix[,start[,end]])
4#以suffix结尾
5S.isalnum()
6#是否全是字母和数字,并至少有一个字符
7S.isalpha() #是否全是字母,并至少有一个字符
8S.isdigit() #是否全是数字,并至少有一个字符
9S.isspace() #是否全是空白字符,并至少有一个字符
10S.islower() #S中的字母是否全是小写
11S.isupper() #S中的字母是否便是大写
12S.istitle() #S是否是首字母大写的
27. 字符串类型转换函数
这几个函数只在string模块中有
1string.atoi(s[,base])
2#base默认为10,如果为0,那么s就可以是012或0x23这种形式的字符串,如果是16那么s就只能是0x23或0X12这种形式的字符串
3string.atol(s[,base]) #转成long
4string.atof(s[,base]) #转成float
这里再强调一次,字符串对象是不可改变的,也就是说在python创建一个字符串后,你不能把这个字符中的某一部分改变。任何上面的函数改变了字符串后,都会返回一个新的字符串,原字串并没有变。其实这也是有变通的办法的,可以用S=list(S)这个函数把S变为由单个字符为成员的list,这样的话就可以使用S[3]='a'的方式改变值,然后再使用S=" ".join(S)还原成字符串