概括字符集
import re
'''
概括字符集:只能匹配单个的字符
数字digit 0-9 : \d
非数字: \D
单词字符word数字、字母、下划线[0-9a-zA-Z_]: \w
. : 匹配除换行符\n之外其他所有字符
'''
import re
a = 'python1111java6789cpp'
r = re.findall('\d',a)
print(r) # ['1', '1', '1', '1', '6', '7', '8', '9']
r = re.findall('\D',a)
print(r) # ['p', 'y', 't', 'h', 'o', 'n', 'j', 'a', 'v', 'a', 'c', 'p', 'p']
r = re.findall('\w',a)
print(r)
# ['p', 'y', 't', 'h', 'o', 'n', '1', '1', '1', '1', 'j', 'a', 'v', 'a', '6', '7', '8', '9', 'c', 'p', 'p']
\W
很强大,可以匹配非数字字母下划线
import re
a = 'python\n11\r\t11&_-java6789 cpp'
# 匹配&
r = re.findall('\W',a)
print(r) # ['\n', '\r', '\t', '&', '-', ' ']
\s
只匹配空白字符(空格 换行、回车、制表), \S
匹配非空字符
import re
a = 'python\n11\r\t11&_-java6789 cpp '
# \s 只匹配空格 换行、回车、制表
r = re.findall('\s',a)
print(r) # ['\n', '\r', '\t', ' ', ' ', ' ']