精通Python自然语言处理pdf免费下载
前言
python本身使用 \ 来转义一些特殊字符,比如在字符串中加入引号的时候
s = 'i\'m superman' print(s) # i'm superman
为了防止和字符串本身的引号冲突,使用 \ 来转义,一般情况下这个也不会引起什么问题,但是当你要使用 \ 来转义 \ 的时候,就比较混乱了,比如我们想要输出一个 \ ,得写两个 \ ,否则会报语法错误,因为 \ 把后面的引号给转义了,必须使用 \
# 错误写法 # print '\' # 正确写法 print('\\') # \ # 原生字符串 print(r'\\') # \\
将 \ 转义一下使其不具备转义功能,才可以正确输出,当使用原生字符串的时候,输出显示了两个 \ ,看起来好像是写几个输出几个的样子,如果这样想的话,你可以试一下,看能不能输出奇数个 \。
补充――――――――――――――――――
python的原生字符串不能以反斜杠结尾的问题
Python的原生字符串(raw string)是个很有用的东西,可以少写很多反斜线(转义符号)。
不过它有个著名的bug,就是不能以反斜线结尾,这让人很无语。今天突然发现General Python FAQ里有进行说明,并给出了解决办法。
首先要澄清的是不是不能以反斜线结尾,而是不能以奇数个反斜线结尾。
其次,这个bug的原因是一些处理器(例如主要的正则表达式引擎)希望进行它们自己的反斜线转义处理,而这些处理器不允许字符串以未匹配的反斜线结尾。
最后,解决办法就是把反斜线放在另一个字符串里,Python会自动进行合并:
dir = r"\this\is\my\dos\dir" "\\"
补充结束――――――――――――――――――
虽然原生字符串不是很完美,但是它已经可以帮我们解决很大一部分的问题了。比如当你想匹配"\"的时候,原生字符串可以让你至少少写一半的\,即节省代码量,又增加了可读性。
import re _string = '\\\\' print(_string) # \\ # 字符串 for i in re.findall('\\\\', _string): print(i) # \ # \ # 原生字符串 for i in re.findall(r'\\', _string): print(i) # \ # \
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对谷谷点程序的支持。
转载请注明:谷谷点程序 » python中的反斜杠问题深入讲解