多个界定符分割字符串

网友投稿 393 2022-09-23

多个界定符分割字符串

你需要将一个字符串分割为多个字段,但是分隔符(还有周围的空格)并不是固定的。

​​re.split()​​ 方法分割字符串

​​string​​​ 对象的 ​​split()​​​ 方法只适应于非常简单的字符串分割情形, 它并不允许有多个分隔符或者是分隔符周围不确定的空格。 当你需要更加灵活的切割字符串的时候,最好使用 ​​re.split()​​ 方法:

>>> line = 'asdf fjdk; afed, fjek,asdf, foo'>>> import re>>> re.split(r'[;,\s]\s*', line)['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']

函数 re.split() 是非常实用的,因为它允许你为分隔符指定多个正则模式。 比如,在上面的例子中,分隔符可以是逗号,分号或者是空格,并且后面紧跟着任意个的空格。 只要这个模式被找到,那么匹配的分隔符两边的实体都会被当成是结果中的元素返回。 返回结果为一个字段列表,这个跟 ​​str.split()​​ 返回值类型是一样的。

注意捕获分组

当你使用 re.split() 函数时候,需要特别注意的是正则表达式中是否包含一个括号捕获分组。 如果使用了捕获分组,那么被匹配的文本也将出现在结果列表中。比如,观察一下这段代码运行后的结果:

>>> fields = re.split(r'(;|,|\s)\s*', line)>>> fields['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']>>>

获取分割字符在某些情况下也是有用的。 比如,你可能想保留分割字符串,用来在后面重新构造一个新的输出字符串:

>>> values = fields[::2]>>> delimiters = fields[1::2] + ['']>>> values['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']>>> delimiters[' ', ';', ',', ',', ',', '']>>> # Reform the line using the same delimiters>>> ''.join(v+d for v,d in zip(values, delimiters))'asdf fjdk;afed,fjek,asdf,foo'

非捕获型括号

如果你不想保留分割字符串到结果列表中去,但仍然需要使用到括号来分组正则表达式的话, 确保你的分组是非捕获分组,形如 (?:…) 。比如:

>>> re.split(r'(?:,|;|\s)\s*', line)['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']>>>

参考

​​​​​http://python3-cookbook.readthedocs.io/zh_CN/latest/c02/p01_split_string_on_multiple_delimiters.html​​

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:《狼殿下》幕后故事:肖战自曝拍摄经历,感觉自己有很大进步!
下一篇:VS2017下OpenCV 64位配置和ROI区域图像叠加&初级图像混合
相关文章

 发表评论

暂时没有评论,来抢沙发吧~