我有一个像这样的字符串:
'Agendas / Schedules meetings and speakers 4 F 1928-1209 Box 2'
我正在尝试将其拆分为标签。尽管如果我使用 print repr(str)
进行打印,我只会在末尾看到特殊字符:
'Agendas / Schedules meetings and speakers 4 F 1928-1209 Box 2\r\n'
如果我尝试像 print re.split('\t+', str)
hoặc print re.split('\s+', str)
这样的东西,什么都没有被拆分,即输出仍然是:
['Agendas / Schedules meetings and speakers 4 F 1928-1209 Box 2\r\n']
如果正则表达式不起作用,是否有办法隔离这些固定宽度的项目?
更新:我希望只在较大的空白处进行拆分,所以 .split() 创建每个单词的列表元素并不是我想要的。
我过去遇到过几次,您可能遇到过零宽度空间.
>>> s = 'Agendas / Schedules meetings and speakers 4 F 1928-1209 Box 2'
>>> re.split(ur'[\u200b\s]+', s, flags=re.UNICODE)
['Agendas', '/', 'Schedules', 'meetings', 'and', 'speakers', '4', 'F', '1928-1209', 'Box', '2']
Tôi là một lập trình viên xuất sắc, rất giỏi!