href = tieba.baidu.com/p/3822565335
网络爬虫用到的前边我会,但是后面要是最后3位必须是数字,应该怎么写
前面必然是href = tieba.baidu再加上一串模糊代码,后面是10位数字,但是不确定,该怎么写才能和re.compile一起用呢,我试了半天一直报错
请问python中这个正则表达式应该怎么写
答案:2 悬赏:50
解决时间 2021-03-12 16:25
- 提问者网友:呆萌心雨
- 2021-03-12 07:02
最佳答案
- 二级知识专家网友:堕落奶泡
- 2021-03-12 07:10
>>> r = re.compile(r'tieba.baidu.*?(\d+)')
>>> r.findall("href = tieba.baidu.com/p/3822565335")
['3822565335']
>>> r.findall("href = tieba.baidu.com/p/3822565335")
['3822565335']
全部回答
- 1楼网友:迷人小乖乖
- 2021-03-12 08:26
如果是以=分割,没必要用正则啊,
in [1]: s=u'sd889=09=dfd=dd'
in [2]: s.split('=')
out[2]: [u'sd889', u'09', u'dfd', u'dd']
in [3]:如果解决了您的问题请采纳!
如果未解决请继续追问
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯