中易网

python中正则和beautifulsoup的使用

答案:1 悬赏:0

解决时间 2021-02-22 01:04

提问者网友：话酸浅沫
2021-02-21 16:15

网页内容：有很多类似于<p>...</p>的东西，但是我只想要类似于
<h4>overview（可以是别的）</h4>
<p>想要的</p>
不想要类似于<p><strong>内容</strong> 内容</p>
另外再请教大神们：利用beautifulsoup中利用soup.get-text（）返回的值是什么类型的队列还是字符串还是什么？

最佳答案

二级知识专家网友：转身后的回眸
2021-02-21 17:36

你是要<p></p>里面没有其他标签的？还是要吧p里面的标签也去掉？
去掉字符串中的标签用
re.compile('\<.*?\>').sub('', 目标字符串)
查找所有p 用re.findall('<p>[\s\S]*?</p>',html)
查找里面没有其他标签的p，用re.findall( '<p>[^\<\>]*？></p>' , html )

另外 get-text 获得的是字符串

我要举报

如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息，可以点下面链接进行举报！

大家都在看

• 甲状腺腺瘤切除对身体危害大吗?

• 有一个有声小说里面讲的是一个都市女孩去西藏

• 蕙之魅我想知道这个在什么地方

• 14岁女孩不穿小背心可以吗？

• E3 1230V3带的动 gtx960sli麽？大概要多大电

• 我家装修厨房是白色的方格瓷砖用的黑色的勾缝

• 金源门业怎么去啊，有知道地址的么

• 柳关烈士陵园怎么去啊，有知道地址的么

• 昆仑山矿泉水取货点(白塔西路店)地址在什么地

• 邮政路/铁路街(路口)地址有知道的么？有点事

• 请问江西赣州到河北白沟要怎么做车最省钱而且

• 诺基亚手机以前有个小游戏，小球冒险可以变石

• 雷州市龙门镇羊觅管理区演家内村属于哪个派出

• 我是买张全国流量最便宜的手机卡订全国套餐用

• 整体厨房有哪几种设计风格？

推荐资讯

• 我是1987年闰6月21日阳历1987年8月15日出生的

• DCS黑屏处理常说的DCS黑屏是什么意思

• 关于初中生活的美文和关于曼德拉的演讲稿

• 勇根家电在什么地方啊，我要过去处理事情

• 市场上的饲料出现这样的结块，什么原因

• 苏家桥地址有知道的么？有点事想过去

• 关于汉武帝在民间的姐姐

• 创维电视童锁解除方法

• ZARA的包包专卖店一般在什么价位？

• 铭族净水器专卖店地址在什么地方，想过去办事

• 洛阳老子纪念馆售票处在哪里啊，我有事要去这

• 辣上云霄烤吧在什么地方啊，我要过去处理事情

• 手机登qq时，显示手机磁盘不足，清理后重新登

• 刺客的套装怎么选啊？

网站首页 | 关于我们 | 网站留言

联系中易网
Copyright © 2024 中易网版权所有