文章詳情頁

python - 正則表達式匹配html的問題。

瀏覽：103日期：2022-09-05 14:29:29

問題描述

<dd class='gray6'> 中文 中文 中文內容 #需要抓取的內容</dd>用BeautifulSoup html.parser解析的網頁，現在用re模塊想抓取**第7行**的中文內容，放在一個組里面（.*?）。正則老是匹配不上，用換行符也匹配不上，不知道怎么寫了。。。

問題解答

回答1：

既然你都用bs4解析了，為什么不用它提取哪？bs4內有一個stripped_string的函數正好滿足你的需要。

回答2：

import repattern = re.compile(r’.*?(.*?)</dd>’, re.S)str = ’’’<dd class='gray6'> 中文 中文 中文內容 #需要抓取的內容</dd>’’’print(pattern.search(str).group(1))===> 中文內容 #需要抓取的內容回答3：

const re = /^(.*)</dd>$/

這樣可以不?

Python 編程

上一條：python - 這段函數如何改寫比較優雅?下一條：python - 如何在scrapy中帶cookie訪問？

相關文章：

1. 如何解決docker宿主機無法訪問容器中的服務？2. docker 下面創建的IMAGE 他們的 ID 一樣？這個是怎么回事？？？？3. require后不用使用echo返回到微信服務器嗎4. nginx - 如何將wordpress系統放在二級域名下5. vim中編輯HTML文件時換行不能縮進6. javascript - 請問要如何修改 Node 的透明度嗎？7. javascript - 求助，nodeJS和koa2文檔對新手小白太不友好，一臉懵逼。。。8. css3 background顯示圖片的一部分9. 在應用配置文件 app.php 中找不到’route_check_cache’配置項10. html按鍵開關如何提交我想需要的值到數據庫

排行榜

					
					如何解決docker宿主機無法訪問容器中的服務？
docker  下面創建的IMAGE 他們的 ID 一樣？這個是怎么回事？？？？
nginx - 如何將wordpress系統放在二級域名下
require后不用使用echo返回到微信服務器 嗎
css3 background顯示圖片的一部分
vim中編輯HTML文件時換行不能縮進
javascript - 請問要如何修改 Node 的透明度嗎？
javascript - 求助，nodeJS和koa2文檔對新手小白太不友好，一臉懵逼。。。
在應用配置文件 app.php 中找不到’route_check_cache’配置項
html按鍵開關如何提交我想需要的值到數據庫
想練支付寶對接和微信支付對接開發（Java），好像個人不可以，怎么弄個企業的
				

熱門標簽

成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

python - 正則表達式匹配html的問題。