成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python - beautifulsoup獲取網(wǎng)頁(yè)內(nèi)容的問題

瀏覽:192日期:2022-06-30 08:43:35

問題描述

我要的是這個(gè)里面的內(nèi)容<p class='talk-article__body talk-transcript__body'>

PYTHON代碼:

neirong=soup.find(’p’,{’class’:’talk-article__body talk-transcript__body’})

但是返回的結(jié)果是空。這個(gè)選擇器是不是寫錯(cuò)了?

問題解答

回答1:

neirong=soup.find_all(’p’,class_=’talk-article__body talk-transcript__body’)

https://www.crummy.com/softwa...

回答2:

參照:https://www.crummy.com/softwa...中給出的說明,正確的使用方式是:neirong=soup.find(’p’,class_=’talk-article__body talk-transcript__body’)

為了獲取p包含的內(nèi)容,進(jìn)一步調(diào)用neirong.contents即可

回答3:

neirong = soup.select(’.talk-article__body.talk-transcript__body’)回答4:

你從瀏覽器看到的內(nèi)容有js動(dòng)態(tài)生成的,用bs匹配不到,我發(fā)現(xiàn)看到的比較奇怪的class名基本都是js生成的

回答5:

使用find_all吧,find不能用于class

回答6:

個(gè)人覺得用BeautifulSoup來解析網(wǎng)頁(yè)的時(shí)候,如果樓主打算通過css特性來進(jìn)行元素的定位的話,最好還是使用soup.select(),這個(gè)方法可以用class的value當(dāng)參數(shù)也可以用標(biāo)簽的的attribute當(dāng)參數(shù),很方便,用于搜索單一標(biāo)簽最好用,同時(shí)參數(shù)支持css選擇器字符串,比如:soup.select('#id > .class a.title').

soup.find()方法目前好像用的不多,不知道是不是BeautifulSoup4棄用了?,F(xiàn)在一般只要出現(xiàn)find,就是find_all()等方法。以上詳細(xì)參考“超級(jí)湯”的中文文檔:http://beautifulsoup.readthed...

標(biāo)簽: Python 編程
相關(guān)文章: