文章詳情頁

網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符？

瀏覽：233日期：2022-09-03 18:57:11

問題描述

import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html

比如這個爬蟲，輸出狀態碼是200。

可是直接訪問http://www.sxxrcs.com/was5/web/是404，抓包響應的也是404，請問這是為什么？

網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符？

問題解答

回答1：

用requests吧

import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2：

200正常啊，requests方便快捷。

Python 編程

上一條：python - 模擬滑動驗證碼，有源碼，求解下一條：python爬蟲時，抓取網頁遇到的問題？

相關文章：

1. 如何解決docker宿主機無法訪問容器中的服務？2. docker 下面創建的IMAGE 他們的 ID 一樣？這個是怎么回事？？？？3. require后不用使用echo返回到微信服務器嗎4. nginx - 如何將wordpress系統放在二級域名下5. javascript - 請問要如何修改 Node 的透明度嗎？6. javascript - 求助，nodeJS和koa2文檔對新手小白太不友好，一臉懵逼。。。7. css3 background顯示圖片的一部分8. vim中編輯HTML文件時換行不能縮進9. 在應用配置文件 app.php 中找不到’route_check_cache’配置項10. html按鍵開關如何提交我想需要的值到數據庫

排行榜

					
					如何解決docker宿主機無法訪問容器中的服務？
docker  下面創建的IMAGE 他們的 ID 一樣？這個是怎么回事？？？？
nginx - 如何將wordpress系統放在二級域名下
require后不用使用echo返回到微信服務器 嗎
css3 background顯示圖片的一部分
vim中編輯HTML文件時換行不能縮進
javascript - 請問要如何修改 Node 的透明度嗎？
javascript - 求助，nodeJS和koa2文檔對新手小白太不友好，一臉懵逼。。。
在應用配置文件 app.php 中找不到’route_check_cache’配置項
html按鍵開關如何提交我想需要的值到數據庫
想練支付寶對接和微信支付對接開發（Java），好像個人不可以，怎么弄個企業的
				

熱門標簽

成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符？