文章詳情頁

python - scrapy 爬取pages比實際進入items的多得多？

瀏覽：106日期：2022-07-23 10:55:26

2017-05-12 23:39:52 [scrapy.extensions.logstats] INFO:Crawled 3000 pages (at 61 pages/min), scraped 454 items (at 10 items/min)

為什么我使用scrapy爬取的時候訪問pages要比實際進入items的的多的多?就是爬了半天items里沒有幾條數據入庫的有什么辦法解決么？

問題解答

回答1：

重定向了，你看到了吧，重定向就得請求兩個頁面啊。還有就是看有不有頁面解析發生了錯誤。

Python 編程

上一條：算法 - python ahocorasick 從本地文件讀取文本，進行關鍵字匹配，匹配失敗下一條：運行python程序時出現“應用程序發生異?！钡膬却驽e誤？

相關文章：

1. android - weex 項目createInstanceReferenceError: Vue is not defined2. PHPExcel表格導入數據庫怎么導入3. android - 哪位大神知道java后臺的api接口的對象傳到前端后輸入日期報錯，是什么情況？求大神指點4. javascript - 如圖，百度首頁，查看源代碼為什么什么都沒有？5. pdo 寫入到數據庫的內容為中文的時候寫入亂碼6. vue2.0+webpack 如何使用bootstrap？7. PHP類封裝的插入數據，總是插入不成功，返回false；8. docker綁定了nginx端口外部訪問不到9. mac連接阿里云docker集群，已經卡了2天了，求問？10. ddos - apache日志很多其它網址，什么情況？

排行榜

					
					android - weex 項目createInstanceReferenceError: Vue is not defined
android - 哪位大神知道java后臺的api接口的對象傳到前端后輸入日期報錯，是什么情況？求大神指點
PHPExcel表格導入數據庫怎么導入
pdo  寫入到數據庫的內容為中文的時候寫入亂碼
javascript - 如圖，百度首頁，查看源代碼為什么什么都沒有？
vue2.0+webpack 如何使用bootstrap？
PHP類封裝的插入數據，總是插入不成功，返回false；
docker綁定了nginx端口 外部訪問不到
mac連接阿里云docker集群，已經卡了2天了，求問？
ddos - apache日志很多其它網址，什么情況？
javascript - 百度搜索網站，如何讓搜索結果顯示一張圖片加上一段描述，如圖；求教
				

熱門標簽

成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

python - scrapy 爬取pages比實際進入items的多得多？

python - scrapy 爬取pages比實際進入items的多得多？