文章詳情頁
如何提高python查詢速度?
瀏覽:181日期:2022-06-29 18:39:57
問題描述
最近在爬股票的相關新聞,一開始設想的是,當有新的新聞動態發布,程序通過郵件發送最新內容到郵箱。
所以我想把新聞標題,內容存到數據庫里,當內容更新時,把新的內容和數據庫的標題列表對比,看是不是已存在的,如果已存在,那就不發送,如果沒有,那發送到郵箱。
但數量大了以后,列表查詢速度就會變慢,請問各位還有什么方法可以傳授下嗎?
問題解答
回答1:爬蟲任務去重
抓過的鏈接存到一個set中,檢查新鏈接是否在集合中即可。
回答2:去重有很多方法,比如樓上的set或者布隆過濾器都可以有效的使用內存,提升效率
相關文章:
1. 在應用配置文件 app.php 中找不到’route_check_cache’配置項2. html按鍵開關如何提交我想需要的值到數據庫3. gvim - 誰有vim里CSS的Indent文件, 能縮進@media里面的4. Android中能不能判斷一個數據庫是create來的,還是open來的?5. HTML 5輸入框只能輸入漢字、字母、數字、標點符號?正則如何寫?6. javascript - 請教如何獲取百度貼吧新增的兩個加密參數7. 跟著課件一模一樣的操作使用tp6,出現了錯誤8. PHP類屬性聲明?9. javascript - 求助canvas繪制馬賽克的問題,老是取色不準10. html - 微信瀏覽器h5<video>標簽問題
排行榜
