python爬不同圖片分別保存在不同文件夾中的實(shí)現(xiàn)
例如,爬取趙麗穎,趙本山,趙文卓,趙歡,趙日天的圖片分別保存在趙麗穎,趙本山,趙文卓,趙歡,趙日天命名的文件夾中,
測(cè)試代碼別的圖就不放了
import requestsimport timeimport os# 請(qǐng)求頭,偽裝成瀏覽器headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36’}# keyword = ’云斑白條天牛’ # 關(guān)鍵字keywords = [’趙麗穎’,’趙本山’,’趙文卓’,’趙歡’,’趙日天’]max_page = 2i=1 # 記錄圖片數(shù)for keyword in keywords: os.makedirs(keyword) for page in range(1,max_page): page = page*30 # 網(wǎng)址 url = ’https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=’+keyword+’&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=©right=&word=’+keyword+’&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn=’+str(page)+’&rn=30&gsm=1e&1596899786625=’ # 請(qǐng)求響應(yīng) response = requests.get(url=url,headers=headers) # 得到相應(yīng)的json數(shù)據(jù) json = response.json() if json.get(’data’): for item in json.get(’data’)[:30]:# 圖片地址img_url = item.get(’thumbURL’)# 獲取圖片image = requests.get(url=img_url)# 下載圖片newstr = ’./’+keyword+’/’+str(i)+’.jpg’# with open(’./%s/%d.jpg’%keywords ,%i,’wb’) as f:with open(newstr,’wb’) as f: f.write(image.content) # 圖片二進(jìn)制數(shù)據(jù)time.sleep(1) # 等待1sprint(’第%d張%s圖片下載完成...’%(i,keyword))i+=1print(’End!’)你要修改的參數(shù)
將你想要爬的數(shù)據(jù)填入keywords 數(shù)組中即可
# 這里放你要查詢(xún)的數(shù)組keywords = [’’,’’,’’,’]
max_page是爬取百度圖片的頁(yè)數(shù),一頁(yè)是30張,這里寫(xiě)2的話(huà)就能爬30張,3能爬60張,以此類(lèi)推
max_page = 3你要的代碼
代碼如下:
import requestsimport timeimport os# 請(qǐng)求頭,偽裝成瀏覽器headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36’}# 這里放你要查詢(xún)的數(shù)組keywords = [’’,’’,’’,’]max_page = 4i=1 # 記錄圖片數(shù)for keyword in keywords: os.makedirs(keyword) for page in range(1,max_page): page = page*30 # 網(wǎng)址 url = ’https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=’+keyword+’&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=©right=&word=’+keyword+’&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn=’+str(page)+’&rn=30&gsm=1e&1596899786625=’ # 請(qǐng)求響應(yīng) response = requests.get(url=url,headers=headers) # 得到相應(yīng)的json數(shù)據(jù) json = response.json() if json.get(’data’): for item in json.get(’data’)[:30]:# 圖片地址img_url = item.get(’thumbURL’)# 獲取圖片image = requests.get(url=img_url)# 下載圖片newstr = ’./’+keyword+’/’+str(i)+’.jpg’# with open(’./%s/%d.jpg’%keywords ,%i,’wb’) as f:with open(newstr,’wb’) as f: f.write(image.content) # 圖片二進(jìn)制數(shù)據(jù)time.sleep(1) # 等待1sprint(’第%d張%s圖片下載完成...’%(i,keyword))i+=1 print(’End!’)
到此這篇關(guān)于python爬不同圖片分別保存在不同文件夾中的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)python爬圖片保存不同文件夾內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. Docker 容器健康檢查機(jī)制2. CSS3實(shí)現(xiàn)動(dòng)態(tài)翻牌效果 仿百度貼吧3D翻牌一次動(dòng)畫(huà)特效3. ASP.NET MVC使用正則表達(dá)式驗(yàn)證手機(jī)號(hào)碼4. Python requests庫(kù)參數(shù)提交的注意事項(xiàng)總結(jié)5. 詳細(xì)解析:關(guān)于PHP事件驅(qū)動(dòng)問(wèn)題6. php判斷一個(gè)請(qǐng)求是ajax請(qǐng)求還是普通請(qǐng)求的方法7. 基于python實(shí)現(xiàn)數(shù)組格式參數(shù)加密計(jì)算8. vue項(xiàng)目啟動(dòng)出現(xiàn)cannot GET /服務(wù)錯(cuò)誤的解決方法9. Rollup 簡(jiǎn)易入門(mén)示例教程10. python 爬取京東指定商品評(píng)論并進(jìn)行情感分析
