文章詳情頁(yè)
python - 用sklearn求大文本的tfidf特征?
瀏覽:156日期:2022-06-27 15:50:07
問(wèn)題描述
上面的數(shù)據(jù)是從reuters數(shù)據(jù)集中取得7303個(gè)訓(xùn)練集,用sklearn對(duì)其取tfidf特征,得到的結(jié)果都是0,這是怎么回事?
當(dāng)我從這些數(shù)據(jù)中取一部分時(shí),對(duì)于這些少部分?jǐn)?shù)據(jù)能夠得到正確的tfidf結(jié)果。
問(wèn)題解答
回答1:上代碼,可能是你精度太低或者min_count導(dǎo)致的
比如詞頻是1,總詞數(shù)1e9,對(duì)應(yīng)的tf就是1e-9,被忽略了。
相關(guān)文章:
1. 在應(yīng)用配置文件 app.php 中找不到’route_check_cache’配置項(xiàng)2. html按鍵開(kāi)關(guān)如何提交我想需要的值到數(shù)據(jù)庫(kù)3. HTML 5輸入框只能輸入漢字、字母、數(shù)字、標(biāo)點(diǎn)符號(hào)?正則如何寫?4. javascript - 請(qǐng)教如何獲取百度貼吧新增的兩個(gè)加密參數(shù)5. gvim - 誰(shuí)有vim里CSS的Indent文件, 能縮進(jìn)@media里面的6. 跟著課件一模一樣的操作使用tp6,出現(xiàn)了錯(cuò)誤7. PHP類屬性聲明?8. javascript - JS請(qǐng)求報(bào)錯(cuò):Unexpected token T in JSON at position 09. objective-c - ios 怎么實(shí)現(xiàn)微信聯(lián)系列表 最好是swift10. java - 安卓接入微信登錄,onCreate不會(huì)執(zhí)行
排行榜

熱門標(biāo)簽