Python正則表達(dá)式如何匹配中文
用 ’[u4e00-u9fa5]‘ 匹配中文
在字符串中匹配中文
示例:
匹配字符串中的第一個(gè)中文字符
匹配字符串中的第一個(gè)連續(xù)的中文片段
匹配字符串中的所有中文字符
注:要確保正則字符和匹配文本是 unicode 范圍內(nèi)的編碼。
其他 擴(kuò)充 范圍
幾個(gè)主要非英文語(yǔ)系字符范圍:2E80~33FFh:中日韓符號(hào)區(qū)。收容康熙字典部首、中日韓輔助部首、注音符號(hào)、日本假名、韓文音符,中日韓的符號(hào)、標(biāo)點(diǎn)、帶圈或帶括符文數(shù)字、月份,以及日本的假名組合、單位、年號(hào)、月份、日期、時(shí)間等。3400~4DFFh:中日韓認(rèn)同表意文字?jǐn)U充A區(qū),總計(jì)收容6,582個(gè)中日韓漢字。4E00~9FFFh:中日韓認(rèn)同表意文字區(qū),總計(jì)收容20,902個(gè)中日韓漢字。A000~A4FFh:彝族文字區(qū),收容中國(guó)南方彝族文字和字根。AC00~D7FFh:韓文拼音組合字區(qū),收容以韓文音符拼成的文字。F900~FAFFh:中日韓兼容表意文字區(qū),總計(jì)收容302個(gè)中日韓漢字。FB00~FFFDh:文字表現(xiàn)形式區(qū),收容組合拉丁文字、希伯來(lái)文、阿拉伯文、中日韓直式標(biāo)點(diǎn)、小符號(hào)、半角符號(hào)、全角符號(hào)等。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. idea設(shè)置代碼格式化的方法步驟2. ajax異步讀取后臺(tái)傳遞回的下拉選項(xiàng)的值方法3. 關(guān)于ajax異步訪問(wèn)數(shù)據(jù)的問(wèn)題4. Vue打包部署到Nginx時(shí),css樣式不生效的解決方式5. Python 調(diào)用API發(fā)送郵件6. 聊一聊數(shù)據(jù)請(qǐng)求中Ajax、Fetch及Axios的區(qū)別7. ajax異步實(shí)現(xiàn)文件分片上傳實(shí)例代碼8. Vue組件通信$attrs、$listeners實(shí)現(xiàn)原理解析9. HTML iframe標(biāo)簽用法案例詳解10. 簡(jiǎn)單明了帶你了解CSS Modules
