近十萬(wàn)個(gè)
日常所使用的漢字只有幾千字。據(jù)統(tǒng)計(jì),1000個(gè)常用字能覆蓋約92%的書(shū)面資料,2000字可覆蓋98%以上,3000字則已到99%,簡(jiǎn)體與繁體的統(tǒng)計(jì)結(jié)果相差不大。
漢字是世界上最古老的文字之一,至少有四千多年的歷史,現(xiàn)存最早可識(shí)的成熟漢字系統(tǒng)是商代的甲骨文。漢字在形體上逐漸由圖形變?yōu)楣P畫(huà),象形變?yōu)橄笳?,?fù)雜變?yōu)楹?jiǎn)單;在造字原則上從表形、表意到形聲。除極個(gè)別的例外,都是一個(gè)漢字一個(gè)音節(jié)。漢字是意音文字,一個(gè)漢字通常表示漢語(yǔ)里的一個(gè)詞或一個(gè)語(yǔ)素,這就形成了音、形、義統(tǒng)一的特點(diǎn)。漢字是由筆畫(huà)構(gòu)成的方塊狀字,所以又叫方塊字。
在漢字計(jì)算機(jī)編碼標(biāo)準(zhǔn)中,最大的漢字編碼是臺(tái)灣地區(qū)的CNS11643,5.0版全字庫(kù)可供查詢的字共87,047個(gè)漢字、10771個(gè)拼音文字及894個(gè)符號(hào)。臺(tái)港民間通用的大五碼收錄繁體漢字13053個(gè)。GB18030是中華人民共和國(guó)現(xiàn)時(shí)最新的內(nèi)碼字集,GBK收錄漢字簡(jiǎn)體、繁體及20912個(gè),而早期的GB2312收錄簡(jiǎn)體漢字6763個(gè)。Unicode的中日朝(韓)統(tǒng)一表意文字基本字集則收錄漢字20902個(gè),總數(shù)亦高達(dá)七萬(wàn)多字。