漢字為什么可以借助筆順編碼精準(zhǔn)排序?因?yàn)椋?/span> 1)一個(gè)理想的漢字排序必須做到每個(gè)漢字只出現(xiàn)一次,并且比較任意兩個(gè)漢字你知道哪個(gè)漢字應(yīng)該排在前面,哪個(gè)漢字應(yīng)該排在后面。 2)一個(gè)漢字對(duì)應(yīng)一個(gè)英語(yǔ)單詞(也可看作一個(gè)英文字),而漢字的筆畫(huà)對(duì)應(yīng)英語(yǔ)單詞(英文字)的字母。只要把漢字筆畫(huà)之間的順序規(guī)定下來(lái),漢字根據(jù)其規(guī)范了的筆順就自動(dòng)排成了序列。對(duì)于筆畫(huà)、筆順都完全相同的漢字,則依據(jù)其音序排列。 3)將漢字的筆畫(huà)對(duì)應(yīng)英語(yǔ)的字母,這是一個(gè)有相當(dāng)難度的一項(xiàng)工作。為什么?因?yàn)?首先,該編碼必須把所有的筆畫(huà)筆形包含其中,不能有一個(gè)遺漏。其次,代碼和筆畫(huà)筆形之間的關(guān)系一一對(duì)應(yīng),不能有絲毫的混淆。例如: 代碼C表示“橫豎橫”和“乙形”兩種筆畫(huà),而“乙形”筆畫(huà)又包含多種筆形,例如“乙”字的筆畫(huà)、“九”第二畫(huà)、“飛”第一畫(huà),這三字中的相關(guān)筆畫(huà)它們的筆形有相似性,但不完全一樣,而且很難各自給這些筆形以精確的描述和統(tǒng)一規(guī)范的名稱(chēng)。 代碼D表示“橫豎橫豎”和“異形”兩種筆畫(huà),其中“橫豎橫豎”這一筆畫(huà)只有“凸”字里面有(第四畫(huà)),而“異形”指一些怪異的筆畫(huà)筆形,如“〇”這個(gè)字的筆畫(huà)就是這種。而且,這個(gè)“〇”的筆形,與“凸”字里面“橫豎橫豎”或“橫折折折”這一筆形,歸類(lèi)一起,是完全符合邏輯的。因?yàn)椤皺M折折折”就是三折,而“〇”這一筆形表示無(wú)限多折(三折以上),當(dāng)然它們可以歸為一種筆畫(huà)。 代碼M表示“豎折折”(“虧”字第三畫(huà))、“豎折折鉤”(“專(zhuān)”字第三畫(huà))等筆形。注意,在這里帶鉤和不帶鉤的兩種筆形被看作一種筆畫(huà),使用同一個(gè)代碼。 把雖然不完全一樣但有相似性的筆形,劃歸為一種筆畫(huà),用某一個(gè)英文字母作代碼,如上述的C、D、M。這種模糊化處理是必須的,因?yàn)闈h字的筆畫(huà)筆形太復(fù)雜多樣了。如果每一種筆形都用一個(gè)字母代碼,勢(shì)必造成字母不夠用的情況,而且會(huì)帶來(lái)難以記住的困難。 筆順碼的筆形歸類(lèi)、筆畫(huà)劃分除了模糊化處理外,也有精確化處理。例如,傳統(tǒng)的“點(diǎn)”這一筆畫(huà),在筆順碼中則分為“左點(diǎn)”和“右點(diǎn)”,分別以代碼“Y”、“Z”表示。傳統(tǒng)的“捺”這一筆畫(huà),在筆順碼中則分為“捺”和“提捺”,分別以代碼“T”、“X”表示。一般的處理原則是:近端(或始端)精確,遠(yuǎn)端(或尾端)模糊。 總之,這些筆形筆畫(huà)和代碼的設(shè)置是非常巧妙、智慧和富有創(chuàng)意的。 3)胡喬木說(shuō):“我們要盡可能使?jié)h字成為一種'拼形’的文字。”漢字信息化技術(shù)方面的資深專(zhuān)家許壽椿教授曾著文說(shuō):“英文等拼音文字的字母是基元性的,即字母是最小單位,不能夠、不需要再進(jìn)一步拆分。而漢字是可以也需要拆分的,它不是基元性的。”漢字筆順碼,實(shí)際上就是做了一件把漢字拆分為筆畫(huà)序列的工作,這是一種以部件(筆畫(huà))結(jié)構(gòu)來(lái)發(fā)掘漢字的規(guī)律性的一項(xiàng)工作。 4)筆順碼最初是作為“挑戰(zhàn)部首”的形象出現(xiàn)的,這可以從筆順碼發(fā)明者出版的書(shū)《漢字新序——挑戰(zhàn)部首檢字》(武漢出版社,2008.5)看出。說(shuō)是“挑戰(zhàn)”,是從創(chuàng)新發(fā)明的角度來(lái)說(shuō)的,但筆者認(rèn)為,既是挑戰(zhàn),也是傳承。筆順碼查檢法什么地方傳承了部首查檢法?它傳承了部首查檢法的以形研字、以形查字的傳統(tǒng),即是說(shuō),它們都是從字的形態(tài)為出發(fā)點(diǎn)的。只不過(guò)部首查檢法是以漢字的中間部件(偏旁)為基礎(chǔ)的,而筆順碼查檢法是以漢字的最小最基本部件(筆形筆畫(huà))為基礎(chǔ)的。正因?yàn)槎哂幸欢ǖ膫鞒行?,所以使用筆順碼編纂的字典也像使用部首編纂的字典有類(lèi)似的地方,譬如,所有具有相同偏旁的的漢字都放在了一起,雖然兩種字典相同偏旁的字的排列次序不一樣。其實(shí),筆順碼查檢法的真正挑戰(zhàn)對(duì)象是拼音查檢法,因?yàn)槠匆舨闄z法是在工業(yè)化時(shí)代西方“以語(yǔ)音為中心”的錯(cuò)誤的文字學(xué)說(shuō)的大環(huán)境下的產(chǎn)物;而且,從使用實(shí)踐的角度說(shuō),拼音查檢法是一種沒(méi)有多少實(shí)用價(jià)值架子,因?yàn)槟阋榈淖只旧隙际遣恢?、不?huì)讀的,你怎么查?最后還是要依賴(lài)部首查檢。而且該類(lèi)字典常常附以一個(gè)以“〇”打頭的接近300個(gè)字的“難檢字筆畫(huà)索引”表,有這么多難檢字,從這一點(diǎn)就可以認(rèn)為這類(lèi)查檢法不是很有效、很理想的的查檢法。 (《筆順碼字典》編委 溫羅發(fā)20190928)
|