3000人名地名生僻字進字庫
摘要:原標題:3000人名地名生僻字進字庫 字庫漢字將超7萬個注:圖中“讀音”欄中的5表示輕聲。 本報記者 劉宇鑫 只因自己的名字里含有一個生僻字——
注:圖中“讀音”欄中的5表示輕聲。
本報記者 劉宇鑫
只因自己的名字里含有一個生僻字——“瓛”(音同“環”),多年來,銀行存折、火車票、社保卡、駕照等處都無法正確顯示全名,如今只要牽扯到電腦錄入姓名或核實身份證上的姓名,不得不耗費很長時間。市民邵先生反映的取名生僻字困擾有望在近期得到解決。
昨日,本報記者獨家從北京北大方正電子有限公司(下文簡稱“方正電子”)獲悉,方正電子確定承擔“中華字庫”中第17包“當代人名地名用字搜集與整理”和第20包“字庫制作一:中間字庫、宋體楷體等成果字庫”項目研發,前者預計會收集人口信息中3000個左右未編碼生僻字,該項目在明年年底完成后,可以有效解決取名生僻字在經濟社會中難通用的問題。
名字被五角星號替代
邵先生的名字中含有一個生僻字“瓛”,該字由王字旁及“獻”字組成,在由商務印書館出版的《現代漢語詞典》中收錄該字,詞典中解釋該字義為玉圭的一種,多用于人名。據他回憶,最初起這個名字是按照輩分排下來的,名字取“玉石”的寓意,至今已用了58年,雖然這個字一直都不常用,但年輕時辦很多手續都可以手寫,沒有對生活造成太多困擾。近年來,隨著計算機的普及,好多手續都需要電腦輸入信息,多個輸入法打不出他的名字,即使一些輸入法能打出來,程序卻不承認,這讓他感到非常不便。
在邵先生的證件中,僅有他身份證上的姓名完全正確;在多個銀行存折中,“瓛”字被五角星號代替,在社??榜{照中,該字為手寫添加;而在一些醫院的報銷單上該字被寫成了其他形似漢字;火車票中該字被拼音代替。
因為身份證上的姓名與其他證件上的姓名并不完全一樣,邵先生每次辦事時都需花費多于別人幾倍的時間。在銀行,別的窗口都辦完了十幾個人的業務了,他想取錢都需要找相關負責人,最后在存折名字旁蓋章才可以。為了節省時間,現在他都將錢放在銀行卡中,以至于每次出門都得加倍小心——就沖這個名字,銀行卡要是不小心丟了,掛失估計更麻煩。
字庫漢字明年超7萬個
像邵先生這樣的煩惱,很多名字中包含生僻漢字的市民也都遇到過,主要原因還是人口信息部門使用的字庫內容,與社會單位使用的字庫并不完全吻合。為此,“中華字庫”中專門啟動了針對當代人名地名用字的搜集與整理。
承擔該項目研發的方正電子字庫業務部副總經理黃學鈞介紹,“中華字庫”工程由相關部委推出,是一項引領中華文化步入信息化、數字化時代的先導性、奠基性工程。工程共分為28個包,近30家高校、研究院所和企業參與了研發工作。其中,方正電子承擔了第17包“當代人名地名用字搜集與整理”、第20包“字庫制作一:中間字庫、宋體楷體等成果字庫”的研發。方正電子承擔的第17包的主要任務是建立當代人名、地名用字字表與屬性庫,為“中華字庫”的字庫集成提供基礎資料。
說起收集生僻字,黃學鈞用“經驗豐富”來形容他的研發團隊,近年完成過多次同類項目:2011年,公安人口管理系統用字;2012年,第二代居民身份證用字;2013年,外交部電子護照用字。“計劃納入第17包的3000個字,我們也是根據相關部門的要求,將近年發現的人口身份信息中出現頻率較高的姓氏、人名、住址所在地生僻字,納入常用字庫中,同時為‘中華字庫’的字庫集成提供基礎資料。”他解釋說,這部分字庫計劃于明年年底前完成,屆時,字庫中的漢字總量將會超過7萬個。
給每個字都設一個“門牌號”
“不論是常用字還是生僻字,只有被納入到字庫當中,才算是找到家了。”在舉例時,黃學鈞說得最多的,就是給每個字都設一個門牌號,整個字庫相當于一個網格式的大廈。比如,“住”在大廈左上角的“啊”字,其字庫編碼為“B0A1”。然而,要讓一個個生僻字找到回家的路,其工作量遠不止這些。
根據“中華字庫”的編制要求,對搜集到姓氏、人名、地名用字進行查重整理后,建立相應的屬性數據庫,包括:序號、字形圖像、讀音、釋義、漢字描述序列、用途類別、姓氏、人名用字需注明民族和屬地信息,提交登記資料圖像、地名用字需注明從省級地名下溯到包含該字的地名,提交登記資料圖像。同時,本項目包資源搜集范圍應在公安、民政、教育、郵政、測繪、銀行等領域中選取,但必須包含公安和民政部門。搜集整理的姓氏、人名、地名用字盡可能覆蓋社會用字的實際需求。屬性數據庫的屬性項設置全面,標注完整,符合工程相關要求,差錯率小于萬分之一。
方正電子字庫業務部總經理張建國介紹,作為國內最大、市場占有率最高的字體廠商,方正電子在完成上述字庫項目后,將與“中華字庫”共同擁有知識產權。憑借商業推廣,這些生僻字有望在銀行、醫療、教育留學,乃至電商領域被廣泛使用,從而大大減少部分市民在經濟社會中為“名”所累的煩惱。
責任編輯:xmx
(原標題:北京日報)
查看心情排行你看到此篇文章的感受是:
版權聲明:
1.凡本網注明“來源:駐馬店網”的所有作品,均為本網合法擁有版權或有權使用的作品,未經本網書面授權不得轉載、摘編或利用其他方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:駐馬店網”。任何組織、平臺和個人,不得侵犯本網應有權益,否則,一經發現,本網將授權常年法律顧問予以追究侵權者的法律責任。
駐馬店日報報業集團法律顧問單位:上海市匯業(武漢)律師事務所
首席法律顧問:馮程斌律師
2.凡本網注明“來源:XXX(非駐馬店網)”的作品,均轉載自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如其他個人、媒體、網站、團體從本網下載使用,必須保留本網站注明的“稿件來源”,并自負相關法律責任,否則本網將追究其相關法律責任。
3.如果您發現本網站上有侵犯您的知識產權的作品,請與我們取得聯系,我們會及時修改或刪除。