“全息字典”:古今汉字任你查
快捷、权威、形象——准确查找一个难检字的相关信息再不用跑遍古籍阅览室,翻便“大部头”,只需轻点鼠标——登录汉字全息资源应用系统,点击现代通用字集,搜索要查找的字,不仅能够显示其现代字形、字音、字义信息,还可以查到该字从甲骨文、金文到篆书、楷书的历史字形演变过程,从《说文》《尔雅》《方言》《释名》一直到《康熙字典》等历代辞书对该字的释义,及其在一些常用古籍文献中被使用的情况。
日前,国家语委重大基础资源建设项目“通用汉字全息数据库建设”的标志性成果“汉字全息资源应用系统”正式启动上线。该项目旨在运用现代中文信息处理技术,构建一个具有多维关联关系、科学系统、高效实用的汉字全息数据库。
“无论是初学汉字的小学生,还是研究汉字的学者,系统都可以提供相应的帮助。”项目主持人、北京师范大学教授介绍,系统采用的多层级字集设计模式,包括常用字集、现代通用字集、古籍印刷通用字集、全字符集等。常用字集可以满足中小学基础教育领域的一般需要;现代通用字集可以满足社会文化领域一般汉字使用者的需要;古籍印刷通用字集面向具备一定古汉语知识、阅读一般古籍文献的用户;全字符集则可以满足汉字研究的专业人士需求,为专业研究提供支撑。
借助资源库,给汉字家族绘家谱
作为一名古文字爱好者和研究者,张华的书桌上摆满了各种字典、工具书——查找一个字在不同时期形、音、义的演变经常要翻阅多部“大部头”才能找到相对准确、权威的答案,而线上的一些汉字数据库很多又存在收录不全、权威性差等诸多问题。如今,“汉字全息资源应用系统”的正式上线可能让他再不用犯难——借助资源库,“古今汉字任你查”已不再是梦想。
本期上线的系统涵盖字符集4种,其中常用字集3500字,通用规范字8105字,古籍印刷字16490字,全字符集81722字;还有辞书20种,古籍文献60种,历代字形图415675个。其中包括大量的图形信息资源和文本信息资源,分别来自古文字拓片、文字编、规范字表、编码字符集、历代辞书、经典文献、中小学语文教材等,涵盖了古今各个时期文字的形、音、义、用、码五大方面的重要信息。
这一数据库,可以说是“海量”。如此庞大的信息量,是如何做到相互对应、关联的呢?
如果说建立数据库是给汉字家族绘制一张家谱,那么建立关联则是搞清谱系、辈分等关系。“首先是汉字属性的分解。构建一个具有多角度关系的汉字实用数据库,必须以汉字的属性作为基本的依托。”北京师范大学教授王宁指出,团队从20世纪90年始总结汉字的属性,除形、音、义之外,还增加码、用两个部分。码是汉字在计算机中的编码,用是汉字的使用,而且做了大量的属性细化研究,这样就有条件将笼统的汉字个体的资源库,改造为汉字的属性库,解决关联的多角度问题。
王宁解释:“其次是层次的确立,根据‘汉字效用递减率’,我们将汉字分为常用-通用-适用-罕用-无用5个层。第一、二层次涵盖36000字,以外的字只存记忆,不做深度开发,这样一方面可以在应用中扩大有用信息的使用度,另一方面将垃圾信息、无用信息退出关联,不干扰有效信息的集合和调用。”
“再次就是中介的寻求,我们继承传统语言学的研究成果,以《说文解字》的9353个小篆及其重文为中介来关联。古文字的确切识读,绝大部分是从《说文》开始的,这样就保证了不同形制、不同字体、不同时代汉字的最大限度关联。”王宁补充道,正是依靠《说文》小篆这些“核心家族成员”作联系,汉字家族内部不同族群的谱系才得以绘制在一起。
沟通古今,提供汉字准确属性信息
实现让通用规范汉字沟通古文字、繁体字,是该资源库的又一重要特征。据介绍,系统的主体字集是国家语委2013年公布的《通用规范汉字表》的8105个规范汉字及其关联字形。《通用规范汉字表》属于简化字系统,分为一级字表(即常用字表,3500字)、二级字表(3000字)、三级字表(1605字)。《通用规范汉字表》作为数据库子库的B库,直接和A库(传承字、繁体字和隶定字)关联,进而与小篆等古文字(C库)关联,从而实现了古今、简繁汉字的有效贯通。
如何保证对收录的每个汉字形、音、义解释的权威性?
介绍,系统的处理方法是:选取历代具有代表性的辞书,并选择最优的版本作为搭建框架的基础素材,以此为基础建构数据之间的深度关联。选择的辞书包括从《尔雅》《说文》《释名》《方言》《广韵》《集韵》《康熙字典》《汉语大字典》《新华字典》和《通用规范汉字字典》等。在字形方面,简化字的部首采用2009年国家语委发布的《汉字部首表》,即201个主形部首和99个附形部首,非简化字采用214部首体系,来源于《康熙字典》。简化字和繁体字的笔画数属性参考《通用规范汉字字典》等。结构类型(六书)属性参考《说文解字》。字音方面,现代汉语拼音和注音字母主要参考《通用规范汉字字典》和时期《国语辞典》等;近代音来源于《中原音韵》;中古音来源于《广韵》。字义方面,常用义项来源于《通用规范汉字字典》,并给出历代辞书的释义内容。
多种属性的综合呈现,可以加深人们对每个汉字的理解。比如“既然”的“既”和“即使”的“即”,在使用过程中容易混淆,但参考小篆字形就不会了——“既”是一个人背对着饭桌,表示吃完了,这个字就是表示已经发生了;而“即”是一个人正对着饭桌,靠近它,还没吃饭,所以是表示即将进行的。了解了这一层面,理解就加深了,也就很难出错了。
汉字不是一个个“孤零零”的符号,汉语文献正像躯体的血肉,丰富着汉字殿堂的内容。在每个字的“用例”一栏,系统选取具有代表性的传世文献作为古籍用例的来源,包括十三经、二十五史、二十二子等三大典籍系统,提取汉字在这些文献中的使用例句,供研究者参考使用。
多种检索,满足不同用户需求
与查字典类似,方便检索也是系统的一大特征。为方便使用者更便捷地输入需要检索的字,系统提供了单字、拼音、部首、部件、笔画等五种可输入的检索方式,使用者可以根据自己的喜好和需求,选取适合自己的方式。除单字检索外,还可以满足综合检索、专书检索和历代字形检索。
“你看,‘典’字是两只手捧着书卷,这多么形象,对于文史研究者来说用于研究也太方便了,我现在就想拥有。”刚刚演示完动画,现场主持人、北京师范大学文学院教授康震兴奋地说。
“资源库可作为文字和文化爱好者提高文化知识和综合素养的学习平台,为传统文化爱好者提供权威的学习内容;可以作为基础教育及汉语国际教育领域的教学平台,为学生学习、教师备课提供丰富的教学资源,从而更好地服务我国基础教育;可作为文字学及相关专业领域专家学者的科研平台,为专家学者提供对数据资源进行深度挖掘的工具,弥补传统手工获取资源、联系资源方式的局限;可作为汉字类数字化产品的开发平台,为开发者提供海量的经过专业学术加工的可靠汉字属性资源。”指出。(记者 周世祥 靳晓燕)
现如今用的汉字是几经简化之后了,繁体中文和简体中文除了汉字字形本身的变化,有些在词义上也有差异。收罗了50个常见的繁体字,认识下吧!
1、干——乾, 幹
表示干湿意义时,写作“乾”;表示枝干、才干、干事情等意义时,写作“幹”;表示盾牌(干戈)、触犯、干预时,写作“干”。但乾坤的乾不可以简化为“干”。
2、儿——兒
兒为象形字,像小孩扎髻之形
3、习——習
習本义为鸟类试飞,故从羽。郭沫若说从日是指在晴日学飞。
4、广——廣
廣本义为四周无壁之大屋,广为意符,是屋脊的意思。
5、马——馬
馬为象形字,像马头、髦尾、四足之形。
6、门——門
門为象形字,像门扇。
7、万——萬
萬本义为蝎子,为象形字,今作数字讲,是假借。
8、乡——鄉
据杨宽说,鄉字像两人对坐、共食的情况,其本义应为乡人共食。
9、义——義
为会意字,从我从羊,是我之威仪的意思。羊为祭祀仪式用品。
10、飞—— 飛
飛为象形字,像鸟飞翔之形。
11、办——辦
辦为治理之义,力为意符,表致力。
12、凤——鳳
鳳中间的部件是象形,早期甲骨文像凤鸟高冠、华翎、长尾之形。
13、开——開
開本义为开门,早期字形为以手开门栓之象。
14、厅——廳
廳本义为官府办公的地方,古称听事,后加广旁表意。今政府机构如教育厅,即取义于此。
15、贝——貝
上古用贝壳作货币,故表财务之字多以貝字为偏旁,貝在字中作为偏旁出现时,一般均简化为贝。
16、仓——倉
从食从口,口像仓形。甲骨文、金文的仓字像仓形,中有门户,以进出粮。
17、车—— 車
車为象形字,在字中作为偏旁出现时,一般均简化为车。
18、长——長
余永梁以为長像人发长貌,引申为长久之义。長字作为简化偏旁,在字中作为偏旁出现时,一般均简化为长。
19、队——隊
队为隊的古字,本为坠落义。
20、丰——豐
繁体字豐下半部分豆是一种高脚的器皿,上半部分表示盛放着饱满的谷物,表示丰收,而丰的本义是指草木茂盛,后来仅用在丰姿、丰采等词语中。
21、见—— 見
見为会意字,上目下人,即人用目看的意思。字中有目者多与眼睛有关,如看、瞧等。
22、双——雙
雙为会意字,一手捉两鸟即为雙。
23、乌——烏
烏象形字,孝鸟,即乌鸦,因乌鸦反哺,故友孝鸟之名。
24、云——雲
表示云彩意义时写作雲;表示“说”义时,写作云。
25、专——專
專本义为纺专,是收丝之器。甲骨文像手转动纺车纺线形。
26、电——電
電本为象形字,甲骨文字形是闪电发光的形象。后将甲骨文中的雨点变成了雨字头,就变成了现在的字形。
27、号——號
段玉裁说,啼號声高,故从号;虎哮声厉,故从虎。
28、让——讓
讓本为责让、责备之意。凡从言之字多与口有关。
29、帅—— 帥
本义为佩巾,故从巾。
30、叶——葉
原为象形字,金文像木上多叶之形。在古代,叶、葉是形音义完全不同的两个字。叶是协的古字,为和洽意,如叶韵。
31、东——東
東的甲骨文就像一个大口袋,金文像一个大口袋装满了东西,故本义为东西(物)。作为方向,是假借。
32、归——歸
歸本义为女子出嫁,故从止,从妇省(帚)。
33、节——節
節本义为竹节,故从节。
34、乐——樂
樂本是象形字,甲骨文是弦附木上的形象,像古代琴的样子。
35、圣——聖
聖为会意字、甲骨文的上部是人的一只大耳朵,右下部是一个口,左下部是一个面朝右而侧立的人。这表明,在上古,圣人就是耳聪口辩的人。
36、创——創
創本为象形字,金文像刀伤物有血,本义应是割。伤只能算引申义。
37、妇——婦
婦为会意字,手拿笤帚打扫的女子就是婦。
38、刚——剛
剛为会意字,有人以为是以刀断网之意。
39、后——後
表示前后意义时,写作後;表示皇后时,写作后。
40、划——劃
划船、划拳、划算用划;计划、划分、比划、笔划用劃。
41、问——問
問的字形是门内有口,表示在门内发问,为形声兼会意字。
42、兴——興
興的甲骨文的四角是四只手,中间抬着一个井字形器物,可见興就有抬举之义,为会意字。
43、虫—— 蟲
虫、口、 蟲皆是虫字,三个虫,以像其多;两个虫,是省笔;一个虫,是像其首尾之形。
44、当——當
当本义为对等、相当,引申出充当、当家等意义。
45、华——華
華就是现在的花字。金文華的上部就是花形,下部就是花蒂。
46、会——會
會本义为盖子,金文會的上部就是盖子的形状,下部是底,中间是装的东西。
47、孙——孫
孫字从丝,有子孙后代连绵不绝之义。
48、争——爭
爭的甲骨文、金文都是两手在争夺一物,故其本义为相争。
49、听——聽
聽本为会意字,金文从耳从口,口表发声,耳表闻声,今字形从耳从口(得),表示耳有所得。
50、怀——懷
懷字金文的字形象衣中有人,衣代表心,心中有人,是为怀。
copyright © 2022 一生命运网 版权所有 辽ICP备2022007116号-4
法律声明:本站文章来自网友投稿,不代表本站观点,版权归原创者所有,如果侵犯了你的权益,请通知我们,我们会及时删除侵权内容!