要查询一个汉字的意思,你是选择“部首检字法”还是“音序检字法”?是否觉得要翻几十页的检字表很麻烦?有位退休语文教师首创了一种“汉字数处理法”,用这一方法编写的《汉数字典》连检字表都没有,不会拼音没关系,不认识这个字也不要紧,只要你会数笔画就能查字。
传统检字法太繁琐
首创“笔画数码检字法”
“检字法”即查字法,是工具书或其他书里的文字排列次序的检查方法。我们常用的检字法有“部首检字法”“音序检字法”“笔画检字法”等。我们一般要查只知道读音而不知道写法或意义的字,会使用“音序检字法”,根据一个字的汉语拼音第一个字母,在“汉语拼音音节表”中找到这个字的拼音音节在正文中的页码,再按照这个字的声调到那一页中去找。要查只知道写法而不知道读音和意义的字,会用到“部首查字法”,查字时首先要确定这个字的部首,然后从字典的“部首目录”中查出属于这个部首的字在部首检字表中的页码,再按照这个字除部首以外部分的笔画数,从正文中找到它。而遇到读音不知道、部首又不明显的字,只要数准字的笔画,就可以在字典的“难查字笔画索引”中查到这个字在正文中的页码。这样看来,传统检字法查询一个汉字一般都需要多个步骤、翻找多次页码才能找到,步骤繁琐、检字速度较慢。翻看《现代汉语词典》目录可以发现,其中“音节表”从第6到第11页,“部首检字表”从第13页到71页,光检字表的目录就有60多页,十分冗长。
那有没有一个检字法可以提高检索汉字的速度和准确度,让每个人尤其是不会拼音的人也能很快检索到汉字呢?小学语文高级教师邹伟成长期从事教育工作,业余又致力于小学生字学研究。他在多年的教学经验中就琢磨出了一套简便快捷的检字法。据邹伟成介绍,他在1994年曾出版了一本《小学生生字笔画笔顺》,作为小学生自学生字的工具书,该书共收录了小学语文课本中出现的汉字和国家规定的常用汉字3900个,每个字目包括字形、拼音音节、笔画数、笔顺、字义。这本书就首次采用了邹伟成首创的“笔画数码检字法”,邹先生用笔画数码,结合偏旁,将汉字顺序重新编后,创制了全新的一种检字表。这项检字方法使得原来需要60多页的检字表,缩减到只需要2页,大大节省了页数,简化了检字方法,提高了检字速度。巧的是,这本书的出版还曾登上过当年的《无锡日报》。
“检字规则”只有一页 只要会数笔画就能查字
邹伟成拿出用“笔画数码检字法”重新编排的第一版字典《汉数学生字典》展示给记者看,这本字典他花了大概半年时间,当时因为条件简陋,每一个词条都是他从《新华字典》上裁剪下来后,根据“笔画数码检字法”重新排序拼贴好再扫描打印出来的,这本字典可以说是2.0版,已经取消了检字表,根据规则直接翻找即可。自2004年退休后,邹伟成一直用的就是自创的这套“检字法”字典,方便好用,只要会数笔画,就能快捷地查字,而这本自制的字典一用就是十年,从磨损的程度也可以看出使用频率很高。
近几年,根据使用中的一些问题,邹伟成又进行了改良和优化,这套检字法也更加完善了,这本最新的收录了9000多字的《汉数字典》就是3.0版,更加正规。这本《汉数字典》A4大小,正文一共有152页。检字规则很简单,精简到只有一页内容,“合体字”包括“两个原则”和“六个规定”,“独体字”则分三类情况处理,根据规则就能很快上手。字典页眉上的数码是检字数码,页脚的数码是书页码,也就是说根据检字方法得到的该字数码对照页眉的数码来翻找即可,检字码相同的字均排列在同一数码的书页上供查检。比如“江南晚报”这四个字,“江”是左右结构,左、右部分的笔画数分别是3和3,“江”的检字数码就是“33”。“南”字符合“六个规定”中第3条,即字的结构中没有独立字结构的,开头笔画是“十”,则其数码之左是“2”,剩余结构的笔画数“7”就是数码之右,“南”的检字数码就是“27”。同理,“晚”和“报”都是左右结构,两字的检字数码分别是“47”和“34”。根据得到的检字数码,对照每页页眉显示的数码就可以查询到该字了。
邹先生仅解释了两三分钟,记者即领悟其方法,经过简短试验,感到确实比传统查字法简单易学且查询速度快,尤其适合不会拼音的人使用或者查询不认识的字。邹伟成将这一检字法命名为“汉字数处理法”,他介绍说这是一种可以给全体汉字一一确定数码的方法,应用这一方法,邹伟成还编写了成语、歇后语、篆书、隶书、楷书、行书、草书字典等,他认为用此方法还可以开发一系列纸质的、电子的汉字文化产品。
汉字研究永无止境 望建多学科合作平台
邹伟成今年已经75岁,是无锡邹氏35世梁塘支裔,曾经是东土夅实验小学高级语文教师。邹伟成介绍,他从1992年就开始研究“汉字数处理”了,当时的目的很简单,就是想缩减检字表页码,节约版面、节省成本。邹伟成研究汉字和“汉字数处理法”至今已近30年,2004年退休以后,邹伟成也没有停下研究的脚步,除了日常家务事外,他的时间都花在了学习和研究上。除了研究“汉字数处理”方法以及和汉字相关的一些课题,他还研究邹氏文化、处理家族事务等,每天都过得忙碌而充实,不比退休前轻松。邹伟成现任无锡邹氏第八巡大统宗谱续修委员会主任、无锡邹氏文化研究会会长、无锡祠堂文化研究会理事、无锡谱牒文化研究会常务理事等,还主持编写了《无锡邹氏文化研究丛书》《无锡邹氏文影》等。
邹伟成说,随着年龄增长,渐渐跟不上时代发展速度,很多事情也有心无力了,他还有很多课题希望有朝一日有专业人士能继续研究开发出来,比如让“汉字数处理”跟计算机编码相结合应用、计算机汉数声控码的设想、开发汉数书法创作训练软件、多学科合作组建学习汉字文化(互联网+汉字)平台等等。他现如今的心愿就是希望“汉字数处理”方法能被大众所熟知、认可,并且得到广泛应用,他很欢迎感兴趣的读者能跟他沟通交流,他愿意赠送《汉数字典》给需要的人学习使用。(晚报记者 潘凡/文、摄)
现在很多人喜欢用名字的笔画来测定人生命运之丕泰好坏吉凶,包括为孩子起名字的时候也在计算孩子的姓名笔画数,希望好的名字给孩子带来好运。所以姓名的一笔一划,都不能忽视。但你的名字究竟有多少画呢?估计大多数人还不能正确数出姓名的笔画数。下面我们来看看名字的笔画数到底该怎么算。
第一,如果这个汉字为简化字,则一定要用繁体字的笔画来计算,决不能用简化字。
第二,数字本身有数理,其笔画数应按数理计算。就是凡名字中含有数字的,则按以下下笔画计算方法:
一1画;二2画;三 3画;四 4画;五 5画;六 6画;七 7画;八 8画;九 9画;十10画;百6画;千3画;万3画
第三,凡含有以下部首的字文字,要按照以下笔划算:
扌(手)提手旁,以手字计画为4画。
忄(心)竖心旁,以心字计画为4画。
氵(水)三点旁,以水字计画为4画。
犭(犬)犬字旁,以犬字计画为4画。
礻(示)示字旁,以示字计画为5画。
王(玉)玉字旁,以玉字计画为5画。
艹(草)草字头,以草字计画为6画。
衤(衣)衣字旁,以衣子计划为6画。
月(肉)月字旁,以肉字计画为6画。
辶(走)走字旁,以走字计画为7画。
阝(阜)左耳旁,以阜字计画为8画。
阝(邑)右耳旁,按邑字计画为7画。
以上计算方法只在为文字部首时生效,如果不作为文字部首,则按照实际笔画数计算。
你算出你的名字多少画了吗?
“全息字典”:古今汉字任你查
快捷、权威、形象——准确查找一个难检字的相关信息再不用跑遍古籍阅览室,翻便“大部头”,只需轻点鼠标——登录汉字全息资源应用系统,点击现代通用字集,搜索要查找的字,不仅能够显示其现代字形、字音、字义信息,还可以查到该字从甲骨文、金文到篆书、楷书的历史字形演变过程,从《说文》《尔雅》《方言》《释名》一直到《康熙字典》等历代辞书对该字的释义,及其在一些常用古籍文献中被使用的情况。
日前,国家语委重大基础资源建设项目“通用汉字全息数据库建设”的标志性成果“汉字全息资源应用系统”正式启动上线。该项目旨在运用现代中文信息处理技术,构建一个具有多维关联关系、科学系统、高效实用的汉字全息数据库。
“无论是初学汉字的小学生,还是研究汉字的学者,系统都可以提供相应的帮助。”项目主持人、北京师范大学教授介绍,系统采用的多层级字集设计模式,包括常用字集、现代通用字集、古籍印刷通用字集、全字符集等。常用字集可以满足中小学基础教育领域的一般需要;现代通用字集可以满足社会文化领域一般汉字使用者的需要;古籍印刷通用字集面向具备一定古汉语知识、阅读一般古籍文献的用户;全字符集则可以满足汉字研究的专业人士需求,为专业研究提供支撑。
借助资源库,给汉字家族绘家谱
作为一名古文字爱好者和研究者,张华的书桌上摆满了各种字典、工具书——查找一个字在不同时期形、音、义的演变经常要翻阅多部“大部头”才能找到相对准确、权威的答案,而线上的一些汉字数据库很多又存在收录不全、权威性差等诸多问题。如今,“汉字全息资源应用系统”的正式上线可能让他再不用犯难——借助资源库,“古今汉字任你查”已不再是梦想。
本期上线的系统涵盖字符集4种,其中常用字集3500字,通用规范字8105字,古籍印刷字16490字,全字符集81722字;还有辞书20种,古籍文献60种,历代字形图415675个。其中包括大量的图形信息资源和文本信息资源,分别来自古文字拓片、文字编、规范字表、编码字符集、历代辞书、经典文献、中小学语文教材等,涵盖了古今各个时期文字的形、音、义、用、码五大方面的重要信息。
这一数据库,可以说是“海量”。如此庞大的信息量,是如何做到相互对应、关联的呢?
如果说建立数据库是给汉字家族绘制一张家谱,那么建立关联则是搞清谱系、辈分等关系。“首先是汉字属性的分解。构建一个具有多角度关系的汉字实用数据库,必须以汉字的属性作为基本的依托。”北京师范大学教授王宁指出,团队从20世纪90年始总结汉字的属性,除形、音、义之外,还增加码、用两个部分。码是汉字在计算机中的编码,用是汉字的使用,而且做了大量的属性细化研究,这样就有条件将笼统的汉字个体的资源库,改造为汉字的属性库,解决关联的多角度问题。
王宁解释:“其次是层次的确立,根据‘汉字效用递减率’,我们将汉字分为常用-通用-适用-罕用-无用5个层。第一、二层次涵盖36000字,以外的字只存记忆,不做深度开发,这样一方面可以在应用中扩大有用信息的使用度,另一方面将垃圾信息、无用信息退出关联,不干扰有效信息的集合和调用。”
“再次就是中介的寻求,我们继承传统语言学的研究成果,以《说文解字》的9353个小篆及其重文为中介来关联。古文字的确切识读,绝大部分是从《说文》开始的,这样就保证了不同形制、不同字体、不同时代汉字的最大限度关联。”王宁补充道,正是依靠《说文》小篆这些“核心家族成员”作联系,汉字家族内部不同族群的谱系才得以绘制在一起。
沟通古今,提供汉字准确属性信息
实现让通用规范汉字沟通古文字、繁体字,是该资源库的又一重要特征。据介绍,系统的主体字集是国家语委2013年公布的《通用规范汉字表》的8105个规范汉字及其关联字形。《通用规范汉字表》属于简化字系统,分为一级字表(即常用字表,3500字)、二级字表(3000字)、三级字表(1605字)。《通用规范汉字表》作为数据库子库的B库,直接和A库(传承字、繁体字和隶定字)关联,进而与小篆等古文字(C库)关联,从而实现了古今、简繁汉字的有效贯通。
如何保证对收录的每个汉字形、音、义解释的权威性?
介绍,系统的处理方法是:选取历代具有代表性的辞书,并选择最优的版本作为搭建框架的基础素材,以此为基础建构数据之间的深度关联。选择的辞书包括从《尔雅》《说文》《释名》《方言》《广韵》《集韵》《康熙字典》《汉语大字典》《新华字典》和《通用规范汉字字典》等。在字形方面,简化字的部首采用2009年国家语委发布的《汉字部首表》,即201个主形部首和99个附形部首,非简化字采用214部首体系,来源于《康熙字典》。简化字和繁体字的笔画数属性参考《通用规范汉字字典》等。结构类型(六书)属性参考《说文解字》。字音方面,现代汉语拼音和注音字母主要参考《通用规范汉字字典》和时期《国语辞典》等;近代音来源于《中原音韵》;中古音来源于《广韵》。字义方面,常用义项来源于《通用规范汉字字典》,并给出历代辞书的释义内容。
多种属性的综合呈现,可以加深人们对每个汉字的理解。比如“既然”的“既”和“即使”的“即”,在使用过程中容易混淆,但参考小篆字形就不会了——“既”是一个人背对着饭桌,表示吃完了,这个字就是表示已经发生了;而“即”是一个人正对着饭桌,靠近它,还没吃饭,所以是表示即将进行的。了解了这一层面,理解就加深了,也就很难出错了。
汉字不是一个个“孤零零”的符号,汉语文献正像躯体的血肉,丰富着汉字殿堂的内容。在每个字的“用例”一栏,系统选取具有代表性的传世文献作为古籍用例的来源,包括十三经、二十五史、二十二子等三大典籍系统,提取汉字在这些文献中的使用例句,供研究者参考使用。
多种检索,满足不同用户需求
与查字典类似,方便检索也是系统的一大特征。为方便使用者更便捷地输入需要检索的字,系统提供了单字、拼音、部首、部件、笔画等五种可输入的检索方式,使用者可以根据自己的喜好和需求,选取适合自己的方式。除单字检索外,还可以满足综合检索、专书检索和历代字形检索。
“你看,‘典’字是两只手捧着书卷,这多么形象,对于文史研究者来说用于研究也太方便了,我现在就想拥有。”刚刚演示完动画,现场主持人、北京师范大学文学院教授康震兴奋地说。
“资源库可作为文字和文化爱好者提高文化知识和综合素养的学习平台,为传统文化爱好者提供权威的学习内容;可以作为基础教育及汉语国际教育领域的教学平台,为学生学习、教师备课提供丰富的教学资源,从而更好地服务我国基础教育;可作为文字学及相关专业领域专家学者的科研平台,为专家学者提供对数据资源进行深度挖掘的工具,弥补传统手工获取资源、联系资源方式的局限;可作为汉字类数字化产品的开发平台,为开发者提供海量的经过专业学术加工的可靠汉字属性资源。”指出。(记者 周世祥 靳晓燕)
copyright © 2022 一生命运网 版权所有 辽ICP备2022007116号-4
法律声明:本站文章来自网友投稿,不代表本站观点,版权归原创者所有,如果侵犯了你的权益,请通知我们,我们会及时删除侵权内容!