《构字规则》
(一)声符
表示声母的字符
(二)韵符
表示韵母的字符
(三)音节组合
将《汉语拼音方案》简化成 ① 双拼 方案
每个音节由 声符 + 韵符,共 2 位组成
共计:406 个
(四)特殊音节
a = aa
ang = al
e = ee
eng = ed
ê = ei
m = am
n = en
ng = ed
o = oo
三级简码和四级编码,根据 ② 字频 使用 ③ 声调分组
声调分组:即同一音调最多 6 种编码为一组,共计 4 组 24 (6*4) 种编码
详见《拼音规则》->《声调表》
按照 字频 将 最常用 的汉字以 1 位编码表示
理论码位:26 个
实际使用:26 个码位(对应 26 个英文字符)
利用率:100%
{ 一级简码为所在声符最常用字,大部分为对应声符 }
格式:
声符
示例:不 b, 一 a
按照 字频 将 次常用 的汉字以 2 位编码表示
理论码位:26*26=676 个
实际使用(音节):406 个码位(对应 406 个汉字音节)
利用率:60.06%(剩余码位由于不与汉语语音对应,不容易记忆,所以放在扩展表使用)
{ 二级简码为所在音节(不含声调)最常用字 }
格式:
声符 + 韵符
示例:汉 hm, 爱 ai
按照 字频 将 通用 的汉字以 3 位编码表示
理论码位:26*26*26=17576 个
实际使用:6000 余个
{ 三级简码为所在音节(含声调)最常用字,按照字频编码 }
(一)标准双拼
(同音字少于等于 6 个的情况)
格式:声符 + 韵符 + 声调(字频序)
示例:埃 aic 哀 ain | 癌 aio 挨 aiu | 矮 ais 蔼 aiv | 碍 aie 艾 aiz
(二)扩展双拼
(同音字大于 6 个的情况)
在标准双拼的基础上,通过 ④ 借音位,实现三级简码:作为标准双拼的有效补充
格式:音节(借用)+ 声调(字频序)
示例:
严 ymo 盐 ywo (yw=ym 借用韵符)
利 lie 厉 oie (oi=li 借用声符)
沥 oke (ok=li 借用音节[声符 + 韵符])
详见:《借音表》
{ 四级编码用于处理不可 3 位编码用字 }
按照 字频 将 罕用 的汉字以 4 位编码表示
(同音字多于 6 个的情况下)
在三级简码的基础上,增加一个 ⑤ 符号位,共计 4 位编码:多为编码补充
格式:
声符 + 合成字符 (.') + 韵符 + 声调(字频序)
表示二级字
或
声符 + 韵符 + 合成字符 (.') + 声调(字频序)
表示三级字
示例:亿 yie -> 驿 y.ie -> 燚 yi.e
《通用规范汉字表》表外汉字(极罕用字),通过已编码字借助合成字符 ' 表示
格式:
A字编码 + 合成字符 (') + B字编码
【 "五级编码" 几乎等同于万能构字法 】
示例:壝 = 土(tuv) + 遗(yiw) = tuv'yiw
说明:此级多为临时构字,如果日常应用较稳定,可考虑新编码构字。
(一)一级简码
同音、不同音均无需重新编码
(二)二级简码
① 同音(不同调):
无需重新编码
示例:
任 rn2 (rn) | rn4 (rn)
② 不同音:
需要重新编码
示例:
调 dg4 (dg) | tg2 (tgo)
(三)三级简码
同音(不同调)、不同音均需重新编码
示例:
熬 ao1 (aon) | ao2 (aoo)
拗 ao4 (aoq) | nf4 (nfe)