《拼音规则》 | 《构字规则》 | 《构词规则》

《构字规则》

1)《音节》

(一)声符

表示声母的字符

(二)韵符

表示韵母的字符

(三)音节组合

将《汉语拼音方案》简化成 ① 双拼 方案

每个音节由 声符 + 韵符,共 2 位组成

共计:406 个

(四)特殊音节

a   = aa
ang = al
e   = ee
eng = ed
ê   = ei
m   = am
n   = en
ng  = ed
o   = oo

2)《声调分组》


三级简码和四级编码,根据 ② 字频 使用 ③ 声调分组

声调分组:即同一音调最多 6 种编码为一组,共计 424 (6*4) 种编码

详见《拼音规则》->《声调表》

3)《一级简码》


按照 字频最常用 的汉字以 1 位编码表示

理论码位:26 个

实际使用:26 个码位(对应 26 个英文字符)

利用率:100%

{ 一级简码为所在声符最常用字,大部分为对应声符 }

格式:

声符

示例:不 b, 一 a

4)《二级简码》


按照 字频次常用 的汉字以 2 位编码表示

理论码位:26*26=676 个

实际使用(音节):406 个码位(对应 406 个汉字音节)

利用率:60.06%(剩余码位由于不与汉语语音对应,不容易记忆,所以放在扩展表使用)

{ 二级简码为所在音节(不含声调)最常用字 }

格式:

声符 + 韵符

示例:汉 hm, 爱 ai

5)《三级简码》


按照 字频通用 的汉字以 3 位编码表示

理论码位:26*26*26=17576 个

实际使用:6000 余个

{ 三级简码为所在音节(含声调)最常用字,按照字频编码 }

(一)标准双拼

(同音字少于等于 6 个的情况)

格式:声符 + 韵符 + 声调(字频序)

示例:埃 aic 哀 ain | 癌 aio 挨 aiu | 矮 ais 蔼 aiv | 碍 aie 艾 aiz

(二)扩展双拼

(同音字大于 6 个的情况)

在标准双拼的基础上,通过 ④ 借音位,实现三级简码:作为标准双拼的有效补充

格式:音节(借用)+ 声调(字频序)

示例:

严 ymo 盐 ywo (yw=ym 借用韵符)
利 lie 厉 oie (oi=li 借用声符)
沥 oke (ok=li 借用音节[声符 + 韵符])

详见:《借音表》

6)《四级编码》


{ 四级编码用于处理不可 3 位编码用字 }

按照 字频罕用 的汉字以 4 位编码表示

(同音字多于 6 个的情况下)

在三级简码的基础上,增加一个 ⑤ 符号位,共计 4 位编码:多为编码补充

格式:

声符 + 合成字符 (.') + 韵符 + 声调(字频序)

表示二级字声符 + 韵符 + 合成字符 (.') + 声调(字频序)

表示三级字

示例:亿 yie -> 驿 y.ie -> 燚 yi.e

7)《五级编码》


《通用规范汉字表》表外汉字(极罕用字),通过已编码字借助合成字符 ' 表示

格式:

A字编码 + 合成字符 (') + B字编码

【 "五级编码" 几乎等同于万能构字法 】

示例:壝 = 土(tuv) + 遗(yiw) = tuv'yiw

说明:此级多为临时构字,如果日常应用较稳定,可考虑新编码构字。

8)《多音字处理》


(一)一级简码

同音、不同音均无需重新编码

(二)二级简码

① 同音(不同调):

无需重新编码

示例:

任 rn2 (rn) | rn4 (rn)

② 不同音:

需要重新编码

示例:

调 dg4 (dg) | tg2 (tgo)

(三)三级简码

同音(不同调)、不同音均需重新编码

示例:

熬 ao1 (aon) | ao2 (aoo)

拗 ao4 (aoq) | nf4 (nfe)

《拼音规则》 | 《构字规则》 | 《构词规则》