Appearance
简介
invnz 是一个汉语拼音的三层编码工具,定义了三种逐步抽象的表示法:
标准拼音 (pinyin) → 音韵码 (invn) → 音韵字 (invnz)三层含义
| 层 | 名称 | 英文缩写 | 含义 |
|---|---|---|---|
| 1 | 标准拼音 | pinyin | 标准的汉语拼音(如 zhuang) |
| 2 | 音韵码 | invn | 自造的双字母注音方案(如 zhuag) |
| 3 | 音韵字 | invnz | 音韵码的汉字化表达(如 ⿰止⿱土⿹勹才) |
为什么要造音韵码?
标准汉语拼音使用多字母组合表示韵母(如 uang、ian),长度不固定,不利于结构化处理。
音韵码 将每个韵母压缩为固定模式的短编码:
uang→uag(去掉韵腹 a 的重复标记)ian→ian(与拼音相同,但内部用_占位符标记结构)ai→a(单字母表示复合韵母)
所有声母在音韵码中保持不变(b → b,zh → zh)。
音韵字又是什么?
音韵字 把音韵码中的每个音素对应到一个汉字部首(组件),然后用汉字结构指示符(IDC)组合起来,看起来像一个汉字:
| 音韵码 | → | 声母组件 + 韵母组件 | = 音韵字 |
|---|---|---|---|
zhuag | ⿰止 + ⿱土⿹勹才 | ⿰止⿱土⿹勹才 | |
bi | ⿰匕 + ⿱一 | ⿱匕一 | |
zhi | 止(无独立韵母) | 止 |
一句话总结
- 标准拼音:人类读写用的拼音
- 音韵码:给程序处理用的固定长度拼音编码
- 音韵字:把音韵码写成"汉字"的样子,一码一字严格对应