Skip to content

简介

invnz 是一个汉语拼音的三层编码工具,定义了三种逐步抽象的表示法:

标准拼音 (pinyin)  →  音韵码 (invn)  →  音韵字 (invnz)

三层含义

名称英文缩写含义
1标准拼音pinyin标准的汉语拼音(如 zhuang
2音韵码invn自造的双字母注音方案(如 zhuag
3音韵字invnz音韵码的汉字化表达(如 ⿰止⿱土⿹勹才

为什么要造音韵码?

标准汉语拼音使用多字母组合表示韵母(如 uangian),长度不固定,不利于结构化处理。

音韵码 将每个韵母压缩为固定模式的短编码:

  • uanguag(去掉韵腹 a 的重复标记)
  • ianian(与拼音相同,但内部用 _ 占位符标记结构)
  • aia(单字母表示复合韵母)

所有声母在音韵码中保持不变(bbzhzh)。

音韵字又是什么?

音韵字 把音韵码中的每个音素对应到一个汉字部首(组件),然后用汉字结构指示符(IDC)组合起来,看起来像一个汉字

音韵码声母组件 + 韵母组件= 音韵字
zhuag⿰止 + ⿱土⿹勹才⿰止⿱土⿹勹才
bi⿰匕 + ⿱一⿱匕一
zhi(无独立韵母)

一句话总结

  • 标准拼音:人类读写用的拼音
  • 音韵码:给程序处理用的固定长度拼音编码
  • 音韵字:把音韵码写成"汉字"的样子,一码一字严格对应

基于 MIT 许可协议发布