@board

2016年6月16日
本文原载于Foreign Affairs

https://chinadigitaltimes.net/chinese/532602.html

三年前,美国中情局雇员爱德华·斯诺登(Edward Snowden)所披露的文件揭露了美国政府对国内外电话的广泛监控。在这些爆炸性的内幕披露三周年之际,各大媒体无疑都蓄势待发,准备重提数据隐私和公民自由的话题。

然而,人们或许忘了监控技术早已超出对电话、电邮和短信的窃听拦截。事实上,人们在寄电邮、PO脸书和发推特前,政府便有可能监控这一切。国家和私有企业能够截获.docx和.rtf格式文档,事实上,哪怕是用看似不会泄露的程序输出的文本文档,也都有可能为他人获取。

最后,这样的监控很可能发展为实时进行。届时,一份文件甚至点击“保存”或上传到云端之前就能被截获。这些都是推测,但并不是不可能。

你所敲的每一个键

过去十年,我一直在研究现代中国的信息技术,成果会写在一套丛书中,明年由麻省理工出版社出版。当时我并不知道研究中的一些偶然发现会与当下的争论有关,涉及国家监控、数据隐私以及震惊世界的斯诺登泄密案,但事实就是这样。
简而言之:中文计算机系统已经具有“键盘记录(keylogging)”的功能。这项技术的引入并非基于恶意(其实是很高明的技术),但它却在理论上让实时监控中国的电脑用户成为可能,譬如用户在使用Microsoft Word、NotePad、TextEdit等看似不联网的文档程序时就有可能受到监控。当前媒体技术的发展趋势强烈地预示着这种漏洞很快便会从中国传播出去,并成为一种新常态。

要探究起因为何,人们首先需要了解键盘记录器和中文的计算机系统,以及两者是如何结合在一起的。

键盘记录器是一种程序,也可以是安装在计算机上的一种实体装置,它收集用户敲击的每一个键的数据。键盘记录器经常被恶意使用,比如盗取信用卡信息、密码或个人数据,同时也长期运用于政府监控中。1999年有一件里程碑式的案子,联邦调查局探员首次使用键盘记录装置侵入了黑手党大佬小尼基(Nicodemo Salvatore Scarfo, Jr)的电脑,获取他的密码。

在键盘记录器这种间谍工具的发展早期,主要的挑战并非来自键盘记录装置的制作,而在于它的安装。在小斯卡夫一案中,联邦调查局不得不用老掉牙的特务手段,两次闯入这位老大的办公室,第一次是安装键盘记录装置,第二次是取回它。

随着恶意软件的扩散,安装键盘记录器变得更加简单,不过要利用键盘记录器实施间谍活动暂时还没有那么容易。2015年,伊利诺伊大学香槟分校的研究人员研究发现,可以利用智能手表自带的加速计和陀螺仪数据,把手表改装成一种不太完美的键盘记录器。根据相关理论,只要能确定用户的手如何划过键盘表面,就能推算出用户敲了哪几个键。

中文计算机系统上存在一种同样“聪明”,且远为优越的办法,能够精确推算出用户在键盘上输入了什么。要窃取中文计算机上的信息,你只需要获取键盘记录器的管理权限,而且这个国家每台个人电脑和电子设备本身就自带“键盘记录器”——事实上,全世界的个人电脑和电子设备也都自带这种“键盘记录器”。

中文计算机系统是如何工作的?

中国的计算机和美国完全一样,都用标准全键盘(QWERTY keyboard,又称柯蒂键盘)。无论你是在北京哪一栋新落成的写字楼观察,都会发现一批饱含创业激情的千禧一代正在键盘上辛勤地工作,满怀希望地准备与风投资本家会晤。

但是,中国的全键盘并不是看上去的那样简单。在中文计算机系统中,全键盘的用法并非“打什么字就出什么字”。键盘的输入只是在输入法(IME)软件里提供指令的手段 ,确定接下来显示在屏幕上的汉字。

思考一下人们会如何使用全键盘输入有关“诚信”、“舆论导向”以及“数据隐私”等中文词语吧。

要打出由两个汉字组成的“诚信”,四个汉字组成的“舆论导向”或“数据隐私”,业内领先的搜狗输入法会为用户提供多种输入策略。人们可以输入完整的汉语拼音(比如,“c-h-e-n-g-x-i-n”, “y-u-l-u-n-d-a-o-x-i-a-n-g”等等),也可以采用多种快捷键和缩略词(比如“c-x” and “y-l-d-x”),搜狗输入法会足够智能地提供一组选项。比如输入“c-x”,搜狗的弹出式菜单除了会提供“诚信”,同时还并列显示其他也以“c”和“x”开头的中文词语,如“抄袭”。又比如输入“y-l-d-x”,搜狗会弹出“舆论导向”,以及“耶鲁大学”等其他选项。这些呈现出的选项如此简单明了, 足够用户从“抄袭”等词中选中“诚信”。

鉴于输入法是这样的运行方式,计算上的所有中文输入都是某种形式的本地通讯。当然,如果一个人在中国编辑word文档,输入的信息不会发给第三方,而是返还给用户本身。Word编辑者把字母代码传到输入法,输入法处理代码并以汉字形式将信息传回给用户。

云输入

从麻省理工的工程学教授塞缪尔·考德威尔(Samuel Caldwell)发明首台试验性中文计算机至今,60多年来中文计算机系统都主要依靠这种输入方式。事实上,计算机诞生之前便存在中文输入,甚至考德威尔的灵感也来自于知名作家、语言学家林语堂在20世纪40年代发明的明快(MingKwai )中文机械打字机。自林和考德威尔之后,每一代中文计算机科学家和工程师都把中文输入作为设计的核心考量。

特别是从2000年开始,中文计算机系统利用个人电脑不断增强的处理能力让汉字输入过程疯狂加速,同时汉字输入愈发智能,愈发依赖预测文本,自动补齐,快捷键和缩略词。因此,比起英文字母键盘那种“打什么字出什么字”,中国的全键盘变得更加“聪明”。所有这些或许都让中文成为地球上电脑输入最快的语言。

近几年发生了影响深远的变化:云输入法出现了。上世纪80年代到21世纪初的输入法,输入的全过程都发生在电脑内部,而搜狗、百度、腾讯、微软等推出的云输入系统开始使用巨大的中文语料库和复杂的自然语言处理算法。2013年,微软的研究者把自家中文输入法不断完善的性能当做卖点;而搜狗在其官网上吹嘘其基于云技术的输入法具有更加卓越的准确率和性能。“长句识别”是指输入法将具有一定长度和复杂性的字母精确地转化为多字符中文的能力。搜狗称,依赖本地语料库的传统输入法的长句识别准确率为62.5%,如今云输入法已经将准确率提高到了84%,同时“短句识别”的准确率也从91.52%提高到了96%。

安全问题

或许很多人已经注意到了云输入法速度和准确性的提高,但很少有人指出这种系统可能会引发数据安全问题。如果说输入法本质上就是一种键盘记录器,那云输入法就是联网的键盘记录器。在云输入法中,每在标准键盘上按一个键,都相当于是按了“发送”、“上传”和“转发”。

随着数以亿计的按键在光纤中来回输送,近年来人们开始担心这种输入方式容易受到监控。另外,英文计算机一般仅仅是在浏览网页时由谷歌提供搜索候选(译者注:根据用户输入提供用户可能需要搜索的关键词),而在中国,搜索候选功能已经成为了所有输入法的核心部分。

当然,有些人也许会问,能否使用其他人的电脑来避开这种云输入法带来的监控。毕竟如果没有确定的身份标识,一定无法判断内容的输入者究竟是谁。但事实或许不是这样。

作为斯坦福大学的空间与文本分析中心(CESTA)数字人文亚洲项目中的一项研究,我和我的团队一直在分析键盘的输入记录,试图理解在键盘输入中的各种逻辑和策略。

尽管研究还未结束,但我们已经发现不同用户的键盘记录之间有惊人的差异。而且每个用户都有属于自己的且彼此间区别明显的中文输入方法。虽然我们仍处在研究的初期,但我们的发现对安全和隐私问题会带来的影响已经十分深远。

在个人电脑出现之前,对打字机和打字机打出的文本进行科学鉴定是国内外监视的重要部分。由于打字机制式的不同,打字机打出的文本存在细微的差异。就连不同牌子的打字机色带也会在文件上留下略有不同的“标记”。在美国和前共产主义阵营国家(译者注:Communist bloc或Soviet bloc指和前苏联站在一起的一系列国家,不仅限于中欧和东欧的国家)中,监视部门就利用这些微妙的差异来分析来源不明的文件可能的出处和作者。(要想了解这种分析方法,读者可以去观看2006年电影《窃听风暴》。)

我们的初步研究显示,通过计算机输入法输入的文本也有自己的标记,所以“输入法鉴定”是完全可能的。在斯坦福大学,我们邀请研究样本使用自己偏爱的输入法,输入唐代诗人王维(公元前701-公元前761)所做的古诗《送别》。我们的发现很惊人——就连在前两句诗、短短的十个字中,键盘记录下不同样本的习惯也存在差异。

下马饮君酒,问君何所之?

输入键盘记录,样本#1:xiama_yinjunjiu_,wen_jun_hesuozhi2?

输入键盘记录,样本#2:xiamayinjunjiu2,wenjunhesuozhi2?

注释:下划线是用户按下空格键的地方,这意味着用户选择了搜狗输入法选字框中的第一个字。数字2代表用户选择了搜狗输入法选字菜单中的第二个字。

我们在示例1中可以看到,有些人每次只输入一个字的拼音,他们输入“w-e-n”,然后使用空格键(_)选择想要的字。另外的人在面对包含多个汉字的文本时,会选择输入更多的字母(比如“x-i-a-m-a-y-i-n-j-u-n-j-i-u”),这类人对输入法联想能力的依赖度更高。

另外,随着文本长度的增加,不同电脑用户之间存在的差异会更大。这意味着,当我们把一个人每年成千上万(甚至上百万)次的按键结合在一起,就能总结出那个人独有的“指纹”——这种“指纹”的有效性和打字机时代最先进的识别技术不相上下。把输入法指纹和定位数据、网页缓存数据和其他数据获取方法进行交叉比对时,我们发现输入法指纹甚至更胜一筹。

在云输入法的时代,电脑用户仅仅通过更换电脑来躲避监控是不够的,因为其输入指纹有可能会如影随形挥之不去。在愤怒时发过邮件或者喝醉时发过短信的人都知道,编辑时的信息和最终发送出去的信息可谓是天差地别。但如果这种不同完全消失呢?如果你的每一个Word文档,包括没有保存的那些以及整个编辑过程都能被拦截呢?如果你删除掉的每段话,修改过的每个短语,做过的每个改动和最终保存的文件都被一视同仁地保存在了监控世界中呢?这些你以为已经删除掉、但其实被保存下来的信息,有一天是否会被用来针对你?

菲利普·狄克(Philip K. Dick)在他1956年的作品《少数派报告》(The Minority Report)中,提出了让人胆寒的“犯罪预防”(precrime)概念,意指在事先即察觉(甚至起诉)犯罪行为。云输入法的出现提出了一个问题:Wei Jingsheng/魏京生 被监禁的原因主要是因为他1978年攥写的文章 The Fifth Modernization;Liu Xiaobo/刘晓波 被监禁的原因,部分是因为他与人合著了 Charter 08;在未来,异见者在用电脑进行创作时,是否会像恐怖分子一样,还未来得及行动就被察觉?

另外,上述猜测不局限于中文输入或中文中。可以说,全球的IT公司和用户像中国一样开始利用智能键盘提供的便捷,只是时间问题。

当我准备按下“发送”按钮,将带着一个 docx 附件的电邮发给我的编辑时,我已经完全意识到,我写下的每一句话很可能已经被政府和私企的相关方拦截读取。

Join in us
Open Chinese Group/中文群
加群方法: 直接复制群链接(不用打开),然后在 Session 主界面,点那个加号,再点 Join Community,粘贴群链接到那个输入框,然后再点下面的 Join 加入。
http://45.77.102.159/origin?public_key=132d7cf93a6a72eabbf9357a3a29d0644b27b1166e12d36704a0785f7ccb0f74

More Groups:
https://lokilocker.com/Mods/Session-Groups/wiki/Session-Open-Groups

译读 | 如何用输入法来监控六亿网民?

本文原载于Foreign Affairs 编译/雨山 & 一颗马 & 公仔 & 伍豪 […]

中国数字时代

“取法乎上,仅得乎中; 取法乎中, 仅得乎下。”

论诗五首, 其二
李杜诗篇万口传, 至今已觉不新鲜。
江山代有才人出, 各领风骚数百年。
赵翼/清代

劝退。

建议直接学习:仓颉输入法。
仓颉输入法, 不仅可以输出正体字(繁体字), 也可以输出简体字, 而且开源、免费。

仓颉输入法/倉頡輸入法/cangjie
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95

五笔字型86版(234个字根)、仓颉五代(114个字形), 两种输入法的字形(字根)在同一个键位的是, N: 乙, V: 女, Y: 亠,共计三个, 也就是两种输入法,绝大多数相同的字形(字根)键位不同,会互相干扰人的思维。
我初学仓颉输入法时,多次看到“横”(一/M), 手却敲击五笔字型的键位:G(一); 看到“日”(A), 手却敲击五笔字型的键位:J(日), 诸如此类。
当然,主要原因还是我仓颉输入法的字母、字形(字根)记得不牢固。

五笔字型规定了笔顺,仓颉无关笔顺。
因为笔顺,各人习惯不同,谁正确?
最后必然是谁拳头大,谁就正确。

所以为了避免五笔字型输入法的负面干扰,建议直接学习:仓颉输入法。

曾经五笔字型输入法占据中国输入法的绝大部分市场份额。
但是,现在是各种智能、联想、联网的拼音输入法垄断市场。

现在,谁还在使用五笔字型输法?
银行等保密要求高的公司、机关、单位。
因为那些智能、联想、联网的拼音输入法, 包括联网的(搜狗、QQ、百度)五笔字型输入法,都会上传用户输入的所有资料。
所以,银行等公司、机关、单位使用:不联网的五笔字型输入法。

因为86版是公开、免费版,各大操作系统默认安装。
如果学习98版、或者新世纪版,都需要专门购买软件。
所以,如果一定要学习五笔字型输入法,建议学习86版。

如何学习五笔字型输入法86版

一、
熟记五笔字型字根
抄写,背诵字根。
练习输入字根,首先按横、竖、撇、捺、折五个笔画,分区练习,然后把所有234个字根合并练习。

二、
学习五笔字型编码拆分规则:“书写顺序、取大优先、兼顾直观、能连不交、能散不连”。
来源:《打字高手 五笔字型高速录入秘诀》 (王永民,陈云峰编著)第5页。
反复阅读、理解, 并且练习例字。
最初没有“书写顺序”这条规格,因为被中国教育部批评乱拆字,所以加了这条规则。

三、
专门练习拆分疑难字
许多五笔字型的书,有专门的章节介绍如何拆分疑难部首、疑难汉字, 从 z-lib 下载几本书,反复练习。
用记事本专门记录经常打错、忘记如何拆分的汉字。

例如:
《巧学巧用五笔字型》
第17页: 末笔字型识别码,
将6763个汉字中,需要末笔识别码的字列出, 可以专门训练。

《五笔字型学习大礼包之五笔字型快译通速查字典》
附录1: 五笔字型难拆汉字速查表
附录3: 易拆错汉字速查表

《五笔字型完全自学手册双色版》
附录B 常见非基本字根拆分

四、
练习一级简码、二级简码、三级简码

五、
练习拆分常用汉字。

六、
平常使用五笔字型输入法写文章, 巩固熟练。

批评:
1、
五笔字型中的“牛、牧”, 拆分规则不一样, 也就是“牛”当独作为汉字,与作为偏旁的“牛”字,拆分字根不同。这一点使人困惑。

2、
“禾”字系列,规则也不一样:“秉, 乘, 剩”。 以前“秉”也可以拆分出完整的“禾”字根,后来改为“撇、横、折、捺/TGVI”, 但是, “乘、剩”, 是可以拆分出完整的“禾”字根, 即标准不统一。

3、
“刀、九、匕、力、乃”作为汉字的最后一个字根时,其末笔识别码统一规定为“乙”(折)。
但是,当“刀”字单独作为一个汉字时,末笔为“丿”(撇),编码为VNT。
这些字的五笔字型86版编码如下:
刀: VNT;
九: VTN,匕: XTN,力: LTN,乃: ETN,
也就是依赖笔顺,需要特别记忆。

4、
乡:XTE, 末笔识别码,杂合型; 少: ITR, 末笔识别码,上下型。
乡、少, 都是一个字根与单笔画组合,末笔识码, 一个是杂合型, 一个是上下型,即标准不统一。
“一个基本字根与一个单笔画相连,也视为杂合型结构。”
来源:《“打”出速度 五笔字型输入法过目不忘》 (李飞创作工作室编著)第66页。
另外可以参看: 电脑通用汉字输入法 五笔字型 《培训教材》(王永民、张一平编著)第30页。

附录,五笔字型86版字根记忆口诀:

G: 王旁青头戋(兼)五一,
F: 土士二干十寸雨,还有革字底,
D: 大犬三羊古石厂,
S: 木丁西,
A: 工戈草头右框七。

H: 目具上止卜虎皮,
J: 日早两竖与虫依,
K: 口与川,字根稀,
L: 田甲方框四车力,
M: 山由贝,下框几。

T: 禾竹一撇双人立,反文条头共三一,
R: 白手看头三二斤,
E: 月彡(衫)乃用家衣底,
W: 人和八,三四里,登祭头,
Q: 金勺缺点无尾鱼,犬旁留叉儿一点夕,氏无七。

Y: 言文方广在四一, 高头一捺谁人去,
U: 立辛两点六门病,
I: 水旁兴头小倒立,
O: 火业头,四点米,
P: 之字军盖建字底, 摘礻(示)衤(衣)。

N: 已半巳满不出己, 左框折尸心和羽,
B: 子耳了也框向上,
V: 女刀九臼山朝西,
C: 又巴马,丢矢矣,
X: 慈母无心弓和匕, 幼无力。

#五笔
#wubi86

#仓颉
#倉頡
#cangjie

@board

倉頡輸入法 - 维基教科书,自由的教学读本

鄙人初学 Linux,请各位不吝批评、指正。谢谢!

以 Debian Linux 家族发行版为例。

一、安装:

$ sudo apt install ibus-rime

或者

$ sudo apt install fcitx5-rime

安装后, 设置:

ibus-rime:
Applications Menu → Setting → Input Method, 选择 ibus;
Applications Menu → Setting → iBus Preferences → Input Method → Add → Chinese, 选择 Rime。

或者

fcitx5-rime:
Settings → Fcitx5 Configuration → 搜索 rime, 选择 → Apply → Close。

可能需要重启电脑, 输入法才可以生效。

一般情况下,这样就安装好 Rime 中文输入法, 可以打中文了。
但是, 不同 Linux 发行版, 可能会遇到不同的问题。
以下是鄙人安装 Rime 中文输入法遇到的问题, 以及解决方法。

二、问题、答案:

1、安装后, 不能打字。
A、可能原因: 没有安装 data 文件, 例如: rime-data-cangjie5
建议安装所有 “Suggested packages”、“Recommended packages”。

B、缺乏某些软件, 可以根据英文提示, 上网搜索答案。
某个 Linux 发行版, 还需要安装以下软件, 才可以使用 Rime 输入法。
$ sudo apt install ibus ibus-m17n m17n-db ibus-gtk ibus-gtk3 im-config zenity

$ sudo nano /home/UserName/.bashrc
在最后加入以下三行。
保存后,退出。
(请将 UserName 替换为你电脑的用户名。)

export GTK_IM_MODULE=ibus
export QT_IM_MODULE=ibus
export XMODIFIERS=@im=ibus

2、增加五笔字型输入法 / wubi86。
实际己经安装了五笔字型, 但是需要修改 "default.yaml" 文件,才会显示“五笔86”选项。

$ sudo nano /usr/share/rime-data/default.yaml

找到 “schema_list:”, 在下面增加: “- schema: wubi86”,
保存、退出后, 就可以在 Rime 输入法内选择 “五笔86”。

3、ibus-rime 与 fcitx5-rime 会互相冲突

建议任意选择一种安装。

如果己经安装了两种输入法框架, 可以卸载一种; 或者在 bash_profile 或者 bashrc 或者 xprofile 注释掉某种输入法框架。

例如:

#export GTK_IM_MODULE=fcitx5
#export XMODIFIERS=@im=fcitx5
#export QT_IM_MODULE=fcitx5
#export INPUT_METHOD=fcitx5

fcitx5-rime 将不能使用。

4、选择各种输入法:
"Ctrl + ~", 会显示各种已经安装的输入法, 例如:朙月拼音、五笔86、倉頡五代, 等等。
按“↓”键, 选择, 点击 “Enter” 键。
或者按相应的数字,选择。

如果安装 Rime 输入法遇到问题,可以到这个 Linux 发行版的论坛寻找答案。
Rime 输入法, 东亚以及世界各地的人都在使用。

参考资料:

RIME | 中州韻輸入法引擎
下載及安裝
https://rime.im/download/

RimeWithIBus
https://github.com/rime/home/wiki/RimeWithIBus

安装Fcitx5
https://fcitx-im.org/wiki/Install_Fcitx_5/zh-cn

RimeWithSchemata
https://github.com/rime/home/wiki/RimeWithSchemata

CustomizationGuide
Rime 定製指南
https://github.com/rime/home/wiki/CustomizationGuide

@board

下載及安裝

Le blog de la Rime

RIME | 中州韻輸入法引擎

鄙人初学仓颉输入法,请各位不吝批评、指正。谢谢!

建议:学习仓颉五代。
各种教材, 例如:《倉頡輸入法-wikibooks》、《第五代倉頡輸入法手冊》,是以仓颉五代举例。
某些香港网站提供仓颉三代教学。
初学者直接学习仓颉六代,成本高、难度大。

零、Linux 电脑已经安装了 ibus-rime 或者 fcitx5-rime。
鄙人安装了 ibus-rime,可以使用仓颉五代打字。

以 ibus-rime 为例:

一、下载以下文件:

蒼頡檢字法〔Cangjie6〕
https://github.com/lotem/rime-cangjie6

cangjie6.schema.yaml
cangjie6.dict.yaml
cangjie6.extended.dict.yaml
cangjie6.extsimp.dict.yaml

cangjie6_express.schema.yaml

二、运行 ClamTk 检查是否有毒, 然后再上传到 virustotal.com 检查病毒。

https://www.virustotal.com/gui/home/upload

三、将下载的文件复制到: /usr/share/rime-data/

假设下载的文件保存在: /home/UserName/Downloads/, 而且文件夹内没有任何其他文件。

$ sudo cp /home/UserName/Downloads/* /usr/share/rime-data/

(请将 UserName 替换为你电脑的用户名。)

四、修改文件: /usr/share/rime-data/default.yaml

$ sudo nano /usr/share/rime-data/default.yaml

找到 “schema_list:”,

增加:
- schema: cangjie6
- schema: cangjie6_express

如果担心手工输入符号错误, 可以复制已有的 “- schema: luna_pinyin” 两次,排在已有的输入法后面,
然后将“luna_pinyin”改为:“cangjie6”、“cangjie6_express”,
保存( Ctrl + S )后, 退出( Ctrl + X )已经修改的文件(default.yaml)。

五、找到桌面上的 “Rime 输入法” 图标, 点击 “部署”, 然后就可以在 “Rime 输入法” 选择 “蒼頡檢字法”、“蒼頡·快打模式”。
按 “Ctrl + ~ ”, 按 “↓” 键,进行选择,点击 “Enter” 键。

六、测试
汉字:“黽”
六代編碼:月日日 / baa
五代編碼:口難山 / rxu

倉頡輸入法/版本差異/六代與五代之差
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E7%89%88%E6%9C%AC%E5%B7%AE%E7%95%B0#%E5%85%AD%E4%BB%A3%E8%88%87%E4%BA%94%E4%BB%A3%E4%B9%8B%E5%B7%AE

参考资料:

蒼頡檢字法〔Cangjie6〕
https://github.com/lotem/rime-cangjie6

《倉頡平台2022》測試版正式推出
https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=195320
《倉頡平台2022》測試版正式推出,歡迎下載使用!本測試版只限論壇會員下載,未注册會員者請先注册。
本版本適用於中文繁體/簡體/英文版 32/64 bits Windows 10,同时兼容 Win7/Win 8。主要特點如下:
★ 支持九萬餘個簡繁中日韓越漢字輸入。

ibus-rime, 请以最新文件为准。

倉頡三代補完計劃
https://github.com/Arthurmcarthur/Cangjie3-Plus/releases

sha256:fa9f9785d98c49d0fa0c998e96f7dac78a09d171074f0a2796bad9ba0345edb8
https://github.com/Arthurmcarthur/Cangjie3-Plus/releases/download/4.2/RimeData_20251014_Cangjie3_WithExtJ.7z

倉頡五代補完計劃
https://github.com/Jackchows/Cangjie5/releases

sha256:e2fd0c6c25b4455bc1b5b0b5c127399ac2c332b25ee057d4891f14fb02c19408
https://github.com/Jackchows/Cangjie5/releases/download/v4.1-beta/RimeData_Cangjie5_20260207.zip

#仓颉
#倉頡
#cangjie

@board

GitHub - lotem/rime-cangjie6: 蒼頡檢字法

蒼頡檢字法. Contribute to lotem/rime-cangjie6 development by creating an account on GitHub.

GitHub

鄙人初学仓颉输入法,请各位不吝批评、指正。谢谢!

一、测试
如果您的电脑可以显示以下所有汉字,证明您的电脑可以显示九万汉字。
如果不能全部显示, 则需要安装字体(font)文件, 才可以完全显示以下汉字。

----------------------

sanwsw
GB 18030—2022汉字显示检测
No Unicode Block Sample character Number
1 CJK 基 本 一丁丂七丄…鿻鿼鿽鿾鿿 20992
2 CJK-ExtA 㐀㐁㐂㐃㐄…䶻䶼䶽䶾䶿 6592
3 CJK-ExtB 𠀀𠀁𠀂𠀃𠀄…𪛛𪛜𪛝𪛞𪛟 42720
4 CJK-ExtC 𪜀𪜁𪜂𪜃𪜄…𫜴𫜵𫜶𫜷𫜸 4154
5 CJK-ExtD 𫝀𫝁𫝂𫝃𫝄…𫠙𫠚𫠛𫠜𫠝 222
6 CJK-ExtE 𫠠𫠡𫠢𫠣𫠤…𬺝𬺞𬺟𬺠𬺡 5762
7 CJK-ExtF 𬺰𬺱𬺲𬺳𬺴…𮯜𮯝𮯞𮯟𮯠 7473
8 CJK-ExtG 𰀀𰀁𰀂𰀃𰀄…𱍆𱍇𱍈𱍉𱍊 4939
9 CJK-ExtH 𱍐𱍑𱍒𱍓𱍔…𲎫𲎬𲎭𲎮𲎯 4192
10 CJK-ExtI 𮯰𮯱𮯲𮯳𮯴…𮹙𮹚𮹛𮹜𮹝 622
11 CJK标点符号 〇 1
12 CJK兼容汉字 﨎﨏﨑﨓﨔﨟﨡﨣﨤﨧﨨﨩 12
13 CJK扩展部首 ⺁⺄⺈⺋⺌⺗⺧⺪⺮⺳⺶⺷⺻⻊ 14
14 表意文字描述符 ⿰⿱⿲⿳⿴⿵⿶⿷⿸⿹⿺⿻〾 13
15 康熙字典部首 ⼀⼁⼂⼃⼄…⿑⿒⿓⿔⿕ 214
Total 97922

阿勤
基本中文:一 丁 丂
中文A擴: 㐀 㐁 㐂
中文B擴: 𠀀 𠀁 𠀂
中文C擴: 𪜀 𪜁 𪜂
中文D擴: 𫝀 𫝁 𫝂
中文E擴: 𫠠 𣎴 𫠢
中文F擴: 𬺰 𬺱 𬺲
中文G擴: 𰀀 𰀁 𰀂
中文H擴: 𱍐 𱍑 𱍒
中文I擴: 𮯰 𮯱 𮯲
中文J擴: 𲎰 𲎱 𲎲

------------------

作弊方法:可以在字表文件(dict.yaml)中找到这些字的仓颉码。

二、Windows 电脑安装字体, 请参看教程:

如何顯示及輸入九萬漢字
https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=195321

三、Linux 电脑安装字体, 请参看教程:

Linux 字体安装完全指南:从基础到高级实践
https://geek-blogs.com/blog/linux-install-font/

四、鄙人现学现卖:

1、下载文津宋体TTF文件,请以最新文件为准。

文津宋体/WenJinMincho
可免费商用的大字符集宋体字库,以OFL协议发布。
A large character set fonts in Songti(Mincho) style. Licensed under the SIL OFL 1.1.

WenJinMincho-TTF.7z
sha256:7ad006a3798eb1612852166b5e436b43365b9b5aa2b83b23db7755867ea8e0ef
https://github.com/takushun-wu/WenJinMincho/releases/tag/v2.003

2、检查文件哈希值(shasum),运行 ClamTk 检查是否有毒, 然后再上传到 virustotal.com 检查病毒。
https://www.virustotal.com/gui/home/upload

3、将 7z 文件解压后,保存在 /home/UserName/Downloads/, 而且文件夹内没有任何其他文件。
(请将 UserName 替换为你电脑的用户名。)

4、将字体文件复制到: /usr/local/share/fonts/wenjin/

$ sudo mkdir -p /usr/local/share/fonts/wenjin
$ sudo cp /home/UserName/Downloads/* /usr/local/share/fonts/wenjin/

5、修复文件权限(可选), 确保字体文件权限正确(所有用户可读)。

$ sudo chmod 644 /usr/local/share/fonts/wenjin/
$ sudo chmod 755 /usr/local/share/fonts/wenjin/

Chmod 644 (chmod a+rwx,u-x,g-wx,o-wx) sets permissions so that, (U)ser / owner can read, can write and can't execute. (G)roup can read, can't write and can't execute. (O)thers can read, can't write and can't execute.
https://chmodcommand.com/chmod-644/

Chmod 755 (chmod a+rwx,g-w,o-w) sets permissions so that, (U)ser / owner can read, can write and can execute. (G)roup can read, can't write and can execute. (O)thers can read, can't write and can execute.
https://chmodcommand.com/chmod-755/

6、更新系统字体缓存:

$ sudo fc-cache -fv

7、验证字体安装:

$ fc-list | grep "WenJin"
会显示刚才安装的字体文件信息。

8、测试:
打开网页, 这次如果没有意外,可以显示所有汉字了。

如何顯示及輸入九萬漢字
https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=195321

測試本倉頡論壇支持九萬漢字!𰻝 𰻞 面!
https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=195246

倉頡輸入法/版本差異/六代鏡像字規則: 最后一个字
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E7%89%88%E6%9C%AC%E5%B7%AE%E7%95%B0#%E5%85%AD%E4%BB%A3%E9%8F%A1%E5%83%8F%E5%AD%97%E8%A6%8F%E5%89%87

例如: “𮗙”, 是“見”+倒立的“鬼”组合而成。
六代編碼: 月山・的田片 / buhwz
五代編碼: 月山・中弓竹 / bulnh(但是, 鄙人安装仓颉五代编码是:月山・竹山片/ buhuz 。)

可以在以下网站查询仓颉码:

倉頡大字典 測試版
(本倉頡字典收錄九萬漢字,任何回饋或建議請至論壇留言,謝謝)
https://www.chinesecj.com/cjdict/

如果定义“片/Z"为仓颉六代专用,那么鄙人使用的仓颉五代实际采用了部分仓颉六代规则。
”六代倉頡字母變更
六代將「H」由「竹」改為「的」,「X」由「難」改為「止」,並將過去未使用的「Z」設為「片」部。 “

附:
如果将字体文件(/usr/local/share/fonts/wenjin/*)删除, 网页立刻不能显示某些汉字。
但是, 仓颉输入法仍然可以打出某些特定汉字。
重启电脑, 就不能打出某些特定汉字。
重新安装字体, 需要重启电脑, 才可以生效。
第一次安装字体,并不需要重启电脑, 就可以打出某些特定汉字。

因为学习日语、韩语, 所以安装了日语、韩语输入法、noto-cjk 字体( cjk = chinese, japanese, korean)。
$ sudo apt install ibus-mozc ibus-anthy ibus-hangul fonts-noto-cjk fonts-noto-cjk-extra

#仓颉
#倉頡
#cangjie

@board

鄙人初学仓颉输入法,请各位不吝批评、指正。谢谢!

总结,扩大仓颉输入法打字范围的方法:
一、常用 → 增廣;
二、替换字表文件(dict.yaml);
三、安装字体文件(font)。

无论是下载字表文件, 还是下载字体文件, 都请选择历史悠久、口碑良好的范目文件, 而且检查哈希值(shasum)、病毒。
因为东方不败教主到处投毒, 进行供应链攻击。

以 ibus-rime 仓颉五代为例:

一、常用 →增廣
例如:汉字:"𦒍", 仓颉码:卜土尸一一/ygsmm。
如果输入"ygsmm", 出现 “卜土尸一一” + 太极旗,没有出现相应的汉字“𦒍”。
可以尝试以下步骤:

A、
如果是 Linux 系统电脑,已经安装 ibus-rime 或者 fcitx5-rime, 可以使用仓颉输入法,正常打出汉字。
但是,某些汉字打不出来。

在文件 ”/usr/share/rime-data/cangjie5.dict.yaml“,可以找到这个汉字及其对应的仓颉码。
这时,需要扩大仓颉码选字的字符集范围,方法如下:

B、
"Ctrl + ~" (符号”~“,键盘左方第二排第一個按鍵),即同时按下“Ctrl"、”~“键,出现各种输入法选项。

C、
找到“倉頡五代”,点击 ”Enter“ 键,出现“「方案選單」”。

D、
有以下选项:使用 ”↓“ 箭头按键,移到第5个选项:“通用 → 增廣”,点击 “Enter" 按键。
或者按数字“5”选择。

1 倉頡五代
2 中文 → 西文
3 半角 → 全角
4 漢字 → 汉字
5 通用 → 增廣

E、
测试:
如果能够打出“𦒍”,仓颉码:卜土尸一一/ygsmm,说明修改成功。
否则,请重复以上:B、C、D,这几个步骤。
“𦒍”, 中国常用汉字,三级字表,序号:8020。

二、替换字表文件(dict.yaml)

例如:汉字:“𬸘“, 仓颉码:尸女心卜一/svpym。
如果输入仓颉码后,没有出现汉字:”𬸘“, 而且在文件”/usr/share/rime-data/cangjie5.dict.yaml“, 没有找到”svpym“和对应的汉字,
那么可以考虑替换字表文件( cangjie5.dict.yaml )。

以 ibus-rime 为例:

A、下载以下文件:请以最新文件为准。
https://github.com/Jackchows/Cangjie5/releases

sha256:e2fd0c6c25b4455bc1b5b0b5c127399ac2c332b25ee057d4891f14fb02c19408
https://github.com/Jackchows/Cangjie5/releases/download/v4.1-beta/RimeData_Cangjie5_20260207.zip

B、运行 ClamTk 检查是否有毒, 然后再上传到 virustotal.com 检查病毒。

https://www.virustotal.com/gui/home/upload

C、将 zip 文件解压后,保存在 /home/UserName/Downloads/, 而且文件夹内没有任何其他文件。
(请将 UserName 替换为你电脑的用户名。)

D、将下载的文件复制到: /usr/share/rime-data/
请事先将系统内原来的文件( /usr/share/rime-data/cangjie5.dict.yaml、cangjie5.schema.yaml ), 复制保存到其他地方。

如果采用”一般排序”,文件名、内部名称, 与 Linux 系统原来的文件名、内部名称一致。
无需修改,可以直接复制到: /usr/share/rime-data/。

sudo cp -i /home/UserName/Downloads/cangjie5.dict.yaml /usr/share/rime-data/

sudo cp -i /home/UserName/Downloads/cangjie5.schema.yaml /usr/share/rime-data/

如果采用:“簡化字優先“,

方法一:将 cangjie5_sc.dict.yaml、cangjie5_sc.schema.yaml 文件复制到 /usr/share/rime-data/, 然后修改文件 default.yaml。

假定 cangjie5_sc.dict.yaml、cangjie5_sc.schema.yaml 保存在 Downloads, 而且文件夹内没有任何其他文件。

$ sudo cp /home/UserName/Downloads/* /usr/share/rime-data/

$ sudo nano /usr/share/rime-data/default.yaml

找到 “schema_list:”

增加:
- schema: cangjie5__sc

保存, 退出后, 方法一,在 Rime 输入法, 选择“倉頡五代SC”。

方法二:需要适当修改文件。

cangjie5_sc.dict.yaml
name: "cangjie5_sc"

cangjie5_sc.schema.yaml
schema_id: cangjie5_sc
name: 倉頡五代SC

dictionary: cangjie5_sc

将文件名:共2处, 内部名称:共4处, 修改与原来文件一致。
然后用修改后的新文件替换系统旧文件。

Linux 系统原来的文件名、内部名称:
/usr/share/rime-data/

cangjie5.dict.yaml
name: "cangjie5"

cangjie5.schema.yaml
schema_id: cangjie5
name: 倉頡五代

dictionary: cangjie5

假定cangjie5.dict.yaml、cangjie5.schema.yaml保存在 Downloads, 而且文件夹内没有任何其他文件。

$ sudo cp /home/UserName/Downloads/* /usr/share/rime-data/

方法二,在 Rime 输入法, 选择“倉頡五代”。

E、在 Rime 输入法, 点击 “部署”, 就可以使用了,能打以前打不出来的字。

三、安装字体文件(font)
例如: “𮗙”, 是“見”+倒立的“鬼”组合而成。
六代編碼: 月山・的田片
五代編碼: 月山・中弓竹 (但是, 鄙人安装仓颉五代编码是:月山・竹山片/buhuz。)

如果输入仓颉码: ”月山・竹山片/buhuz “, 没有出现汉字:”𮗙/見+倒立的鬼“, 而是一个竖立的长方形符号。
这时需要安装字体(font)文件。

请以最新文件为准。

文津宋体/WenJinMincho
可免费商用的大字符集宋体字库,以OFL协议发布。/A large character set fonts in Songti(Mincho) style. Licensed under the SIL OFL 1.1.

WenJinMincho-TTF.7z
sha256:7ad006a3798eb1612852166b5e436b43365b9b5aa2b83b23db7755867ea8e0ef
https://github.com/takushun-wu/WenJinMincho/releases/tag/v2.003

参考资料:

Linux 字体安装完全指南:从基础到高级实践
https://geek-blogs.com/blog/linux-install-font/

第五代倉頡輸入法。
需要輸入大量古字、生僻字的專業用戶,請在「方案選單」中切換一次形如「通用 → 增廣」的字符集過濾開關,即可輸入七萬餘簡繁漢字。
https://github.com/rime/home/wiki/UserGuide#%E5%80%89%E9%A0%A1

如何顯示及輸入九萬漢字
1)使用倉頡平台里的《五倉世紀》《三倉世紀》或《五速世紀》輸入法皆可以輸入九萬漢字。
https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=195321

#仓颉
#倉頡
#cangjie

@board

鄙人初学仓颉输入法,请各位不吝批评、指正。谢谢!

汉字字频表 / Chinese character frequency list
https://lingua.mtsu.edu/chinese-computing/statistics/char/list.php
最近更新: 2005-12-21
备注:虽然年代久远,但仍然值得参考。

常见汉字字表和字符集
https://github.com/zispace/hanzi-chars

请以最新文件为准。
https://github.com/zispace/hanzi-chars/releases

sha256:9395fb135a13ed7a003acd9404dc2751f15ed60a067ff4ca4f9fe98079370cc1
https://github.com/zispace/hanzi-chars/releases/download/v0.1.1/hanzi-chars-text.zip
备注:是按照汉字笔画排序。

练习仓颉输入法, 根据自己的目标,将汉字字频表、中国、香港、台湾的常用汉字表, 合并汇总。
制成 MS Execl 表格、或者 LibreOffice Calc 表格。

LibreOffice 免费、开源
https://www.libreoffice.org/

LibreOffice Calc 表格, 复制、粘贴、取消公式的范围大概是 500~1000行(我电脑上的LibreOffice版本)。
解决方法:将数据复制、粘贴到空白 txt 文件, 这样就没有了公式, 然后再将数据复制、粘贴回到 LibreOffice Calc 表格。

表格内,在汉字旁边增加一列:仓颉码的英文字母, 方便练习仓颉输入法,久思不得其解,实在不会拆分汉字仓颉码时, 参考答案。
以 ibus-rime 为例, 仓颉码的英文字母在以下文件里:
/usr/share/rime-data/cangjie5.dict.yaml

反复阅读、练习《仓颉输入法-wikibooks》。
网页可以转换为简体字版本。
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95

练习《常用汉字字频表》,事先设定一个小目标, 例如: 练习常用汉字3500个。
不断反思、总结自己错误拆分汉字仓颉码的原因。

PDCA:plan, do, check, action

平常写文章就用仓颉输入法,终有一天发现自己如同行云流水、无拘无束、自由自在,使用仓颉输入法。

#仓颉
#倉頡
#cangjie

@board

“倉頡輸入法由朱邦復先生發明,後並與沈紅蓮女士共同加以改良。”

倉頡輸入法/维基教科书-wikibooks
网页可以转换为简体字版本
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95

自學倉頡課程與資料,歡迎自學倉頡輸入法!
https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=195357

labelroll 倉頡字典
https://www.labelroll.com/

hkcards 倉頡字典
https://www.hkcards.com/

倉頡大字典 測試版
(本倉頡字典收錄九萬漢字,任何回饋或建議請至論壇留言,謝謝)
https://www.chinesecj.com/cjdict/

下載倉頡字母及輔助字形表
有黑白版,彩色版,電腦 Wallpaper。
https://www.hkcards.com/b1/cj-table

注意!
戋: 仓颉码是:戈十/ij; 不是:戈大/ik。

倉頡輸入法/例外字
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E4%BE%8B%E5%A4%96%E5%AD%97

梁 Sir/香港
倉頡輔助字型練習
https://www.leungsir.net/cangjie3/cangjie7_fullscreen.html

注意!
犭:去掉最后一撇,是仓颉二代的辅助字形, 仓颉三代开始取消了这个辅助字形。
犭, 三代取码:大尸竹; 二代取码:大竹。

倉頡輸入法/輔助字形
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E8%BC%94%E5%8A%A9%E5%AD%97%E5%BD%A2

倉頡輸入法/版本差異
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E7%89%88%E6%9C%AC%E5%B7%AE%E7%95%B0

倉頡打字練習
https://www.leungsir.net/cangjie3/typing13_js2.html

倉頡輸入法練字遊戲
https://www.chinesecj.com/game/

倉頡練習
https://ikwbb.github.io/cangjietraining/

倉頡之友/馬來西亞
https://www.chinesecj.com/index.php

漢字的前世今生-兼談倉頡輸入法
陳海晏編著
https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=15024

倉頡之友.香港
https://www.cjhk.org/index.htm

Cangjie 倉頡輸入法
https://www.pascal-man.com/navigation/faq-java-browser/cangjie.shtml

倉頡輸入法教學、測驗
https://mrszeto.net/cj/learn-cj.htm

Pazu 薯伯伯.一直未被超越的神級輸入法——倉頡
https://photonmedia.net/pazu-cangjie/

Pazu 薯伯伯.學習盲打之必要,兼談倉頡
https://photonmedia.net/pazu-blind-typing/

中文輸入法/內木一郎
https://founder.acgvlyric.org/iu/doku.php/%E8%BC%B8%E5%85%A5:index
評論篇
我學中文輸入法(一):總論 — 2016/01/26
我學中文輸入法(二):嘸蝦米 — 2016/01/28
我學中文輸入法(三):行列、大易、快碼 — 2016/02/01
我學中文輸入法(四):倉頡 — 2016/02/03
平反倉頡(上) — 2016/02/07
平反倉頡(下) — 2016/02/08
截筆是「浩劫」嗎? — 2016/02/09
字根不良難煮字 — 2016/10/22
狗肉字根我不受 — 2016/10/26
製作篇
Win 8下的日和倉頡輸入法 — 2015/04/18

老話一句:不要學嘸蝦米,學倉頡!
https://terryhung.pixnet.net/blog/posts/2024986976

想學中文輸入法?就該學倉頡輸入法(一)
https://terryhung.pixnet.net/blog/posts/2016029318

想學中文輸入法?就該學倉頡輸入法(二)
https://terryhung.pixnet.net/blog/posts/2016029319

對嘸蝦米輸入法發明人劉重次先生一些言論的淺見
https://terryhung.pixnet.net/blog/posts/2025019153

《倉頡平台2022》測試版正式推出
https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=195320&extra=&page=1

如何顯示及輸入九萬漢字
https://chinesecj.com/forum/forum.php?mod=viewthread&tid=195321

文津宋体/WenJinMincho
可免费商用的大字符集宋体字库,以OFL协议发布。
A large character set fonts in Songti(Mincho) style. Licensed under the SIL OFL 1.1.
https://github.com/takushun-wu/WenJinMincho/releases/

Linux 字体安装完全指南:从基础到高级实践
https://geek-blogs.com/blog/linux-install-font/

汉字字频表/Chinese character frequency list
https://lingua.mtsu.edu/chinese-computing/statistics/char/list.php

常见汉字字表和字符集
https://github.com/zispace/hanzi-chars/releases

倉頡三代補完計劃
https://github.com/Arthurmcarthur/Cangjie3-Plus

倉頡五代補完計劃
https://github.com/Jackchows/Cangjie5

蒼頡檢字法〔Cangjie6〕
https://github.com/lotem/rime-cangjie6

沈紅蓮女士答問
Cangjie_Note/主觀人士倉頡探案集
https://github.com/mrhso/Cangjie_Note/blob/master/%E4%B8%BB%E8%A7%80%E4%BA%BA%E5%A3%AB%E5%80%89%E9%A0%A1%E6%8E%A2%E6%A1%88%E9%9B%86/%E7%AC%AC%E4%BA%8C%E5%BD%88.md

“朱先生薪盡火傳,要靠你們接棒了。”

备注:
z-lib, 搜索关键词:仓颉输入法、倉頡輸入法、朱邦復, 可以找到相关书籍。
Youtube, 也可以找到教学视频。不过,大多数是用粤语教学。

#仓颉
#倉頡
#cangjie

@board

倉頡輸入法 - 维基教科书,自由的教学读本

鄙人初学仓颉输入法,请各位不吝批评、指正。谢谢!

关于学习新编程语言的最后一件要记住的事情就是:别当一个“蠢游客”。
“蠢游客”就是那种去了一个国家旅游,然后回来抱怨那儿的饭不好吃的人。
“为什么这个白痴国家连汉堡都买不到?”
当你学习一种新编程语言时,不要假设它的工作方式太蠢,它只是不同而已,只有接受它你才能学会它。
《笨办法学Python》/著: 泽德 A. 肖(Zed A. Shaw)/译: 王巍巍

上士闻道, 勤而行之;
中士闻道, 若存若亡;
下士闻道,大笑之。
不笑, 不足以为道。
《道德经/老子》/第四十一章

人一能之,己百之;
人十能之,己千之。
果能此道矣,虽愚必明,虽柔必强。
《礼记》/中庸第三十一

我学习仓颉输入法的历程

一、搜集仓颉输入法的学习资料, 网站、电子书。
将仓颉输入法桌纸设为电脑桌面背景。

下載倉頡字母及輔助字形表
有黑白版,彩色版,電腦 Wallpaper。
https://www.hkcards.com/b1/cj-table

注意!
戋: 仓颉码是:戈十/ij; 不是:戈大/ik。

二、熟记仓颉中文字母(24个)、辅助字形、字根(90个)。
每天早上、晚上抄写N遍。
一有空,就拿出小纸条,记字形、字根。
然后上网练习。
后来可以按顺序全部默写出来。

梁 Sir/香港
倉頡輔助字型練習
https://www.leungsir.net/cangjie3/cangjie7_fullscreen.html

注意!
犭:去掉最后一撇,是仓颉二代的辅助字形, 仓颉三代开始取消了这个辅助字形。
犭, 三代取码:大尸竹; 二代取码:大竹。

相似字形,对比学习。
倉頡輸入法/輔助字形/相近字形辨析
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E8%BC%94%E5%8A%A9%E5%AD%97%E5%BD%A2

字首「礻」和「衤」的倉頡碼
https://www.hkcards.com/b1/cj-god-and-cloth

三、学习教材:
1、
《第五代倉頡輸入法手冊》
快速浏览一遍。

2、
《倉頡輸入法-wikibooks》
我将全部网页下载回来, 包括练习。
z-lib, 也可以下载这本书:《倉頡輸入法_維基教科書_20200705_爬取》。

倉頡輸入法/维基教科书
网页可以转换为简体字版本
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95

快速阅读章节,然后将每个例字练习输入。
记录自己拆分错误的字, 查询仓颉字典, 对比分析自己拆分错误的原因。
制作自己的常用、常错、疑难字表, 经常复习。

labelroll 倉頡字典
https://www.labelroll.com/

hkcards 倉頡字典
https://www.hkcards.com/

备注:字典有解释,可以复习仓颉输入法规则。
有些简体字查不到。
以上两个字典,有时对同一个字的拆码解释详略不同, 可以对比参看。

倉頡大字典 測試版
(本倉頡字典收錄九萬漢字,任何回饋或建議請至論壇留言,謝謝)
https://www.chinesecj.com/cjdict/

Linux 系统电脑的字表文件 (/usr/share/rime-data/cangjie5.dict.yaml), 也可以用来查找汉字的仓颉码。

四、练习常用汉字:简体字、正体字(繁体字)。

制作《常用汉字字频表》, 将一万四千个汉字手工输入一次。
标记自己拆分错误的汉字, 多次反复练习。

汉字字频表 / Chinese character frequency list
https://lingua.mtsu.edu/chinese-computing/statistics/char/list.php

常见汉字字表和字符集
https://github.com/zispace/hanzi-chars

倉頡打字練習
https://www.leungsir.net/cangjie3/typing13_js2.html

倉頡輸入法練字遊戲
https://www.chinesecj.com/game/

倉頡練習
https://ikwbb.github.io/cangjietraining/

学习时,遇到挫折,很容易打退堂鼓, 想走旧路:
“还是拼音输入法好啊”, ”还是五笔字型输入法好啊“。
其实,经常是旧的输入法在干扰现在的学习。

后来走在大街上,看到招牌,却在心里拆分为仓颉码。
我可能已经走火入魔了。
或许是:人心一痴,其技必良。
但愿如此。

五、个人学习笔记

一刀分两半:
九:大弓(乂、乙)
目:月山(月、凵)
井、并: 廿廿(艹、艹)

收:竖折、竖的实际高度是一样,所以取码顺序是:左、中、右。
发:点(“、”)的位置最高, 所以取码顺序是:右、左、中。

举一反三, 如果一个字不会拆码, 可以先尝试拆分这个字的某个部件。

非(中一尸卜), 尾码是“卜”, 以下字的字首、或者次字首、或者字身之尾码是“卜”。
非: 悲、辈、裴; 剕、䫍; 啡、罪、菲、匪、痱、靡

亦(卜中弓金)、业(廿金)的尾码是“金(八)”, 以下字的字首、或者字身之尾码是“金(八)”。
亦:恋、弯、蛮; 迹、赤、赫
业:晋、普; 碰、哑

半:火手, 伴:人火手,胖:月火手, 泮: 水火手。

特殊字:
来:木廿; 夹:大廿
來:木人人; 夾:大人人
倉頡輸入法/例外字
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E4%BE%8B%E5%A4%96%E5%AD%97

但是,
韭:是整体字(连体字),仓颉码:中尸一一(LSMM) 。
所以,“韮、韱、谶、籤”, 最后一码是: 一/横。

鄙人经常犯的错误:

1、错误划分字首、字身(次字首、次字身)。
例如: 临、順、鼋, 这些字的第一笔就是字首。

2、没有遵守省略原则: 部分省略、包含省略。
例如:勤: 廿一・大尸, 字首只取首尾两码(廿、一);
海: 水・人・田卜, 次字身只取首次两码, 省略了最后一码(戈/丶)。

3、把书写时的最后一笔当作尾码。
例如: 釜: 金大・一土金, 最后一码不是:一/横。
滏: 水・金大金, 最后一码不是:一/横。

「工、土、王」等鑲嵌形空框例字
三代倉頡把鑲嵌在「工、土、王」等形塊左右兩邊空框上的部件視爲被包含;
五代倉頡則取消了本規則。
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E5%8F%96%E7%A2%BC%E5%8E%9F%E5%89%87

4、错误划分整体字(连体字)、组合字(分体字)。
多次复习“倉頡輸入法:漢字分割、例外字”等章节。

未解决的问题:

裏:片金卜田土/zcywg; 裏:卜田土女/ywgv
郎:片金戈女弓/zcivn; 郞:戈女弓中/ivnl
秊:片金竹木竹/zchdh; 秊:竹木竹十/hdhj

以上两列汉字, 肉眼看不出区别, 但是计算机可以识别差异。
我没有学习仓颉六代“片/Z”的取码规则, 所以按照第二列仓颉码打字。

附录
仓颉输入法中文字母:

一、哲理类:
日月金木水火土
A B C D E F G

二、笔画类:
斜点交叉纵横鈎
代表字:
竹戈十大中一弓
H I J K L M N

三、人体类:
人心手口
O P Q R

四、字形类:
侧并仰纽方卜
代表字:
尸廿山女田卜
S T U V W Y

按照代表字的字面发音读

日月金木水火土
竹戈十大中一弓
人心手口
尸廿山女田卜

按照本来代表的笔画读

日月金木水火土
斜点交叉纵横鈎
人心手口
侧并仰纽方卜

我是按照“代表的笔画”来读。
即使仓颉六代将“斜”代表字由”竹“改为更常用汉字”的“,我照样读作:”斜“。
以不变应万变。

#仓颉
#倉頡
#cangjie

@board

下載倉頡字母及輔助字形表

下載倉頡字母及輔助字形表

君生我未生, 我生君已老。
君恨我生迟, 我恨君生早。
唐/无名氏

曾经沧海难为水,除却巫山不是云。
取次花丛懒回顾,半缘修道半缘君。
唐/元稹

“仓颉输入法原名形意检字法,是最早的电脑中文输入法,由朱邦复在1976年发明,属于形码输入法。”

“五笔字型输入法(简称五笔、王码)是王永民在1983年8月发明的一种汉字输入法。因为发明人姓王,所以也称为“王码五笔”。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的形码输入法。”

鄙人初学仓颉输入法,请各位不吝批评、指正。谢谢!

一、字根

五笔字型86版:234个;
仓颉五代: 114个。

二、取码规则:

五笔字型:
“书写顺序、取大优先、兼顾直观、能连不交、能散不连。”

五笔字型,按书写顺序取码, 实际是作茧自缚。
因为各人书写习惯不同, 必然导致打字不断出错。
例如:“戈、我”之类的汉字, 根据网络资料, 有的最后一笔是“撇/丿”, 有的最后一笔是:“点/丶” 。
鄙人习惯是写完斜钩, 再写斜钩上的一撇, 最后写一点。

有人担心如果不按笔顺取码, 会造成写字混乱, 这是杞人忧天。
古往今来, 人们的书写工具变了很多:刀、毛笔、铅笔、钢笔、圆珠笔等等。
其实, 只要把电脑打字, 看成一种书写工具就好了。
再说, 无论是拼音打字, 还是五笔、仓颉打字, 人们向电脑输入的都是英文字母。
可是, 并没有人因此手写汉字时, 把汉字写成英文字母。
说字形码会造成手写汉字混乱, 其实是危言耸听。

“目", 仓颉码:月山/BU。
仓颉输入法, 将“目"字拆分为“月”+“凵”,人们手写“目”字时,不会真的将“目”字断开来写, 而是怎么方便就怎么写。

仓颉:
完整原则:保留字形特征;
省略原则:部分省略、包含省略。

“一刀分两半”。

不能分割, 整体字(连体字), 取一、二、三、尾码, 最多取四码。

可以分割, 组合字(分体字), 分为字首、字身,合计最多五码。
字首,取一、尾码,最多两码。
字身,最多三码。

字身, 为整体字(连体字), 取一、二、尾码。
字身, 为组合字(分体字), 再分为次字首、次字身。
次字首,取一码, 或者一、尾码;
次字身,取一、尾码, 或者尾码。

无论仓颉, 还是五笔, 一个汉字与单笔画相连、相交,都有可能改这个汉字的结构类型(仓颉:连体、分体; 五笔:左右、上下、杂合)。
可是,五笔字型,有时不足四码,要考虑字型结构,费心费力。
也就是, 不足四码时, 要看最后一个笔画的类别(横、竖、撇、捺、折), 与整个字的结构类型(左右、上下、杂合), 组合起来,构成一个末笔识笔码。
但是, 大脑取得末笔识别码, 实在是需要经过大量计算,劳心劳力。

仓颉是首先对汉字砍一刀,
不能分割, 连体字;
能分割,分体字,然后对字首、字身(次字首、次字身)分别按规则取码。
首先看到森林:分为连体字、分体字;
然后再看树木:对汉字的各个零件分别取码,再合并组成仓颉编码。

“相同的字首或字身, 其字码固定。”
来源:《第五代倉頡輸入法手冊》第62页。

三、例外字:

五笔字型的例外字, 需要自己打字时, 不断总结。

仓颉所有的例外字,在《第五代倉頡輸入法手冊》第85页开始列明, 在以下网页,已经全部列出。
而且例外字, 实际成为一个大字根, 可以和其他汉字再组合成字。

倉頡輸入法/例外字
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E4%BE%8B%E5%A4%96%E5%AD%97

四、成字字根

五笔
键名汉字的编码: 连敲所在键的字母四次。
(一级简码:根据每一键位上的字根形态,每键安排一个最常用的高频汉字,这类字只需打一键即可。)

成字字根汉字的编码规则:键名码+首笔码+次笔码+末笔码。
例如:
戈/A: AGNT(工 + 横 + 斜钩 + 撇);
士/F: FGHG(土 + 横 + 竖 + 横)。

猜想:
成字字根汉字的编码规则,
如果改为笔画一、二、三、末笔码, 难度与现在一样。
如果改为像仓颉一样,按正常方式取码,一些可以用其他字根(非单纯笔画)组成, 一些只能用单纯笔画, 一笔一笔的组成。

结论:五笔字型的字根集合, 决定了它现在的成字字根编码方式。
也就是五笔字型有许多大字根, 是由其他小字根组成。
仓颉五代, 除了键名字根24个之外, 还有90个字根, 相应的成字字根数量很少。
仓颉五代, 只有少数几个大字根, 是由其他小字根组成。
所谓小字根,至少由两笔组成,不包含只有一笔单纯基本笔画的字根。
因为可以说所有的字根都是由五个基本笔画(横、竖、撇、捺、折)组成, 那样说了等于没说, 没有意义。

仓颉
键名代表字: 敲所在键一次。
成字字根汉字的编码规则: 按正常方式取码。
例如:
工/M: 一中一/MLM(横+纵+横);
士/G: 十一/JM(交+横)。

有些单笔画、多笔画, 与键名代表字一样, 只取一码。
例如: 一、丨、丿、丶, 亅、乂、㐅, 都只取一码。

对比两种输入法,就可以知道, 五笔字型的成字字根之取码规则, 实际就是重复取码, 重复取了键名码,而且增加了大脑记忆量。

五、总结取码规则:

五笔字型
1、最高频25个汉字, 只敲一码;
2、键名字, 连敲键名四下;
3、成字字根:键名码+首笔码+次笔码+末笔码;
4、一般汉字:取一、二、三、末,共四码;
5、不足四码, 增加末笔识别码。

仓颉:
1、键名字, 敲键名一下;
2、成字字根: 按正常方式取码;
3、整体字(连体字): 取一、二、三、尾码,最多四码;
4、组合字(分体字):字首, 取一、尾, 最多两码; 字身(次字首、次字身), 最多三码, 合计最多五码。
仓颉, 不会补充末笔识别码, 也不会重复取码。

六、重码率
超出8105个简体常用汉字范围,五笔字型重码率远远大于仓颉。
如果统计70391个汉字, 五笔字型重码率是48.51%, 仓颉为28.03%。

输入法 汉字范围 重码数量 重码率
cangjie5 3500 130 3.71%
wubi86 3500 46 1.31%

cangjie5 6500 336 5.17%
wubi86 6500 216 3.32%

cangjie5 8105 486 6.00%
wubi86 8105 437 5.39%

cangjie5 12041 847 7.03%
wubi86 12041 1685 13.99%

cangjie5 16361 1488 9.09%
wubi86 16361 3081 18.83%

cangjie5 70391 19734 28.03%
wubi86 70391 34147 48.51%

五笔字型,下列汉字全部重码,
仓颉输入法, 下列汉字全部唯一编码。
贝/赢,羊/羸,女/嬴,虫/蠃,果/臝,馬/驘,貝/贏,鳥/鸁

当然, 不能以仓颉之长攻五笔之短。
肯定有仓颉重码, 而五笔不重码的情况。

但是, 从整体来看, 五笔重码率远远大于仓颉, 是因为双方不同的字根、编码规则造成。
也就是说,重码率高,是五笔字型输入法的先天规则缺陷。

对比, 才知道两种输入法, 谁优谁劣。
怪不得有人说:吃过荔枝, 才知道生李子苦涩。

七、总结:
拼音输入法, 如果联网, 则侵犯隐私。
联想、提示词语, 其实也是一种变相的八股、教条、可能会限制人的自由思考。

五笔字型,要求遵守笔顺, 是作茧自缚。
字根多, 规则繁, 记忆量大。
学习, 或者重新学习的成本高。

仓颉输入法, 不按笔順,按视觉,”一刀分两半“,拆分汉字。
规则简单明瞭, 像拆积木一样拆码。
打字变成了游戏, 十分好玩。
学习, 或者重新学习的成本低。
所以, 鄙人使用仓颉输入法, 不打词语, 只打单个汉字, 自由组合汉字。

小时候, 联网的拼音输入法,已经是一统天下, 但是家人让我学习五笔字型86版输入法。
电脑中有仓颉输入法, 不知道当时为什么没有去学习?
因为是台湾人发明的, 因为没有教材,因为没有人引导……
还好这次没有当面错过, 没有入宝山,空手而返。

子曰:“朝闻道,夕死可矣。”
论语/里仁篇第四

附录:

汉字字频表/Chinese character frequency list
https://lingua.mtsu.edu/chinese-computing/statistics/char/list.php
有12041个汉字

常见汉字字表和字符集
https://github.com/zispace/hanzi-chars/releases

小學程度漢字
https://www.hkcards.com/cj/list-primary-school-level

常用字表一
https://www.hkcards.com/cj/list-common

汇总以上中国、香港、台湾常用字集, 得到16361个汉字。

【五筆字型】輸入方案
https://github.com/rime/rime-wubi
有70391个汉字, 61205个词语。
如果喜欢五笔字型86版输入法, 上面链接中的字表(wubi86.dict.yaml)已经够用了。

倉頡三代補完計劃
https://github.com/Arthurmcarthur/Cangjie3-Plus

倉頡五代補完計劃
https://github.com/Jackchows/Cangjie5

蒼頡檢字法〔Cangjie6〕
https://github.com/lotem/rime-cangjie6

#仓颉
#倉頡
#cangjie

#五笔
#wubi

@board

倉頡輸入法/例外字 - 维基教科书,自由的教学读本

如有问题,请各位不吝批评、指正。谢谢!

输入法 字根 键名字 成字字根
五笔字型 234 25 75
仓颉 114 24 13
备注:
成字字根只统计字频12041以内的汉字。
键名字,实际也属于成字字根。
纟: 五笔字型的键名字, 但不属于常用字频表内。

五笔字型:键名字、成字字根
序号 汉字 wubi86 cangjie5 常用字频表序号

键名字
1 王 ggg mg 131
2 土 ffff g 520
3 大 dd k 15
4 木 ssss d 682
5 工 a mlm 148

6 目 hhhh bu 278
7 日 jjjj a 67
8 口 kkkk r 224
9 田 lll w 714
10 山 mmm u 180

11 禾 ttt hd 3082
12 白 rrr ha 259
13 月 eee b 116
14 人 w o 6
15 金 qqqq c 206

16 言 yyy ymmr 204
17 立 uu yt 198
18 水 ii e 191
19 火 ooo f 431
20 之 pp ino 13

21 已 nnnn su 115
22 子 bb nd 27
23 女 vvv v 203
24 又 ccc nk 93
25 纟 xxx vvm

成字字根
1 戋 gggt ij 6763
2 五 gg mdm 166
3 一 g m 2
4 士 fghg jm 269
5 二 fg mm 72
6 干 fggh mj 389
7 十 fgh j 56
8 寸 fghy di 1698
9 雨 fghy meb 847
10 犬 dgty ik 2557
11 三 dg mmm 69
12 古 dgh jr 453
13 石 dgtg mr 368
14 厂 dgt mh 1155
15 丁 sgh mn 906
16 西 sghg mcw 137
17 戈 agnt i 1928
18 弋 agny ip 4378
19 廿 agh t 3865
20 匚 agn mv 4375
21 七 ag ju 353

22 上 h ym 19
23 止 hh ylm 565
24 卜 hhy y 1866
25 曰 jhng a 186
26 早 jh aj 456
27 虫 jhny lmi 1476
28 川 kthh lll 1009
29 甲 lhnh wl 858
30 四 lh wc 144
31 皿 lhn bt 4386
32 车 lg kq 370
33 力 lt ks 126
34 由 mh lw 156
35 贝 mhny bo 1269
36 几 mt hn 228

37 竹 ttg h 1496
38 攵 ttgy ok 5069
39 手 rt q 143
40 斤 rtt hml 1946
41 彡 ett hhh 6866
42 乃 etn nhs 473
43 用 et bq 57
44 豕 egt msho 3829
45 八 wty ho 321
46 钅 qtgn omp 4849
47 儿 qt lu 167
48 夕 qtny ni 1746

49 文 yygy xxyk 127
50 方 yy yhs 63
51 广 yygt yh 441
52 辛 uygh ytj 1119
53 六 uy yc 311
54 门 uyh lis 151
55 小 ih nc 70
56 米 oy fd 688

57 巳 nngn ru 1702
58 己 nng su 171
59 乙 nnl nu 1301
60 尸 nngt s 1505
61 心 ny p 90
62 羽 nny smsim 1669
63 孑 bnhg nnm 5399
64 耳 bgh sj 809
65 了 b nn 5
66 也 bn pd 26
67 刀 vn sh 1035
68 九 vt kn 340
69 臼 vth hx 3995
70 巛 vnnn vvv 7791
71 巴 cnh au 644
72 马 cn nvsm 205
73 弓 xng n 1962
74 匕 xtn uh 3701
75 幺 xnny vi 5173

仓颉:键名字、成字字根
序号 汉字 wubi86 cangjie5 常用字频表序号

键名字
1 日 jjjj a 67
2 月 eee b 116
3 金 qqqq c 206
4 木 ssss d 682
5 水 ii e 191
6 火 ooo f 431
7 土 ffff g 520

8 竹 ttg h 1496
9 戈 agnt i 1928
10 十 fgh j 56
11 大 dd k 15
12 中 k l 18
13 一 g m 2
14 弓 xng n 1962

15 人 w o 6
16 心 ny p 90
17 手 rt q 143
18 口 kkkk r 224

19 尸 nngt s 1505
20 廿 agh t 3865
21 山 mmm u 180
22 女 vvv v 203
23 田 lll w 714
24 卜 hhy y 1866

成字字根
1 曰 jhng a 186
2 八 wty ho 321
3 又 ccc nk 93
4 小 ih nc 70
5 士 fghg jm 269

6 广 yygt yh 441
7 肀 vhk js 5861
8 厂 dgt mh 1155
9 工 a mlm 148
10 乙 nnl nu 1301

11 入 ty oh 169
12 七 ag ju 353
13 匕 xtn uh 3701


总结取码规则:

五笔字型
1、最高频25个汉字, 只敲一码;
2、键名字, 连敲键名四下, 某些键名字,同时属于一级或者二级简码,所以只敲一码或者二码;
3、成字字根:键名码+首笔码+次笔码+末笔码;
4、一般汉字:取一、二、三、末,共四码;
5、不足四码, 增加末笔识别码。
末笔识笔码: 最后一个笔画的类别(横、竖、撇、捺、折), 与整个字的结构类型(左右、上下、杂合), 组合起来构成,劳心劳力。
五笔字型的成字字根之取码规则, 实际就是重复取码, 重复取了键名码,而且增加了大脑记忆量。

仓颉
1、键名字, 敲键名一下;
2、成字字根: 按正常方式取码;
3、整体字(连体字): 取一、二、三、尾码,最多四码;
4、组合字(分体字):字首, 取一、尾, 最多两码; 字身(次字首、次字身), 最多三码, 合计最多五码。
仓颉, 不会补充末笔识别码, 也不会重复取码。

附录:
汉字字频表/Chinese character frequency list
https://lingua.mtsu.edu/chinese-computing/statistics/char/list.php
有12041个汉字

【五筆字型】輸入方案
https://github.com/rime/rime-wubi
有70391个汉字, 61205个词语。
如果喜欢五笔字型86版输入法, 上面链接中的字表(wubi86.dict.yaml)已经够用了。

倉頡三代補完計劃
https://github.com/Arthurmcarthur/Cangjie3-Plus

倉頡五代補完計劃
https://github.com/Jackchows/Cangjie5

蒼頡檢字法〔Cangjie6〕
https://github.com/lotem/rime-cangjie6

#仓颉
#倉頡
#cangjie

#五笔
#wubi

@board

@lucy18

某也考虑过学仓颉,但后来还是选了其他码。