声笔拼音

1 引言

拼音输入法是中国大陆目前使用得最为广泛的输入方案,其用户比例至少在96%以上,甚至可能高达99%。确切地说,这里的拼音输入法是全拼输入,不包括双拼,因为后者使用的人非常少,相比全拼可以说是微乎其微。

在中国大陆,任何需要输入中文的设备或者操作系统,不论电脑、手机还是平板、电视,也不论Windows、MacOS、Android还是iOS,全拼输入方案都是必备的,而且是默认的中文输入方式。不管国际大公司如微软、谷歌、苹果,还是国内大厂如腾讯、百度、讯飞、华为,都推出了自己的拼音输入法。曾经那种万码奔腾的局面已经一去不复返了,大街小巷的五笔打字培训班也已经成为历史的记忆,自然码、两笔、郑码等其它原来比较知名的输入方案则越来越少为人知。笔画输入法也只有很少的人在使用,一般是功能机时代沿袭下来的。

为什么会形成全拼输入一家独大而其它输入方案几乎销声匿迹的现象呢?是全拼输入已经完美的解决了中文输入的问题,人们已经非常满意,别无他求了吗?拼音输入没有改进、优化的地方了吗?非也!而且远非如此!实际上,现在的拼音输入法还存在很多问题,有的问题可以说是怨声载道,有的问题是因为缺乏指导而使用不当造成的。同时,现在也已经有了很好的拼音输入法改进方案,如声笔拼音,只是知道的人还很少而已。在拼音之外的输入方案就更多了,只要科学地评估和选择,完全能够找到适合自己的称心如意的输入方案。

1.1拼音输入的误区

初学者在使用拼音输入法时,因为缺乏指导、随意输入,使得不少人养成了不好的输入习惯,陷入了拼音输入的一些误区,比如整句误区、联想误区和简拼误区。现在将对这些误区进行逐一剖析,以求规避之道。

1.1.1 整句误区

现在的拼音输入法常常被称为智能整句输入法。人们在描述输入法发展历史的时候,也常常说从字到词到句。从理论上来说,更大的语境更有利于提高音字转换的正确性。从算法上来说,通过长期的积累,已经有成熟的隐马尔科夫模型。从硬件上来说,CPU、内存、硬盘等性能大幅提升,价格大幅下降,已经不是问题。加上互联网的成熟,更可以利用大厂服务器的资源和大数据来提升智能整句输入法的能力。从用户的角度来说,使用整句输入可以没有分词的负担,还可以少按大量的空格,只需要练熟400来个音节拼式,只管一个劲地击键就行了。似乎一切都完美了!

然而,实际情况却让人大跌眼镜,绝大部分人并没有以整句为单位来输入,真正采用整句输入的人其输入的效率也并不高。最能称得上整句输入法的微软拼音整句模式,可以算是技术上的精品了,但是采用的人并不多。微软拼音在面对搜狗、百度等利用搜索引擎和网络词库的次整句输入法时,显得力不从心,用户数量越来越少。所谓次整句输入法是指它遇到空格和标点符号就会上屏默认转换结果,而并不是要等到一句话输入完成才确定转换结果,介于整句模式与字词模式之间。为什么会出现次整句输入法大行其道的局面?这难道不是一种倒退吗?难道用户都这么愚昧吗?整句输入的问题出在哪里?问题出在以下几个地方。

(1) 编码效率低

拼音作为编码来说,编码效率太低,导致平均码长过长,超过了三码。汉语拼音的设计初衷是用于注音识读,所以遵循了音素化和国际化的原则。在这些原则的指导下,由于普通话自身的特点,使得拼音字母的利用效率很低,存在大量冗余。从编码的角度来说,用26个字母表达400个音节,每个音节只需要不到2个字母,因为26×26=676,可用的编码空间远远大于400,而汉语拼音却用了超过3个字母,所以效率会低。

(2) 确认成本高

整句的转换结果在输入的过程中可能会不断地发生变化,所以不到输入结束是不能判断其正误的,能够判断正误的只有输入的拼音串,拼音串不会发生变化。然而拼音并不是文字,人们对它的识读能力是很弱的,最多只能快速找出刚才输入的一两个音节的错误。因此,在输入过程中,最多只能做到输入的拼音串尽量不要出错。在一句话输入完成后,用户不通读一遍转换结果,是无法知道对错的,即使结果完全正确,这一步都是少不了的,而且句子越长判别正误的成本越高。

(3) 回改成本高

如果在上屏前确认时发现了错误,就需要进行回改。错误可能发生在一句话的任何位置,可能是转换结果有错,也可能是输入的拼音串有错。发现错误的位置后,需要先定位才能修改,其定位方法一般是用左箭头键逐个音节向前移动,用右箭头键逐个字母向后移动。箭头键的位置远离本位键,操作跨度大,缓慢、费时。还有一个少用的方法是用Ctrl加字母键来定位,其特点是用键次数少,但是操作难度大。

(4) 残错概率大

不少人习惯于在输入过程中监视转换结果,在输入最后一个字词时就不再观察转换结果,然而可能会正是这最后一个字词又导致前面已有的结果发生变化,导致错误。这种错误,用户往往不容易发现,使得残错率升高,因为他不自觉地会认为,前面是正确的,最后一个选择也正确的话,就不会有错了。另一种情况是,明明知道还有错误,但是因为觉得修改太麻烦了,就不愿意修改而直接上屏了;这在打字比赛之类的紧急场合和聊天之类的不严肃场合是很常见的。

(5) 可重用性差

拼音输入法是以输入单位进行记忆的。以句子为单位进行输入,就是以句子为单位进行记忆。而句子,除非是很短的日常用句,在使用中重复的可能性是非常小的。输入法很难学习到用户的输入习惯,也就很难根据用户的输入习惯来改进输入效果。

(6) 自由度受限

为了提高转换的准确性,行文就不能有创意,要尽量使用大众化的表达方式。用俗话来说,就是要尽量打水文。你要说「检查错误的方法」而不要说「查错法」或者「检错法」。要使用这种简略的说法,需要事先造词,然后才能用在句子当中。造词的过程并不简单,你得先以词为单位输入一遍,在句子中输入一遍是不能造出这个词的。可是,按词输入是整句模式的弱项,选重非常麻烦。更为伤脑筋的是,你常常并不知道系统中是否有某个词。

(7) 适应性不强

在不少时候,用户无法以句子为单位来进行输入。例如,在进行文章的审校时,往往是只是对个别的字词进行修改,这时不得不以字词为单位来输入。又如,在列出人名时,也只能以名字为单位进行输入,而不是句子。再如,打购物清单的时候,也只有逐个物品的输入。所以,整句输入适应性差,是不完备的输入方式。

有鉴于以上原因,拼音输入应该以字词为单位而不是以句子为单位。实际上,除了极少数死心塌地的整句派,大多数人也是这么做的。先进行正确的分词,然后按字词进行输入,可以在一定程度上同时克服以上四个问题。在输入字词时可以适时地使用简拼,从而缩短码长,提高编码效率。字词的长度一般不会超过四个字,确认和回改的成本会大大降低,错误更容易发现和修改,残错率也会减小。

我们现在举两个例子来加以说明,使用的是搜狗输入法。都采用两种方式来输入,一种以整句为单位,另一种以字词为单位,后者不便于截图就没有附图了。在拼音串中,阿拉伯数字表示选择,_表示空格,.表示翻页。

例子1(22字):中文输入法是在信息社会必须使用的重要工具之一
整句(65键):zhongwenshurufashizaixinxishehuibixushiyongdezhongyaogongjuzhiyi2
字词(55键):zhongw_srf_s_z_xinx_sheh_bix_shiy_d_zhongy_gongj_zhiyi_

搜狗例子1

例子2(16字):声笔系列码是顶功输入法的典型代表
整句(64键):shengbixiliemashidinggongshurufadedianxingdaibiao.2..32..4.3..23
字词(52键):shengbi.43_xil_ma.2s_dinggong.42srf_d_dianxing_daib_

搜狗例子2

可以看出,即使在例子1完全输入和转换正确的情况下,整句方式的用键都更多;在例子2转换错误比较多的情况下,就更是如此了。如果例子1中【在】字的拼音误输成了za,那么麻烦就大了。

搜狗例子3

这时,要么按15次左箭头键定位到za之后追加i,要么先选中za之前正确的【中文】【输入法】【是】三个词再想法修改,此时显然后者划算一点,按此操作后的情况如下。

搜狗例子4

此时,按Home键先定位到za之前,再按两次右箭头键定位到za之后,追加i后,总算是修改正确了。

搜狗例子5

可见,定位修改过程之繁琐。更可悲的是,许多人还根本不知道这种定位修改法,搜狗的官网帮助都没有介绍。于是使用者往往是将错就错,或者是上屏后再来修改。如果是以字词为单位输入,那么在输入【在】字时一般只用声母加空格就行了,或者在输入za后立刻就可以发现错误、进行纠正了,绝不会变得如此积重难返。

搜狗、百度等输入法还都支持按住Ctrl键+字母来进行音节首字母定位,重复按加按同一个字母则定位下一个以此字母开头的音节。这样,上例只需要按Ctrl+x就可以定位在za的后面了,可以少许多次按键。

搜狗例子6

然而,对一般的人来说,加Ctrl的复合键操作难度是很大的,很容易按错键,也不是很实用,不能改变整句方式不好用的本质。

1.1.2 联想误区

在使用默认开启联想的输入法(例如百度手机输入法)时,有的用户不自觉地会养成单字加联想的输入习惯。在没有指导的情况下,对于初学者来说,逐字输入,选择重码上屏后,根据联想来再次选择所需要的字词是最为轻松的路径。这种输入方式在不用分词这一点上与整句输入是类似的,是初学者喜欢的原因之一。

不少初学者觉得,汉字输入不就是输入汉字吗?于是,输入一个音节后就看看有没有自己要的字,没有的话翻页再找直到找到为止,然后选择上屏。上屏后发现输入法居然提示了自己想要的字词,心中大喜,毫不犹豫地再次选择上屏,就这样逐步对联想产生了依赖。由于依赖的缘故,即使在当前页没有提示出自己想要的字词,即使输入法没有收录,也会不自觉的翻页去查找,在尝试多次找不到以后,才会重新输入字的拼音。以上过程周而复始地进行,便陷入了联想的误区。

现在以百度手机输入法举例来说明一下单字加联想的输入方式。由于单字重码多,而且联想的内容也可能很多,所以需要大量费时的查找选择操作,输入效率很低。

例子:联想误区
操作:在输入lian后,首页找到了「联」字。

百度例子1

选择上屏后,在首页又找到了「想」字,再次选择上屏。

百度例子2

在输入了wu后,首页并没有「误」字,需要下拉翻页才能找到。

百度例子3

选择「误」上屏后,首页找不到「区」字,需要滑动翻页查看才能找到。

百度例子4

实际上,以上例子直接用词组来输入是非常简单快捷的。输入lianx,在首页就出现了「联想」。

百度例子5

输入wuqu,在首页就出现了「误区」。

百度例子6

可喜的是,大多数拼音输入法已经意识到了这种联想输入方式带来的问题,所以默认大都不会开启联想功能,有的甚至取消了这个功能。不过,一定要提醒用户,注意避开这个误区。

1.1.3 简拼误区

有些比较聪明的初学者,特别是那些韵母掌握不太好的,会陷入简拼的误区。他们发现许多词组只要输入声母就可以出来,于是希望尽量利用这个“窍门”来节约用键,避免输入韵母,养成了只打声母,然后进行查找选择的习惯。

我们以百度PC端拼音输入法为例来说明。

在输入「我们」「他们」「可以」之类的词组时,一般都只需要输入两个字的声母就出来了,而且往往是首选。

百度例子7

但是,如果输入「简拼」,只输入声母的话,重码太多,在第16页上还是没有发现。

百度例子8

即使补全「拼」字的韵母后,也要在第4页上才会出现。

百度例子9

所以,虽然简拼有的时候能够大大节约用键,提高输入效率,但是运用不好的话,也可能适得其反,更不能教条化地无条件使用。至于如何正确使用,我们将在讲到拼音输入技巧时详细论述。

1.2 拼音输入的技巧

采用拼音来进行中文输入,并不是随心所欲就能做好的,需要掌握不少的技巧,才能提高效率。作为键盘输入法来说,首先要确定使用多少键的键盘,然后就是采用什么样的指法,最后也是最重要的是以什么为单位来输入以及怎么输入。

1.2.1 键盘类型

如果是使用电脑或者PAD,那么毫无疑问,肯定是采用26键的键盘,没有什么选择余地。但是,在手机上,情况就变得非常复杂了,现代触屏手机上改变键盘就是换一个皮肤那么简单,于是花样百出,9键、13键、14键、17键、26键等,让人目不暇接,不过最主要的还是26键和9键两种。

在摩托罗拉和诺基亚主宰世界的功能机时代,手机用户只能使用T9输入法,形成了使用9键的习惯,导致他们不少人在现代大触屏手机上沿用了下来,不愿意付出学习26键输入法的成本,这是9键还有不少用户的重要原因,而新的用户基本上都是采用26键的。固执的9键用户列出的其它原因还有:26键太小,容易误触;9键可以单手操作,另一只手可以同时干其它事情。其实,说26键容易误触,完全是由于缺乏训练造成的,因为大量的人在使用26键,都没有觉得有什么严重的误触问题。至于单手操作,用在当前的手机上是很不方便的,因为手机越来越大,也越来越重,单手操作是很累人的;另一只手干其它事情就更不应该了,因为在人们想尽量避免被手机绑架的今天,既然不方便双手操作,就最好暂时不要用手机打字,离开手机休息一下,等方便的时候再使用。

26键与9键

所以,无论用电脑还是用手机,用户都应该使用26键的键盘,而不是9键,更不是14键、17键等。即使是9键输入法的老用户,付出一定的学习成本来熟悉26键输入法,也是非常值得的,正所谓磨刀不误砍柴工。在电脑和手机上使用统一的键盘布局,只需要形成一套输入习惯,可以大大地节约学习时间。用26键输入也比用9键输入使用的平均码长更短,选重码的概率更低,而且在熟悉以后击键率也可能不输9键。即使键速稍微次一点,前两项带来的效率提升也会大过9键击键率稍高带来的好处。另外,用9键能使用的输入法有限,基本上仅限于拼音和笔画,不便于在必要时迁移到其它更专业的输入法。

1.2.2 击键指法

要提高打字效率,击键时的指法是非常重要的。而实际情况却令人担忧,有的人一指禅,有的人二指禅,有的人乱指禅,只有少数人严格遵循标准指法进行过练习。练习标准指法的人前期比较痛苦而且速度还不如随心所欲地乱按快。然而,经过一段时间,练标准指法的人其击键速度就会大大高于随心所欲的人,通过短期的付出来获得长期的收获。

电脑打字有成熟的标准指法,十个手指分工明确,各司其职,如下所示。

标准键盘指法

手机打字虽然还没有明确的标准,但是双手拇指分工操作,大致各分管一半的按键,其它手指握住手机,已经成为快速打字的成熟操作方法。

手机打字指法

1.2.3 输入单位

在前面论述拼音输入误区的时候,已经得出结论:以整句为单位来输入中文是不可取的,而且单字加联想的方式也是应该避免的,简拼也不要不分青红皂白地使用。那么,正确的方式是应该以字词为单位来进行输入,并且综合利用各种技巧。字词再加细分,又可以分为单字、二字词、三字词和多字词,以下分别论述其正确的输入方法。

(1) 单字

汉字的同音字现象很严重,单字输入时重码多,码长长,人机交互频繁,不利于提高输入速度,所以要尽量避免,只有在不能组词的情况下才使用单字。在输入单字时,又分超高频单字、一般单字和局部重复使用的单字几种情况而有不同的输入方式。

a. 超高频单字

超高频单字是指少数使用频率非常高的单字,如「的」「一」「是」「了」等,它们一般只需要用一码就行了。这类字很容易形成条件反射,不假思索地就打声母加空格了。但是,在主流的拼音输入法中,拼音首字母上的字不是固定的,会随着你的使用发生变化,这就容易造成误输入。例如,用百度PC端输入法,在输入h后,就可能有以下不同的结果。

百度例子10

对于初学者来说,这种动态调整也许是有益的,可以尽量减少用户的按键操作,因为输入法是根据该字的使用频度和已经输入的字词来排列一简字的。但是,稍微熟练点的用户就会希望将拼音首字母上的超高频字固定下来,因为人会对高频反复的动作形成条件反射。固定一简字后,可以对一简字进行盲打,提高击键速度,比之频繁的人机交互更能提高打字速度。固定超高频字的方法是利用输入法的自定义短语功能为你选定的超高频字固定一个字母。

在键入首字母后,除了作为首选项的一简字,还有一些其它字可以直接用数字选择上屏。初学者常常会去选择它们,因为可以节约用键啊。一定要抵抗住这种诱惑,否则会养成坏的习惯。为什么呢?因为那些字是动态变化的,扫描这些选项来找到需要的字是很费时间的。而且,数字键不好操作,容易按错,对初学者更是如此。

还有一种诱惑更要抵抗住,那就是输入第一码后通过翻页去找后面的字,除非你不知道韵母。这是一种效率极低的输入方法,有太多的人机交互,不但会导致击键缓慢,而且用不了多久,眼睛就会疲乏倦怠而受不了。

b. 一般单字

一般单字是指一简字之外的其它单字。这种字一般是采用全拼输入。如果有重码就用数字键来选择。通常默认有五个选项,分别用12345作为选择键,首选项可以用空格上屏,而且一定要用空格上屏才能提高效率。选项的数量虽然可以通过设置调整为最多10个,但是不建议这么做,因为选项过多会加重人机交互的负担,效率反而降低。

如果所要的字没有出现在当前页,一般人都是进行翻页查找,这对于高频字可能没有问题,其它字就可能需要很多次翻页查找。例如,「译」字,就需要六次翻页,在第七页才出现,而且如果不仔细看的话很可能看漏。如果要输入「疫」字,那么需要的翻页次数就更多了。

百度例子11

怎么避免翻页呢?答案是添加辅助码,其方法是,先按Tab键,然后输入笔画或者部件名称的首字母。横竖撇捺折五种笔画分别用hsbnz来表示。部件的名称有的时候不好琢磨,比如「疫」的两个部件辅助码为bs,很少有人知道「殳」的读音为shu。下图所示是输入「疫」字时分别加笔画和部件辅助码的情况。

百度例子12

在手机上的操作方式是类似的。在输入拼音后,下拉翻页,再点击笔画来过滤。不过,手机上只有笔画辅助码,没有部件辅助码,而且笔画也只能使用首笔。每页有多达二十个选项,当页没有的话,还可以再下拉翻页。操作过程如下图所示。

百度例子13

c. 局部重复单字

对于刚才输入过的字,即局部重复的字,输入法会动态的将其提前。例如,上例中的「疫」字,在输入过一次以后,只要输入它的拼音首字母,它就会出现在首位。

百度例子14

当然,如果你已经将一个超高频字比如「一」通过自定义短语固定给了y,那么就需要输入yi才会有「疫」出现在首选。

(2) 二字词

二字词在中文里是使用得最多的词组,数量很大,同音词现象非常严重,掌握其输入技巧是极为重要的。与单字的情况类似,也可以分为高频词、一般词和重复词三种情况。如何判断一个词是否为高频词,没有一个简单的规则可用,只能凭借经验和直觉了。

a. 高频词

对于使用频率很高的二字词,应该采用简拼来输入。例如,「我们」可以用wm,「非常」一般用fc即可。

百度例子15

如果首页没有你要的词,一定不要翻页查找,而是应该继续输入第二字的韵母。例如,「文明」在输入wm后,如果没有,就补全为wming。

百度例子16

这时如果要输入的是「亡命」,又怎么办呢?一种方法是,按左箭头键一次将光标向前移动一个音节到w后,补充输入「亡」的韵母ang,然后按End键将光标移动到最后。

百度例子17

更好的方法是,不移动光标,而按Tab后添加首字前两笔的笔画辅助码,「亡命」就出现了。

百度例子18

如果要输入的词不存在,也可以通过以上方式来造词,而不是用Esc清除后重新输入,造成浪费。比如,输入「声笔」的情况如下。在输入sbi后,当前页没有,按Tab键追加首字的四个笔画hshz,「声」字出现在首位,按空格上屏后,「笔」字也出现了。

百度例子19

b. 一般词

如果用户判断要输入的二字词不是特别常见,那么第一个字就要采用全拼,第二个字先用简拼。这种方式的用键比较多,优点是确定性更好。例如,要输入「撞针」,则先输入zhuangz,发现没有,于是再补全第二字的拼音,该词就出现了。

百度例子20

如果遇到不存在的词,则按Tab键添加首字笔画或者部件的声母,逐个选择输入单字来造词。还是以「声笔」一词为例,输入过程如下。

百度例子21

这里需要注意的问题仍然是,要避免陷入翻页查找的误区。虽然有的时候翻页一次就能找到,但是也会常常遇到多次翻页都找不到的情况,总体平均下来成本会更高。

如果已经估计到一个二字词在输入法中不存在,那么还是用全拼来输入后造词是最好的。

c. 重复词

对于上文刚出现过的二字词,一般可以直接采用简拼来输入。比如,上文才输入了「撞针」和「声笔」,那么分别用zz和sb就可以输入它们了,可以节约大量的用键。

百度例子22

(3) 三字词

在中文里,三字词的数量比二字词少得多,而且三字词拼音提供的编码信息量大,所以效率最高并能避免浪费的输入方式是,先用简拼,未出现则补全末字的拼音,再未出现则按Tab键后追加首字的笔画。例如,输入「浆纱机」的过程如下。

百度例子23

对比以下可能的其它方式。可以看出,提供的拼音越全面,确定性也就越高,但是用键也越多。

百度例子24

对于「浆纱机」一词的输入来说,以上的第一种方式用键还更省,而且不用追加笔画,似乎是更好的。但是,这些方式不能以最简的方式来输入「计算机」「教师节」等词组,总体说来还是不划算的。如果上文才输入过「浆纱机」,那么用简拼就是理所当然的事了,与推荐的方法也是吻合的。

如果我们觉得输入法应该有的词,按照简拼优先的方式输入后发现没有,那么仍然可以Tab追加笔画来造词,比如输入「声笔佬」的过程如下。

百度例子25

还是要强调一下,如果明明知道某个词在输入法中没有的话,那么还是用全拼来造词是最好的。

(4) 多字词

多字词是指四字及以上的词,它们数量虽然非常大,但是简拼能够提供的信息也足够丰富,所以应该以简拼作为最佳输入手段。例如,「欣欣向荣」「天王盖地虎」,输入前四个字的简拼后就出来了。

百度例子26

与其它类型词组不同的是,如果通过简拼没有找到所需的词,那么最好就不要用补全末字拼音和追加笔画的方式来造词了,而应该用Esc键清除编码后,改用全拼输入来造词,这是因为已经输入的编码并不多,而追加韵母和笔画造词又太繁琐。

1.3 拼音输入的改进

通常,为了在使用拼音的情况克服以上问题,人们首先想到的可能就是采用双拼。但是,双拼的门槛还是不低,需要记住30来个韵母、3个翘舌声母和零声母的表示形式,而且仍然不能解决重码多的问题。

声笔拼音则另辟蹊径,以全拼为基础,进行适当的变形,只需花费比双拼小得多的代价,就可以取得相当于甚至高于双拼的输入效率。声笔拼音是一种非常「奇特」的拼音输入法,它完全颠覆了人们对拼音输入法的认识,平均码长和重码大幅度减少,翻页键很少用得着,输入效率大大提升。

声笔拼音三板斧,实现三次大飞跃

  1. 优化编码:缩短和变换拼式、直辅笔画
  2. 固定简码:截断固定、数选固定
  3. 省略用键:最佳路径、省略空格、简化回改

1.4 适用人群

声笔拼音适合什么样的人使用呢?声笔拼音是对现有拼音输入法的优化和改进,所以它适用于正在用拼音输入中文的所有人,可以仅花费极小的代价就获得高得多的中文输入效率,而不必花更多的时间和精力去学习双拼甚至五笔等。声笔拼音将彻底改变人们对拼音输入时重码多、效率低的刻板印象,是最佳的拼音输入法升级方案。

如果您的拼音非常糟糕,对韵母的掌握一塌糊涂,声母也分不清平翘舌什么的,同时又想有一个简单高效的输入方案,那么强烈建议您使用声笔系列码中的声笔简码,它仅使用不分平翘舌的声母和五个笔画,就能取得比声笔拼音还高的输入效率。

1.5 内容介绍

本文只涉及声笔系列码中的声笔拼音。有关声笔系列码的总体情况请参见总体介绍。有关下载、安装和配置的方法,请参见安装配置。有关声笔系列码的发展历史,请参见发展历程。对于一些常见问题的解答,请参见常见问题。声笔系列码的其它输入方案详见各自的专题。

2 声笔拼音初步

2.1 编码规则

声笔拼音的编码元素为声母、韵母和笔画,具体表示方法与现行拼音输入法有一定的差异,请注意以下几点。

  1. 冠零声:用v表示零声母,即作为以a e o开头的音节在形式上的声母。例如,ai ei ou就变成了vai vei vou
  2. 去翘舌:不区分平、翘舌音,即省略zh ch sh中的h。例如,zhou chao shi就变成了zou cao si
  3. 省韵腹:在声韵相拼的时候,声母j q x后接以ia ie io开头的韵母如 ia ie iao ian iang iong 时,要省略i。例如,传统拼音里的 jie qiong xiang 在声笔拼音里则变成 je qon xan
  4. 截韵尾:音节长度超过3时,则截断为3。例如,biao变成bia,而guan变成gua。这也导致了不区分前后鼻音,即省略ng中的g。例如,bang zong就变成了ban zon
  5. 去鼻音:将末尾的n置换成其前面的元音字母。例如,bin变成bii,而xan变成xaa
  6. 理特例:将韵母 er 合并到 eü 合并到 uê 合并到e。例如,er 变成ve 变成nu,而ê变成ve。特别注意,ü 没有像传统拼音输入法那样用 v 来代替。
  7. 补笔画:补充笔画直至码长为5,笔画不够时重复末笔;横竖撇捺折五个笔画用eiuoa来表示。例如,「笔」的拼音为bi,追加前3个笔画后编码为biueo。又如,「将」的音节为jaa,追加前两个笔画后的编码为jaaoe。再如,「乙」的音节为yi,而「乙」只有一个笔画,所以要重复两次才能形成编码yiaaa。需要注意的是,在实际输入的时候,一般是不用5位全码的。

通过以上简单的改造,就可以取得以下奇特的效果。

  • 音节之间界限完全明确,在连续拼写的时候根本不需要使用隔音符排除歧义。例如,xi'anshi变成了xivaasi
  • 降低了学习门槛,不再需要区分平翘舌和前后鼻音。虽然现有拼音输入法也可以设置模糊音,但是会影响汉字转换的准确性,而在声笔拼音中不会有这个问题,因为声笔拼音中不再保留翘舌音和后鼻音的拼式。
  • 拼写形式得到了缩短,同时重码还可快速去除。例如,zhuang变成了zuamiao变成了mia。这种对音节形式的压缩方式虽然会产生一些归并重码,但是声笔拼音可以通过直接追加笔画的方式来进行快速筛选,所以并不会成为一个问题。

下面我们通过一些例子来熟悉一下上述7条编码规则,对于每个字,依次加以运用这些规则就是了。当然,在熟悉以后,是不必每个规则都去用一下的,因为直觉会告诉你哪个或者哪些规则是适用的。

  1. 声sheng:不是零声母音,不适用规则1;用规则2去除翘舌后,拼式变成seng;没有韵腹,不适用规则3;用规则4截去韵尾后,拼式变成sen;用规则5去掉鼻音后,拼式变成see;不是特例,不适用规则6;用规则7补充笔画后,拼式变成seeei。
  2. 将jiang:不是零声母音,不适用规则1;不是翘舌音,不适用规则2;用规则3去掉韵腹后,拼式变成jang;用规则4截去韵尾后,拼式变成jan;用规则5去掉鼻音后,拼式变成jaa;不是特例,不适用规则6;用规则7补充笔画后,拼式变成jaaoe。
  3. 快kuai:不是零声母音,不适用规则1;不是翘舌音,不适用规则2;没有韵腹,不适用规则3;用规则4截去韵尾后,拼式变成kua;没鼻音,不适用规则5;不是特例,不适用规则6;用规则7补充笔画后,拼式变成kuaoo。
  4. 儿er:用规则1添加零声母后,拼式变成ver;规则2、3、4、5都不适用;用规则6后,拼式变成ve;用规则7后,拼式变成veuaa。
  5. 虐nüe:规则1、2、3、4、5都不适用;用规则6后,拼式变成nue;用规则7后,拼式变成nueie。
  6. 创chuang:用规则1后,拼式变成cuang;用规则4后,拼式变成cua;用规则7后,拼式变成cuauo。

2.2 反查方法

在使用声笔拼音时,特别是在学习声笔拼音之初,有时会遇到不会打的字。怎么办呢?程序提供了丰富的反查手段,可以通过笔画和一般拼音来反查编码,还可以采用字海两分来反查和输入非 GBK 汉字。

2.2.1 拼音反查

在知道一般拼音而不知道字形时用 i 引导拼音反查。

例如,要反查「访」字的编码,就在输入 i 之后再输入它的拼音fang,所以实际的输入为 ifang,结果如下图所示。反查出「访」字的编码为 faaoa。如果是多音字,那么就会有多个编码,如图中的「房」字就有 faaoapaaoa 两个编码。

image-20230119141154259

对于零声母字,如「案」字,在反查时除了用i 引导还需要在正常拼音的前面加 v,因为 an 是零声母音,所以实际的输入为 ivan。在下图中提示出的案vaaoo,表示「案」字的编码为 vaaoo

image-20230119141227772

2.2.2 笔画反查

在完全不知道读音的时候,直接用 aeuio 按顺序输入笔画进行反查,无需引导。

在下面的笔画反查的例子中,不用引导而直接输入 uuao 后,出现了以这四个笔画开头的字。第一项是反faauu,表示「反」字的编码为 faauu。第二项为般baauu pouua paauu,说明「般」是个多音字,有三个编码。

image-20230119141708786

2.2.3 两分反查

通过 i 引导的拼音还支持用字海两分法来进行反查, 支持查找八万多汉字,一般用于反查难读而易于两分的字或者输入 GBK 以外的字。GBK 以外的字,声笔拼音不提供正常编码,不能按正常方式输入,只能在两分查找到后选择输入。

下面是字海两分法查找的例子。第一个例子是反查「龖」字的编码,在输入到第二部分拼音的第一码时就出来了。第二个例子是通过输入「尸」和「水」的拼音来反查「尿」的编码,输入了两部分完整的拼音。

image-20230119141842130

image-20230119141858476

对于非 GBK 字集里的「㕛」字,它是没有编码的,只能用两分法来输入,如下所示。此时,需要移动光标选中该字,然后再用空格上屏。

image-20230119141937473

2.3 助记方法

虽然声笔拼音已经简单,基本上没有什么学习门槛,但是为了进一步减轻初学者的记忆负担,在手机上提供了助记皮肤,可以长按N键打开或者关闭助记。在打开时,给出了笔画和零声母用键(aeuiov)的提示,如下图所示。如果是在电脑上,则可以把该图放在电脑桌面上,在打字的时候帮助记忆,一般几分钟就记住了。

img

2.4 单字的输入

在中文里,有数以万计的汉字,而拼音音节只有400来个,所以同音字是非常多的。故而,单字的输入,对于传统拼音输入法来说,是一个非常头痛和痛苦的事情,可以说是想尽了一切办法企图来解决这个问题。

搜狗和百度之类的拼音输入法利用巨型互联网词库,在输入一般性的文本时,可以大大减少对单字输入的依赖。但是,单字的输入始终是不可避免的,在有的场合还用得比较多。这时,绝大多数人是通过翻页查找的方式来定位和选择同音字。在遇到输入同音现象严重的罕见字时,往往需要翻页数次,每页都要查看多个选项,严重影响输入效率。少数有经验的人,可能知道通过以词定字的方式来输入单字,或者通过加TAB后追加笔画或者部件来筛选重码字。然而,以词定字只是一种权宜之计,不是普适性的,有时候根本想不到适合的词。TAB后加码的方式是具有普适性的,但是操作很不方便,而且还增加了码长。另外,由于这些手段用得很少,偶而使用的时候,显得很生疏,无法做到快速操作。

2.4.1 重码问题

例如,在用搜狗拼音输入「疫」字时,可以在输入yi以后按TAB键再输入笔画dhpn,「疫」字就出现在当页的选项中了。

image-20211120064658859

现在,对比一下声笔拼音在输入「疫」字时的情况。在输入yi后,无需用难操作的TAB而是直接输入笔画oeu,「疫」字就出现在当页选项中。而且,在声笔拼音中,笔画的使用是非常频繁的,用户容易对aeuio表示的笔画形成条件反射,从而加快操作速度。

image-20230122112225733

把单字重码问题暴露得最充分的,当数赵元任先生的「施氏食狮史」了,以下分别用搜狗拼音和声笔拼音将标题里的这五个字输入一下,进行对比,以目标字出现在首页为度。

image-20211121161656105

image-20230122112454017

image-20230122112530776

image-20230122112512992

image-20230122120535786

显然,声笔拼音(下图)比搜狗拼音(上图)要便捷得多,特别是每个字都节约了难操作的TAB键。合并平翘舌音后降低了学习难度,因为归并重音而产生的重码被追加的笔画有效地离散开了,并没有增加选择重码的负担。

2.4.2 码长问题

搜狗拼音输入「幢」字时,在输入zhuang后按TAB再输入该字的首笔竖,可以把它定位在首页。然而,zhuang这个音节有6个字母之多,加上额外的TAB键,码长非常不理想。

image-20211120071430095

相比之下,用声笔拼音输入「幢」字的话,只需在zua之后直接追加该字的首笔竖,就可以把它定位在首页。可见,从码长上来说,节约了四键,效率的提升是极为显著的。

image-20230122112835447

2.4.3 模糊问题

在拼音输入法中,一般都有模糊拼音设置。比如,在搜狗拼音中,模糊拼音的设置如下:

image-20211121102356125

对于南方人来说,很多都会设置为模糊前面三对平翘舌音,因为他们的普通话可能不太标准。前后鼻音的区分,对不少人来说,也是个大问题了。设置模糊音后,不管输入哪一个音都能够打出来,相对于降低了学习门槛。但是,这样做也有副作用,那就是牺牲了编码空间,同时也增多了重码。

在声笔拼音中,也采用了模糊音,但是其目的不仅仅至于降低学习门槛,而且还在于提高输入效率,所以它的模糊是强制的。声笔拼音对韵母的模糊更加激进,不仅仅是不区分前后鼻音,而且韵母的长度不会超过2。例如,biao会截断为bia,xiong会变为xoo,shuang会变为sua。不过,l与n,f与h,r与l,这几对是没有模糊的。另外,在输入编码的时候会显示出前缀相同的所有字。例如,输入bi后,还可能出现bian、bie、bing等发音的字。这有利于缩短常用字的码长。

当然,这样的模糊拼音会产生不少的同音字词,但是由于声笔拼音有直接追加笔画的手段,可以有效地抵消同音重码的副作用。

image-20230122120701946

而在搜狗拼音中,输入bi后只会出现发音相同的字,而有的字并不一定常见。

image-20211121105341246

2.5 二字词的输入

二字词在现代中文里是最常见的。根据北京航空航天大学等单位承担的“七五”国家重点科技攻关项目“现代汉语词频统计”所得的结果,二字词所占累计字数比例超过了一半,高达53.32%。

image-20211120103634307

在使用全拼的情况下,由于汉语的音节只有400来个,所以二字词的编码空间大概有400×400=160,000个码位。这个空间看起来还是不小了,但是因为分布极不均匀,因而重码现象也是相当严重的。随着收词数量的增加,当量级到达数十万甚至上百万时,重码现象还会越来越严重。

2.5.1 重码问题

例如,用搜狗拼音输入「时势」,会出现在第五页的最后一项。由于重码词的顺序会有动态调整,不同的用户的结果可能会有所差异,但是不会影响我们理解这个事实的存在。

image-20211120114341884

为了避免多次翻页查找,搜狗拼音提供了一种通过笔画过滤重码的方法,即先用TAB引导,再输入首字的笔画,这样可以将「时势」提前到首页,如下所示。

image-20211120115857337

这种过滤重码的方式比起翻页查找要好得多,但是仍然不理想,因为TAB不好操作,而且增加了一次击键。另外,如果重码词首字的前几个笔画是一样的话,过滤效果就不好。

反观声笔拼音。如果不增加笔画的话,重码现象会更加严重,因为它是不分平翘舌的,「时势」一词会出现在第六页的第五项。当然声笔拼音的重码顺序也是动态变化的,可能你的结果会有差异,但是不会影响我们对原理的理解。

image-20230122120839305

image-20230122120900322

image-20230122120914690

image-20230122120945490

image-20230122121000020

image-20230122121015220

正是因为有了极为方便的直接笔画筛选功能,才使得声笔拼音无需为重码而发愁,而且码长更短。它在筛选重码加笔画时,无需TAB引导,而且既可加在首字后面,也可加在末字后面,还可以同时加在首字和末字后面,非常灵活方便和快捷,如下所示。

image-20230122114449774

image-20230122114517247

image-20230122114543774

2.5.2 输入格式

拼音输入法在输入二字词的时候,格式可以非常灵活,可以都用全拼,可以简拼加全拼,可以全拼加简拼,也可以都用简拼。下面,以输入「创新」一词为例来说明这个问题。

在搜狗拼音中,至少可以用以下几种格式来输入。注意,用cx时的结果是经过一次翻页的。

image-20211121111457117

image-20211121111541724

image-20211121111633345

image-20211121111740791

在声笔拼音中,由于能在任意字后添加笔画,任意字都可以使用1至5码,所以可用的格式就更加丰富了。值得注意的是,由于声笔拼音对拼式进行了压缩,产生了归并重码,所以使用不当的话,会需要更多的翻页查找。

image-20230122121426947

image-20230122121444880

image-20230122121504429

image-20230122121519821

image-20230122121531124

那么,问题来了。面对如此灵活的输入格式,有的高效,有的低效,用户该怎么选择运用呢?通过对拼音输入法用户使用方法的长期观察和总结,可以归纳出以下启发式的原则。

首先预判待输入二字词的常用程度。如果是很常用的词,那么就先输入两字的首码,即全用简拼。如果当页命中就选择上屏,否则继续输入第二字的韵母。例如,要输入「才行」一词,预判觉得它挺常用的,但首页没有,需要继续输入韵母。

在搜狗拼音中,输入的情况如下。在加入韵母后,「才行」出现在首页的首位了。

image-20211121132440814

image-20211121132515467

但是,如果想要输入的是「畅行」而不是「才行」的话,就需要翻页几次才能找到了。

image-20211121134502442

image-20211121134538622

image-20211121135551615

image-20211121135634005

image-20211121135717689

所以,预判不准的代价有时候是比较大的。不过,在声笔拼音,可以有更多的办法,输入韵母后还可以再追加笔画,如下所示。

image-20230122121750837

image-20230122121843812

运气好的话,可能加一个笔画就出来了。但是,运气不好的时候,还是需要多加笔画,此后都可能还是需要多次翻页。预判不准的成本仍然是很高的。

因而,除非特别有把握,一般的人倾向于先输入首字全拼加第二字简拼。如果当页命中就选择上屏,否则继续输入第二字的韵母。这样的话,可以大大地提高命中率,但是付出了增加码长的代价。现在,以输入「双唇」一词为例说明一下。

在搜狗拼音中,输入的情况如下。在加入韵母后,「双唇」出现在首页的首位了。

image-20211121141401327

image-20211121141540096

在声笔拼音中,情况是类似的。

image-20230122122150980

image-20230122122233589

但是,可以看出,声笔拼音的码长短了很多。这得益于声笔拼音采用的压缩编码和前缀模糊特性。

即使是不常见的二字词,如果刚按照上述方式输入过了,那么在当前的局部语境下,仍然可以采用先输入简拼的形式来输入,能够节约用键。比如,上例中的「双唇」,在最近输入过以后,只用sc就可以了。

image-20230122122323267

2.5.3 模糊问题

模糊拼音的作用在词组中的体现比在单字中更加充分。在声笔拼音中,不仅可以像一般拼音输入法那样模糊平翘舌声母和前后鼻音,而且是强制性的,必须模糊,以便提高编码空间的利用率,也便于简化输入规则。更进一步,声笔拼音采用了激进的前缀模糊法,即每个字输入1-6码都可以,远比一般拼音输入法灵活多样。

例如,输入「疫情」一词时,采用的输入码形式最多可以有5×5=25种之多,包括yq yqi yiq yiqii yiqi yioq等等。但是,并不是任何一种形式在任何情况下都是同等的有效。弄清楚在哪种形式下适合采用哪种形式,是一个非常关键的问题。建议采用上一小节介绍的启发式原则,结合自己的使用经验来加以灵活运用。对于「疫情」一词来说,第一次输入的时候,采用yioq是最有效的。

image-20230122122458207

而采用yiq输入则会较多重码,第二页才有「疫情」出现。

image-20230122123031891

image-20230122123047834

但加入韵母后,就出现在第一页了,输全韵母则其位置就更靠前。

image-20230122123209276

image-20230122123226498

这时,再追加一个末字的笔画,就可以把「疫情」变为首选项。这就是前缀模糊法的强大之处。

image-20230122123245778

2.5.4 隔音问题

在一般拼音输入法中,有的拼写形式是有歧义的。为了明确音节界线,在电脑上需要加隔音符',在手机上则需要用专门的分词键。

例如,在全拼的时候xian还可能是xi'an。使用搜狗拼音时的输入情况入下:

image-20211124064402027

image-20211124064454676

如果上例采用混合显示也基本上能解决问题的话,那么下例就完全不管用了。这两例都是用的搜狗拼音,图中上面的是没手动加分隔符的,下面的是手动加了的。没有手动加分隔符时,简拼就失效了。

image-20211124064915359

image-20211124064955179

我们分析一下就知道,上文前一个例子的音节歧义是由零声母音引起的,而后一个例子的音节歧义是由翘舌音引起的。如何才能分清音节界限呢?声笔拼音的解决办法是,用v来表示零声母,同时将翘舌音归并到平舌音,即zh ch sh分别归并到z c s。这样以上两例的输入将变为如下图所示,在输入的时候就一定明确了音节界限,无论是全拼还是简拼都是这样。

image-20230122123748531

image-20230122123810906

image-20230122123829347

2.5.5 定位修改

在发生输入错误而需要定位修改时,一般拼音输入法是通过用箭头键移动光标或者Ctrl+音节首字母来定位的,但是这些方法效率低、操作难度大。声笔拼音提供了一种快速、方便的定位方法,可以利用数字 1234 将光标一次性地定位到待定的第 1 至 4 个编码之后,用 5 将光标定位到最后。

例如:如果本来想输入「御用」,但是输成了yiyon,发现有错,用退格键删除四个字母后进行修改的话成本太高,用Esc键清提示行重新输入也不划算。

image-20230122124153811

于是,按2定位到yi之后。

image-20230122124307387

接着,按一次退格键删除i,再输入u。

image-20230122124442650

最后,按5定位到编码的末尾,就完成了修改。

image-20230122124410674

2.6 三字词的输入

使用拼音输入三字词时,与输入单字和二字词相比,面临着很不一样的问题。

2.6.1 重码问题

对于三字词而言,如果采用全拼,那么编码信息已经足够丰富了,重码已经不是一个问题。这时,问题的症结在于码长太长而导致的效率低下。

例如,「互联网」一词,用搜狗全拼的话,需要10码,加上空格的话需要11键才能上屏。

image-20211124072703027

即使采用声笔拼音,拼写形式得到了一些压缩,仍然需要8码。

image-20230122124612818

所以,为了提高三字词的输入效率,人们在实践中往往采用其它输入格式来缩短码长。

2.6.2 输入格式

声笔拼音输入三字词时的格式可以多达5×5×5=125种,采用哪种格式最好呢?推荐的方法是,先采用全简拼输入。查看当前页的候选项是否命中,没有则逐码追加末字的编码并观察候选项的变化。有则选择上屏,若已有二字词或单字候选项出现,那么说明系统中没有该词。这时,要用2或3定位到第二、三字前,对前一、二字进行修改,补充编码以输入正确的字词,选择上屏后,光标回到末字后。重复以上操作直至完全正确为止。

例如,要输入「计算机」一词,一般只需要输入jsj,该词就会出现在首位可以用空格键上屏。如果当前页的重码项,那么可以用数字选择上屏。

image-20230122124853690

但是,若要输入的是「教书匠」,输入jsj后在当页候选中没有。这时,再补充一码,该词就出现了,可以用9选择上屏。

image-20230122125123185

可是,再假设要输入的是「鉴赏家」,输入jsja后在当页候选中仍然没有。这时,再补充一码末字的首笔,该词就出现了,可以用7选择上屏。

image-20230122125223705

然而,如果要输入的是「建设奖」,输入到jsjaaoe后在当页候选中仍然没有。这时,判断前两字是一个常见的二字词,于是用2定位到前两码后,准备修改前两字。

image-20230122125650200

image-20230122125820417

接着在js后追加「设」字的韵母e,前两字就便成了「建设」,可用空格上屏。

image-20230122125935640

此时,「奖」已经在当前页,用8选择上屏即可。这样,也就同时造好了这个系统中原本不存在的三字词。

image-20230122130053096

以后,接下来用jsj就可以输入「建设奖」了。

image-20230122130134896

2.6.3 模糊问题

声笔拼音特有的前缀模糊法在上一小节追加末字编码时已经有所运用。前缀模糊在输入三字词时的另一种用途是,当觉得重码可能会很多,可能会不出现在首页时,首字可以用2、3码,而不是1码。

比如,声笔拼音输入「军事家」可以只用jusj,其中「军」的拼式只有前面两码,同样提示了这个词。

image-20230122130709632

但是,对于搜狗拼音来说,前缀模糊在多数情况下是不管用的,输入jusj后,不能提示「军事家」。

Snipaste_2021-11-28_17-03-25

只有在输入完整的拼式jun后,才会提示「军事家」,如下所示。

Snipaste_2021-11-28_17-04-25

2.6.4 隔音问题

声笔拼音的音节界线是完全确定、毫不含糊的,它的韵母没有辅音字母,而且零声母必须用v来表示,不会产生音节混淆的问题,因此也就用不着使用隔音符。

比如,声笔拼音输入「公安局」,用简拼为gvj,清晰明了。

image-20230122130826605

然而,在百度拼音中,是无法用简拼gaj来输入「公安局」的。

Snipaste_2021-11-28_17-11-18

必须在a之前手动地加入隔音符’,而且「安」字的拼式要输入完整,才能提示「公安局」一词。

image-20211204074051291

2.6.5 定位修改

对于三字词来说,定位修改除了用于出错时而外,还常常用于预估系统中没有将要输入的三字词时。这时,最好是三个字都用全拼。比如,假设知道系统中没有「三字词」,就可以先使用这三个字的全拼。

image-20230122130929713

由于系统确实没有需要的词组,于是按3定位到saa之后。

image-20230122131018192

用6选择「三」字上屏后,光标回到末字后面。

image-20230122131058980

再追加末字首笔,首选项即变成了「字词」,于是用空格上屏就完成了新词的输入。

image-20230122131214840

2.7 多字词的输入

2.7.1 重码问题

对于四及以上字构成的多字词而言,如果采用全拼,那么编码信息比三字词更加丰富,几乎没有重码问题。但是,码长太长而导致的效率低下问题则突显了出来。

例如,输入「风光无限」,若使用全拼,肯定是没有重码的,但是即使用声笔拼音也需要11码之多,效率堪忧。

image-20230122131325224

所以,这时要考虑要更紧凑的输入格式来提高输入效率才行。

2.7.2 输入格式

在输入已知的多字词时,应首先考虑用简拼格式来进行输入。同样是输入「风光无限」一词,使用简拼的话,四码就够了。

image-20230122131354095

2.7.3 模糊问题

对于多字词来说,采用前缀模糊来输入的意义不大,用键仍然过多,对增加确定性的作用也不大。

image-20230122131424056

2.7.4 隔音问题

由于多字词一般采用简拼来输入,声笔拼音拼式的明确性体现的优势就特别明显。

例如,「斗志昂扬」一词,用声笔拼音的简拼是没有歧义的。

image-20230122131449599

而使用百度拼音时,则成了下面这样了。只能通过在a之前加隔音符来解决,但是有时候会忘记加隔音符,回改起来很麻烦。

image-20211204084243800

2.7.5 定位修改

在输入新的多字词时,经常会用到定位修改。这时一般先用全拼输入,如果转换不正确,再进行修改。

例如,首次输入「声笔拼音」时,按照全拼试输,发现末字只输入yi就行了。

image-20230122131615040

用3定位在首字之后,用7可以选择「声」上屏。

image-20230122131715647

光标回到编码的末尾。

image-20230122131806455

再用2定位到第一个未转换的音节之后,补充「笔」字的首笔u(撇)。

image-20230122131909904

用空格上屏「笔」字后,「声笔拼音」一词就确定了,再次可用空格整体上屏。

image-20230122132020823

3 声笔拼音进阶

3.1 介绍固定

现代拼音输入法的动态特性非常强,给它带来了更大的灵活性,降低了初学者的门槛,还能尽量缩短码长,减少用键,但也给熟练的用户带来了很大的困扰,导致了更多的误操作和回改。

例如,使用百度拼音输入了g后,本来的选项如下:

image-20211121084635743

这时,如果继续输入gao后,选项如下:

image-20211121084714538

在用空格上屏「高」字后(有时需要输入多次),再输入g的话,选项就可能变成:

image-20211121084752630

但是,这只是问题的一个方面。问题的另一个方面是,人作为生物是具有记忆特性的,经常重复的行为,就会形成条件反射。如果在某个位置上固定了某个高频字词,那么经过一段时间的使用,用户就可以不假思索地将该字词打出来,而不必观察提示行,这样就减少了人机交互时间,提高了击键速度,从而提高了打字效率。如果不固定的话,这种快速的条件反射操作所上屏的字词很可能就不是操作者想要的,不得不进行回改,反而影响了打字速度。

在码长和键速之间如何进行选择?这是输入法设计随时都会遇到的问题。不同的输入方案会有不同的选择。但是,长期的实践证明,对于拼音输入法来说,高频字词是肯定应该固定的,就是对于一般用户来讲,得到的击键提升都比码长的节约还划算,对熟练用户来说更是如此。

习惯上,将字词固定中首选位的做法被称为固顶,一般用鼠标悬停在某个重码字词上,在弹出菜单中选择固顶就行了。下图是搜狗拼音的固顶方法。

image-20230124084714880

如果还要把字词固定在其它位置,那么就需要使用自定义短语。自定义短语这个说法不正确,因为单字也是可以自定义,所以应该改为自定义字词才确切。当然,词组的长度理论上是可以很长的。

image-20230112140258889

百度拼音和搜狗拼音都提供了固顶和自定义短语的能力,但是它们默认情况下并没有固定任何字词,究竟应该固定哪些字词完全由用户决定。这种做法看似非常灵活,实则将责任推卸给了用户,因为绝大多数用户都不是输入法的专家,无法对需要固定的字词做出最佳的判断,甚至根本就不会使用固顶和自定义短语,更不用说确定字词的编码和位置了。即使是会用且有主见的人,要精选出成千上万的字词来确定编码和位置,也是一项十分艰巨的工作。个别的人即使做出来了,也没有通用性,其他人无法使用。

有鉴于此,声笔拼音对固定字词进行了精心的设计,基于字词频率大数据,结合对顶功的支持,使得越常用的字词获得越短的码长,可以大大提高拼音输入的效率上限,而且让用户不必进行任何额外的工作就能够享有最佳的固定字词体验。

声笔拼音的固定字词分为前缀固定和数选固定两种,只针特定编码模式的1-3码来进行。要使用固定字词,需要打开固定选项。要临时打开固定,在电脑上按F4或者Ctrl+~,选择2,再选择5即可。

image-20230126132850782

在手机上临时打开固定更简单,在候选栏上点选一下即可,如下所示。

image-20230126133404478

如果希望默认为固定状态,则需要修改sbpy.schema.yaml文件,将其中的is_fixed项中的reset值改为1。

image-20230126133735621

3.2 前缀固定

前缀固定可以看成是一般拼音输入法固顶功能的推广。一般的固顶,要么固定简拼,要么固定全拼,而声笔拼音可以利用前1-3码来固顶,可以是不完整的拼音,也可以是拼音加上笔画,与传统上的简码类似,所以又称为简码。

3.2.1 单字

在声笔拼音中,首码固定的高频字称为一简字,一共有21个,它们是:b不 p平 m没 f发 d的 t他 n你 l了 g个 k可 h和 j就 q去 x下 z在 c出 s是 r人 y一 w我 v而

前两码固定的次高频字称为二简字,例如:有yo 来la 得de。二简字一共有下105个,其中有98个是取正常编码的前两码,如下所示。

有道来她上中说地为要着子那也得会时以国名心好然对小天看手生里后能家起们如无头方前作成于经年日动此把全分本女高儿从些口外公再才学很部目便给处安马快夫接特任路冷决龙容且怕科突兄农品模破否朋波欧普握穷炯

另外,还有7个特殊的二简字,它们是利用正常编码留下的空码安排的声笔字,即声母+首笔。这7个字是:峰fi 光gi 喝hi 肯ki 啊vi 俄vu 晚wi。这些编码只能在输入单字时使用,不能用在词组中。例如,在顶峰diifee 光辉guahui中,峰fee 光gua都得采用正常编码 。

前三码固定的字称为三简字,大多数是常用字,例如:到dao 大dae 同too 车cee,其中:大dae 同too的第三码为首笔,因为它们都是单韵母音,所以补充了笔画。从这里也可以看出,声笔拼音相较一般拼音输入法而言,具有强大的重码离散能力。

三简字数量比较多,一共有416个,现罗列如下。

到大这之过自只想事还身多已面开都行见又两用老笑法当意点所进情主同定回三样实问话明气与正走理己门其等种工业关因二何却听少被白住位最机内使几别么次水太入并立风表报难长展四体色放更西感美着第直叫利望解让原步系提重结算东强受各记非转爱活云必吗五该设带认林许务条它若车服红满告拉娘吃黑尔空军传则办据弟论落克候持杀德语术司谁刻切暗界乎八举苦队府谈答断图片布错得夜规哪送局拿母爷群团故查护楚亚乐依况须村摇类汉具投选需权谢派兰细木乱怒独节旁够莫密副楼采医号假河齐都您协席妇脑织赛考呀瞧遇柔土跑屋脱孙策察股魔啦毛某困恨略雄批配珠虚婆康秘弄血咱徒奔哭默软仇夏库笔吴评曲奥杂牛荣测侠迟爹吓误虑额扑诺碰迫补骑博佛塔扎瓦萨隔拔瑞码吹阁灭腾绕颗堡哦辞页洁颇幅隆甲泥仆爬贺寇穆嘉坡罚偶辱卧勒刹歇乏伯亩琼疲聂脾窝哇陌嫩怯屑谱渠哟驳尬腊峨衙噗泊窘娥虐睦讷涕袜掐捺琶跛忒卡倭伽骼蜗锲底獭锗腌稞佤珐尺耨喏犸钕泐骒铪胩铽那冊坲垰阞庅孭倷呶毮岥奤婄陠緀踥驲囸釰馹渃歰婐魻醃嫧

3.2.2 二字词

在声笔拼音中,取两字声母作为编码的高频二字词称为二简词,例如:现在xz 但是ds 建立jl。这些二简词一共有下441个,与声笔简码的声声词完全相同,具体参见单字训练中的声声词。

注意,二简词中并不包含由两个一简字构成的二字词,因为它们可以通过两字的声母加分号进行快捷输入,例如:一个yg; 就是js; 下去xq;等。

取首字的首码和次字的前两码编码的二字词称为三简词,例如:还是hsi 只有zyo 当然dra。声笔拼音的三简词数量多,有2048个,多数为常见词,这里就不全部列举了,以下仅列出前300个。

还是不过这么那么还有一点只有的话社会世界声音过去之间技术重要当然眼睛人民回来宝贝任何想到男人明白所有本报要求看见过来一阵公司真是大家方面决定正在信息有关不同合作继续解决感觉精神提高由于一面别人之中思想母亲回答生产部门群众也许江湖不想终于干部兄弟甚至自然实在立刻经过面前最后目光不见不禁除了多少了解意思提供政治数据回去整个开发结构农民高兴举行到底之下利用当时具有影响来到哪里不少主席眼前想起一边样子早已还要双手刚才报道坚持进来既然找到否则真正容易双方方式愿意投资见到政策或者设计不必答应任务行动对象农业过程师父接受只好脸色力量留下跟着变化少年不用主人规定城市受到积极各种它们前面变成制度担心事业经营为何介绍生命随着今日即使晚上很多产生稳定全身仿佛身后之外经验进去里面严重打算妻子分析行为改变开口直接哈哈分别选择应用民族更加职工总理指出访问难以大概简直开展记得丈夫达到回家程序听见困难听说失去绝不重点实施面对方向促进别的笑容功力资金确定用户身形抓住获得回头明天结合至少保持迅速若是绝对的确外面哥哥学校艺术内容同样意见证明形式可惜显得并且不行紧张收入肯定无论上海门口帮助保证神情妈妈低声报告男子态度地位怀疑故意模样工业一身一番成立始终利益可怜检查友好当年包括刚刚神色大汉语言下午右手东方英雄危险来自国内公主对付协议采用联合重新家庭调整向前金融操作手段何况部长明显应当转身发觉未来并非下面创造各级秘密渐渐广大

注意,三简词中既不包含二简词和两个一简字的组合,也没收录一简字+二简字、二简字+一简字、二简字+二简字这些组合,以免浪费宝贵的简码空间,因为它们在今后使用顶功时用单字输入也只需要四键,效率已经足够高了。例如,下来 夫人 国家就没有收录到三简词中。

3.3 数选固定

在声笔拼音中,固定使用某个数字来选择的字词,称为数选字词,在排除前缀字词后按常用程度进行收录,选择的方式是无理的,其数量比用前缀固定的字词还多。它们为追求更高效率的熟练用户提供了手段,当然也会付出更大的学习代价。

3.3.1 单字

声笔拼音的数选字也分为三级,分别采用前一、二、三码加67890来输入。

一级数选字有下列105个,在输入首码后会进行提示。

比场但飞果合将客力民南皮轻仍声通阿文现眼知边产打反功化间块连命呢排清热什题案王向月真变常电房管花加狂脸每男拍亲忍十统耳万相应者吧程度父干海今恐量忙念盘青肉神台按未新由怎保城倒复跟华金靠李妹尼偏区弱山铁恩往先言总

image-20230126121415410

二级数选字有下列486个,其中有不少常用字,在输入前两码后会进行提示。

半参达防改孩建抗劳妈乃牌千染伤态岸完像阳张北沉登费哥横姐课雷梦恁陪妾仁社疼恶微写叶政标刺低及领免宁贫求鈤死停信衣制播冲斗缶共厚迥控露摸浓魄穹融收痛喔沃胸友众捕除段负怪火觉款罗慕努铺取锐数推武雪员做百草代访刚害件凯蓝慢纳判钱扰商堂傲网象严找备曾灯份根哼杰柯泪眉馁培窃惹深藤愕委邪野整兵词敌计流米凝飘请市跳性义至拨充洞仏宫洪扃孔笼谋哝泼邛蓉首透噢涡凶右周卜存毒福姑或绝宽律幕奴朴确润双退物续元坐般财党范敢哈教刊浪买奶庞巧燃尚叹艾忘香研早背陈瞪凤格狠街渴累猛呐佩茄刃甚滕饿闻斜耶阵病赤调近令迷鸟票奇世田形影指勃抽懂梻构侯炅扣漏眸侬剖茕揉守偷呕渥熊游终怖穿顿富观忽句扩率姆娜蒲拳儒书托舞寻远组宝超单翻赶寒剑堪郎麻闹袍抢饶闪唐埃玩消药战辈称邓封革核介咳愣梅竜鹏惬扔省忑呃维鞋液增冰池掉济离妙妮凭期师替息音资搏匆抖紑供吼幜叩搂摩脓珀蛩绒松童殴挝汹优州簿初端付官欢居括陆牧暖葡趣阮虽腿午宣玉足帮藏刀饭港毫江砍朗卖奈胖墙嚷沙逃哀亡项杨掌杯承凳纷歌呵借棵蕾蒙抐喷挈韧胜誊厄威胁冶证避痴顶惊留敏扭匹企思厅喜议字薄聪冬缹攻宏冋崆拢末莀鄱筇溶宋铜鸥斡匈永钟哺创短伏广黄君亏绿墓挪浦缺乳随途乌徐院准

image-20230126122842896

二级数选字有多达1915个,其中仍然有些常用字,在输入前三码后会进行提示,以下按字母顺序列出200个。

巴班板版伴霸坝芭靶扒败罢摆拜柏包抱暴爆饱爸笆钯魃鲅笨崩绷迸蹦贝悲臂倍卑编遍壁鞭镖毕逼碧毙蔽宾柄禀滨鄙闭敝弊庇泌鼻彼币匕俾剥擘檗絔剝玻礴菠鹁孛啵踣趵嶓蹳渤亳袚袯碆脖膊钵帛舶埠逋埔醭蔔卟晡峬鳪吥瓿庯誧補悑钚钸鈽餔獛厂残惨餐唱茶插擦碴茬彩材菜差猜朝操潮曹吵岔锸馇镲猹屮矠层诚乘尘臣畟唓蛼迠瞮澈恻粣廁惻侧彻册掣側驰弛蚩媸妛耻翅茨磁敕齿赐叱嗤哧慈瓷炽祠啻斥伺侈笞魑丛虫崇宠葱愁丑筹臭凑船床窗川喘础厨蹙醋橱垂翠脆

image-20230126123618079

3.2.2 二字词

声笔拼音的数选二字词分为两种。

第一种数选二字词采用两字的声母加67890来输入,在输入两码后会进行提示,数量较多,有2205个,以下是频率较高的前200个。

生活咱们只要研究这时只见机会有点消息居然使用回到原因人物根据增长就算机构不仅世纪尤其放心算法伸手执行大师相当起身质量首先表现简单直到上面究竟措施负责责任关心造成曾经比赛原则全面大会新闻标准形势最好时代故事有所生气会见满足强调体制机制有效淡淡银行文明脚步深入不曾欢迎眼光定义满意建议各地手指理由行政不大范围具体大量空间亲自性命穿着吩咐超过落实成员理解勉强或是照顾交流规则暗中脑袋人士老大互相吸引依法特殊叹息特点面向贯彻斗争随便需求持续统计大小文献太阳矛盾基层居民开心周围夫妻失望效果避免飞机地面危机实力内力各个文艺类型难过党委规范当初空气不顾凝视武器演出原谅厨房面临分明身材一同面孔西方明明教训误会权利奶奶灯光鼓励看法概念其余病人罢了悄悄心灵协会官兵女性同情退出情景大夫老子气息担任玫瑰呵呵威力举起表演合同纪念物质理会暗器整体材料寻常当今秘书倘若这边长长味道依靠解开争取来历法规相见村民胡子娘子围绕冲动

image-20230126124603610

第二种数选二字词采用首字的声母加次字的前两码再加67890来输入,在输入三码后会进行提示,数量多达9976个,以下是频率较高的前200个。

作用之一资源正式减少逐渐坚决远远等等答道杀死形象即将自身军事主动至今正要因素交换运用施展做到颜色教授桌子爹爹随后勇气职业基地视线身影主持针对睡觉深深制造基金杀手检索最终影子公斤早上一带加大仪式这点数字心思有限山庄属性涉及有意选手倏地收回心底沙发鼻子规矩游戏读书好似总结老是举动遇见详细地址法制宝剑厉声集合长江沿着编辑道士设立角度收费古怪思索石油上次局长生存智慧结论角色早晨传说使者地狱师弟出身京城有钱试验记住机场服装君子外长机遇师傅典型经理适当抓好学院境界学术得罪失踪证据只管严厉帮忙火焰不定单独同行通讯资格广州组合咬牙好意军官衣裳深情外资整天公正显著色彩好友联手图象制作调用呼吁履行流动近来痕迹生物不妙四面姿态本事存心金刚减轻报捷构造办理爆炸自信岁月进攻骑士金钱黄色胡说飞行军人贵族师妹呈现四海顺便英俊孤独总裁稍微箱子禅师军区职责决议下载在线点击阅读首页更新一种社区版主娱乐离线咨询超级公告几个登陆

image-20230126124845274

注意,若二字词为一、二简字与二级数选字的组合或者两个二级数选字的组合,则不会收录为这种数选二字词,例如:能力nel7 现金x7j9 将来j7la 一月y_y8 每个m6g_,因为它们用单字输入也只需要四键,而且是完全确定的。

3.2.3 三字词和多字词

声笔拼音通过前三字的声母加加67890来固定常用的三字词和多字词,以便离散重码,在没有采用词四码冲突的时候则不建议使用。这种数选词数量非常庞大,有44322之巨,输入前三码后会进行提示,以下是一些常见的例子。

爱因斯坦 为什么 阿其所好 新华社 社会主义 进一步 计算机 一口气 安安全全 一会儿 傲然屹立 国务院 点点头 委员会 越来越 邓小平 想不到 怎么样 只不过 数据库 不得不 现代化 摇摇头 一句话 对不起 联合国 怎么办 老人家 年轻人 俄罗斯 没什么 领导人 说不定 差不多 来不及 事实上 不由得 老前辈 一辈子 一下子 代表团 巴儿狗 一部分 安若泰山 安全阀 亲爱的 党中央 实际上 一系列 不能不

image-20230126132200682

注意,首选项只是安排了二简字和一简字的组合,一般不是真正的三字词,例如:应该的ygd 知道了zdl。若是一简字加二简字的组合,则通过加分号来输入,例如:的时候dsh; 不一样byy;。这么做,不仅可以充分利用编码空间,而且在输入时具有完全的确定性,可以实现盲打。

3.4 运用固定

假设现在打开了固定选项,但是没有打开顶功选项。我们现在用一个例子来说明如何使用固定字词,并与非固定(自由状态)时的两种输入情况进行对比分析。

例子:中文输入法是在信息社会必须使用的重要工具之一

固定状态 (39键):zwe_srfa_sz;xxi_shu_bx_sy6d_zya_gj0zyi6

自由状态1 (50键):zoow_suruf_s_z_xiix_seh_bix_siy_d_zooy_gooju_ziyi_

自由状态2 (34键):zw_srf_s_z_xx_sh_bx_sy_d_zy_gj_zy6

分析:

4 声笔拼音高手

4.1 顶功介绍

4.2 最佳路径

4.3 省略空格

4.4 简化修改