Skip to content

利用单字的短码空闲空间

由于现在的声笔双拼只考虑了规则编码,所以单字编码在码长为2和3时都有不少的短码空间是空闲的,非常浪费。利用这种空间的办法是,将声笔简码的ss和ssb型二字词插入到该空间中。这种词现在有1098个,频度最高的一些二字词及其编码和频度如下。

一个	ygu	997773
我们	wmu	812417
什么	sm	742524
起来	qle	330495
因为	yw	317518
现在	xz	315893
怎么	zm	294900
问题	wt	279209
经济	jj	257865
这么	zmu	225697
这些	zx	225430
一定	yd	201525
如此	rci	194183
一点	ydi	189033
关系	gx	188400
可能	kn	185841
而且	vqi	176585
心中	xzi	176312
地方	df	173581
姑娘	gn	168226

如果能充分使用上述简码二字词的话,对输入效率的提升是有帮助的,只是编码格式不一样,需要记忆。

另外,还有少量的sb和sbb型空间没有利用,如何利用?现在还没有考虑好。

利用词组的三码空闲空间

目前,声笔双拼中,编码sss是空闲的。优化的措施是,把最常见的词组取前三码作为其简码放在sss空间中,同时也保留它们的全码。也就是说,这种简码不是强制性的。不过,如果用户利用了简码,并且如果四码上有重码词组的话,在选择重码后,重码的词组就可以提前,就会多产生一个四键词组,从而提高输入效率。这种简码词组共有一万多条,下面是一些例子。

没有	mzy	826617
什么	sfm	742524
自己	zij	741012
知道	zid	574771
可以	key	432546
这个	zeg	404217
中国	zsg	336314
起来	qil	330495
这样	zey	328523
已经	yij	325164
发展	faz	323016
因为	ynw	317518
现在	xmz	315893
怎么	zfm	294900
工作	gsz	287827
问题	wft	279209
经济	jyj	257865
还是	hls	238983
出来	cul	238047
如果	rug	234912
只是	zis	234730
爱因斯坦	vys	233485

升级办法

将新的sbsp.dict.yaml文件复制的用户文件夹覆盖原来的同名文件,然后将sbsp.userdb文件夹删除,再重新部署,就可以使用了。注意,删除sbsp.userdb文件夹后,你之前所造的词组和产生的调频信息就丢失了,只有重新再来一遍。因为码表有破坏性的变更,与用户数据不一致了,可能产生冲突,无法利用原有的用户数据,非常遗憾。