分页: 4 / 17

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-18 17:10
hubert_star
都是用java来处理的

词频这个问题,对于单个的文件,有三个8位可能跟词频有关系,但是我发现这三处只有第一处有点实际意义,其他的都跟声韵母有关,所以就用了第一个8位。

另外,同一个词如果出现在不同的文件中,词频信息也是不一样的,按照最高值来处理

同时,以原有词库的词频优先

这样以来,能暂时解决词频的问题,毕竟输入法提供的词频信息还是比较有用的

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-18 17:39
dukeduan
ibus1.3.0在哪里?
我用ppa的源也只是,1.2.99,看了看http://code.google.com/p/ibus也只有1.2.0。

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-18 17:45
hubert_star
你安装后在配置界面的关于里面如果写1.3.0就表示对了

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-18 18:42
dukeduan
装上了,弗雷德霍姆行列式。

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-23 23:14
jackallen
这个词库相当不错啊,啥时ibus支持下在线更新,再融合下搜狗云输入法,嘿嘿……

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-23 23:34
hubert_star
关于ibus方面的更新

在最新的ibus pinyin git中,经协商已经加入了一个识别本地词库的办法,也就是说,只要存在下面的文件,这个词库文件是优先被使用的,如果没有则使用原来的内置词库。

规则如下:

在/usr/share/ibus-pinyin/db 下面,如果有local.db这个文件,那么则个词库文件优先被使用

现在使用我提供的词库的同学如果是ibus-pinyin git版本的,只要把你们的词库重命名为local.db并放到这个文件夹里面就可以使用了,不需要覆盖原来的词库文件。

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-24 21:28
wx85105157
升级了下iBUS,没有1.3的……、
第一次打出弗雷德火木行列式

自己选择弗雷德霍姆行列式,之后都能打出弗雷德霍姆行列式了~~~

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-25 8:18
zhangxudong
已经用上了,谢谢楼主

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-25 16:56
wx85105157
bobobo80 写了:
leeaman 写了:用了140mb的内存...
汗了。不敢试了。
不要乱说~~~
ibus内存占用
ibus内存占用

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-26 9:01
龙任我笑
:em11 :em11 :em11 ,亲自试验,可以,谢谢楼主。

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-28 0:04
wangdu2002
一段时间没泡U坛,黑手竟然又出新产品了。。。暂不用也顶之。 :em11

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-29 13:02
6.1
嘿嘿,搞定成功 :em11

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-29 16:07
Leonador
:em11 :em11
相当不错
可以用 呼呼

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-30 18:44
qike006
请问一下楼主
我的db目录中的open-phrase.db是个连接文件呀,指向的是/usr/share/pinyin-datebase/main.db
我是该替换那个main.db吗?

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-02-02 1:55
六翼拉菲尔
惭愧啊,还是在别的地方看到链接跑回来的,不得不说,lz做得词库,至少对我来说那是功德无量啊,而且搜狗的细胞词库不是说可以开放共享的吗?如果有版权问题的话再删除好了,我用的时候是直接覆盖的,不知道有没有及时生效,不过看起来内存占用只有30M,可能我重启以后就不是这样了,不过不管怎么说,小企鹅用起来好多了,可惜功能上还有很大的进步空间,希望小企鹅和楼主都能再接再厉,越做越好。