分页: 4 / 17
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-18 17:10
由 hubert_star
都是用java来处理的
词频这个问题,对于单个的文件,有三个8位可能跟词频有关系,但是我发现这三处只有第一处有点实际意义,其他的都跟声韵母有关,所以就用了第一个8位。
另外,同一个词如果出现在不同的文件中,词频信息也是不一样的,按照最高值来处理
同时,以原有词库的词频优先
这样以来,能暂时解决词频的问题,毕竟输入法提供的词频信息还是比较有用的
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-18 17:39
由 dukeduan
ibus1.3.0在哪里?
我用ppa的源也只是,1.2.99,看了看http://code.google.com/p/ibus也只有1.2.0。
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-18 17:45
由 hubert_star
你安装后在配置界面的关于里面如果写1.3.0就表示对了
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-18 18:42
由 dukeduan
装上了,弗雷德霍姆行列式。
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-23 23:14
由 jackallen
这个词库相当不错啊,啥时ibus支持下在线更新,再融合下搜狗云输入法,嘿嘿……
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-23 23:34
由 hubert_star
关于ibus方面的更新
在最新的ibus pinyin git中,经协商已经加入了一个识别本地词库的办法,也就是说,只要存在下面的文件,这个词库文件是优先被使用的,如果没有则使用原来的内置词库。
规则如下:
在/usr/share/ibus-pinyin/db 下面,如果有local.db这个文件,那么则个词库文件优先被使用
现在使用我提供的词库的同学如果是ibus-pinyin git版本的,只要把你们的词库重命名为local.db并放到这个文件夹里面就可以使用了,不需要覆盖原来的词库文件。
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-24 21:28
由 wx85105157
升级了下iBUS,没有1.3的……、
第一次打出弗雷德火木行列式
自己选择弗雷德霍姆行列式,之后都能打出弗雷德霍姆行列式了~~~
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-25 8:18
由 zhangxudong
已经用上了,谢谢楼主
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-25 16:56
由 wx85105157
bobobo80 写了:leeaman 写了:用了140mb的内存...
汗了。不敢试了。
不要乱说~~~

- ibus内存占用
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-26 9:01
由 龙任我笑
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-28 0:04
由 wangdu2002
一段时间没泡U坛,黑手竟然又出新产品了。。。暂不用也顶之。

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-29 13:02
由 6.1
嘿嘿,搞定成功

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-29 16:07
由 Leonador
相当不错
可以用 呼呼
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-30 18:44
由 qike006
请问一下楼主
我的db目录中的open-phrase.db是个连接文件呀,指向的是/usr/share/pinyin-datebase/main.db
我是该替换那个main.db吗?
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-02-02 1:55
由 六翼拉菲尔
惭愧啊,还是在别的地方看到链接跑回来的,不得不说,lz做得词库,至少对我来说那是功德无量啊,而且搜狗的细胞词库不是说可以开放共享的吗?如果有版权问题的话再删除好了,我用的时候是直接覆盖的,不知道有没有及时生效,不过看起来内存占用只有30M,可能我重启以后就不是这样了,不过不管怎么说,小企鹅用起来好多了,可惜功能上还有很大的进步空间,希望小企鹅和楼主都能再接再厉,越做越好。