分页: 3 / 17
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-15 21:25
由 happyz90
adaml 写了:楼上几位的ibus版本忒低....
谢谢!同时也谢谢楼主,我的成功了~~~

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-16 1:20
由 lunacory
我覆盖了fcitx的词库,内存占用是80.7M,也还行,不算太大
不过词汇上倒是充实了,不过词频非常差,基本上常用的词都在后边甚至在第二列……
估计用一段时间后会好些。
不过说实话,这个sougou细胞词库合并没必要搞这么多阿
楼主能不能出一个sougou常用词汇+网络流型词的版本?
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-16 1:36
由 tyro
看到说 fcitx 词频问题...下载了 但是还没开始用@ 先谢谢楼主,原来的那个,我还用着@ 发此帖,意在mark@
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-16 2:17
由 kunkun0217
好!!
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-16 11:58
由 jiangkero
楼主经常自己和自己聊天

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-16 16:54
由 gt945
搞定,哈哈
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-16 18:14
由 kuxinren
我用ibus成功了。fcitx更新后不好用,卸载了
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-16 19:42
由 weilichun
/usr/share/ibus-pinyin/engine/py.db
I replace this SQLite Database file with android.db ,I can not input with pinyin IME now >_<
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-17 10:40
由 sx-ljm
我的是ibus 1.2 没有那个db目录,难道你们是1.3? 说下那里下载?
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-17 12:17
由 weilichun
代码: 全选
$ tree /usr/share/ibus-pinyin/
/usr/share/ibus-pinyin/
|-- db
| |-- android.bak.db
| |-- android.db
| `-- google.db
|-- icons
| |-- chinese.svg
| |-- english.svg
| |-- full-punct.svg
| |-- full.svg
| |-- half-punct.svg
| |-- half.svg
| |-- ibus-pinyin.svg
| |-- simp-chinese.svg
| `-- trad-chinese.svg
`-- setup
|-- ibus-pinyin-preferences.ui
|-- main.py
`-- main.pyc
3 directories, 15 files
确实是版本低,升级到Ibus1.3,然后安装ibus-pinyin-db-android
然后就可以覆盖android.db数据库文件了
可以在Ubuntu-tweak里添加ibus源,然后升级ibus
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-17 16:07
由 jiyuyan
有些应该在
代码: 全选
/usr/share/pinyin-database
下
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-18 0:15
由 hubert_star
如果大家装的旧版本,直接替换也应该可以,只要是09年10月份以后的ibus版本应该都可以,不过我没有旧版本,无法测试
另外,我更新了词库,分成了三个词库,大家可以去看看。
词频信息现在很头疼,很多词在不同的文件中可能词频不一样,而且每个文件定义的词频我还没找到标准,只能是按照最大值来处理了。
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-18 9:34
由 hcym
黑高手
词频要命啊,用了两天没适应
还是删尽配置文件,换alpha.gu的最新版了

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-18 10:29
由 hubert_star
楼上,fcitx的词频问题我调整过了
对于fcitx原有词库的单词,总是排在最前面,而且按照原有词频来排列的
对于新增加的词频,目前词频也简单调整过,应该能满足日常需要了
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
发表于 : 2010-01-18 16:48
由 t3swing
很快就搞定了哈 ,不过黑手的传上来的full就有点吓人了,我的慢网络 只能望洋兴叹了.
看了下代码 ,java的,不懂,词频信息是 0a后面的部分吧?不过后续处理看不明白了.
发现java的东西,空目录还真让人受不了,不知道要cd多少次才能看到代码
sw@~/桌面/sougou-phrases-project-src$tree
.
|-- data
|-- pom.xml
`-- src
|-- main
| |-- java
| | `-- org
| | `-- hubertstar
| | `-- system
| | `-- phrase
| | |-- ByteArrayUtils.java
| | |-- common
| | | `-- Phrase.java
| | |-- inputmethod
| | | |-- fcitx
| | | | `-- FcitxPhraseGenerator.java
| | | `-- ibus
| | | `-- IBusPhraseGenerator.java
| | `-- sougou
| | `-- SougouScel.java
| `-- resources
|-- script
`-- test
|-- java
| `-- org
| `-- hubertstar
| `-- system
| `-- phrase
| |-- FcitxTest.java
| `-- IBusTest.java
`-- resources
|-- a.scel
|-- android.db
|-- create_index.sql
|-- log4j.xml
`-- scel
23 directories, 12 files
sw@~/桌面/sougou-phrases-project-src$
黑手,貌似没看到词频调整的脚本 ,不会是用java写的吧?