分页: 3 / 17

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-15 21:25
happyz90
adaml 写了:楼上几位的ibus版本忒低....
谢谢!同时也谢谢楼主,我的成功了~~~ :em05 :em05 :em05

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-16 1:20
lunacory
我覆盖了fcitx的词库,内存占用是80.7M,也还行,不算太大
不过词汇上倒是充实了,不过词频非常差,基本上常用的词都在后边甚至在第二列……
估计用一段时间后会好些。

不过说实话,这个sougou细胞词库合并没必要搞这么多阿
楼主能不能出一个sougou常用词汇+网络流型词的版本?

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-16 1:36
tyro
看到说 fcitx 词频问题...下载了 但是还没开始用@ 先谢谢楼主,原来的那个,我还用着@ 发此帖,意在mark@

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-16 2:17
kunkun0217
好!!

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-16 11:58
jiangkero
楼主经常自己和自己聊天 :em04 :em04

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-16 16:54
gt945
搞定,哈哈

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-16 18:14
kuxinren
我用ibus成功了。fcitx更新后不好用,卸载了

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-16 19:42
weilichun
/usr/share/ibus-pinyin/engine/py.db

I replace this SQLite Database file with android.db ,I can not input with pinyin IME now >_<

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-17 10:40
sx-ljm
我的是ibus 1.2 没有那个db目录,难道你们是1.3? 说下那里下载?

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-17 12:17
weilichun

代码: 全选

$ tree /usr/share/ibus-pinyin/
/usr/share/ibus-pinyin/
|-- db
|   |-- android.bak.db
|   |-- android.db
|   `-- google.db
|-- icons
|   |-- chinese.svg
|   |-- english.svg
|   |-- full-punct.svg
|   |-- full.svg
|   |-- half-punct.svg
|   |-- half.svg
|   |-- ibus-pinyin.svg
|   |-- simp-chinese.svg
|   `-- trad-chinese.svg
`-- setup
    |-- ibus-pinyin-preferences.ui
    |-- main.py
    `-- main.pyc

3 directories, 15 files
确实是版本低,升级到Ibus1.3,然后安装ibus-pinyin-db-android
然后就可以覆盖android.db数据库文件了


可以在Ubuntu-tweak里添加ibus源,然后升级ibus

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-17 16:07
jiyuyan
有些应该在

代码: 全选

/usr/share/pinyin-database

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-18 0:15
hubert_star
如果大家装的旧版本,直接替换也应该可以,只要是09年10月份以后的ibus版本应该都可以,不过我没有旧版本,无法测试

另外,我更新了词库,分成了三个词库,大家可以去看看。

词频信息现在很头疼,很多词在不同的文件中可能词频不一样,而且每个文件定义的词频我还没找到标准,只能是按照最大值来处理了。

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-18 9:34
hcym
黑高手

词频要命啊,用了两天没适应

还是删尽配置文件,换alpha.gu的最新版了

:em04

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-18 10:29
hubert_star
楼上,fcitx的词频问题我调整过了

对于fcitx原有词库的单词,总是排在最前面,而且按照原有词频来排列的

对于新增加的词频,目前词频也简单调整过,应该能满足日常需要了

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

发表于 : 2010-01-18 16:48
t3swing
很快就搞定了哈 ,不过黑手的传上来的full就有点吓人了,我的慢网络 只能望洋兴叹了.
看了下代码 ,java的,不懂,词频信息是 0a后面的部分吧?不过后续处理看不明白了.
发现java的东西,空目录还真让人受不了,不知道要cd多少次才能看到代码
sw@~/桌面/sougou-phrases-project-src$tree
.
|-- data
|-- pom.xml
`-- src
|-- main
| |-- java
| | `-- org
| | `-- hubertstar
| | `-- system
| | `-- phrase
| | |-- ByteArrayUtils.java
| | |-- common
| | | `-- Phrase.java
| | |-- inputmethod
| | | |-- fcitx
| | | | `-- FcitxPhraseGenerator.java
| | | `-- ibus
| | | `-- IBusPhraseGenerator.java
| | `-- sougou
| | `-- SougouScel.java
| `-- resources
|-- script
`-- test
|-- java
| `-- org
| `-- hubertstar
| `-- system
| `-- phrase
| |-- FcitxTest.java
| `-- IBusTest.java
`-- resources
|-- a.scel
|-- android.db
|-- create_index.sql
|-- log4j.xml
`-- scel

23 directories, 12 files
sw@~/桌面/sougou-phrases-project-src$
黑手,貌似没看到词频调整的脚本 ,不会是用java写的吧?