120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品 (附加说明)

系统字体配置、中文显示和输入法问题
回复
头像
happyz90
帖子: 1230
注册时间: 2009-01-24 23:07

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#31

帖子 happyz90 » 2010-01-15 21:25

adaml 写了:楼上几位的ibus版本忒低....
谢谢!同时也谢谢楼主,我的成功了~~~ :em05 :em05 :em05
学生仅此而已……
lunacory
帖子: 18
注册时间: 2008-11-10 21:21

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#32

帖子 lunacory » 2010-01-16 1:20

我覆盖了fcitx的词库,内存占用是80.7M,也还行,不算太大
不过词汇上倒是充实了,不过词频非常差,基本上常用的词都在后边甚至在第二列……
估计用一段时间后会好些。

不过说实话,这个sougou细胞词库合并没必要搞这么多阿
楼主能不能出一个sougou常用词汇+网络流型词的版本?
tyro
帖子: 111
注册时间: 2010-01-02 18:39

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#33

帖子 tyro » 2010-01-16 1:36

看到说 fcitx 词频问题...下载了 但是还没开始用@ 先谢谢楼主,原来的那个,我还用着@ 发此帖,意在mark@
My name's tyro and u can call me wowoto instead.
头像
jiangkero
帖子: 704
注册时间: 2008-07-14 10:15

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#35

帖子 jiangkero » 2010-01-16 11:58

楼主经常自己和自己聊天 :em04 :em04
头像
gt945
帖子: 87
注册时间: 2008-07-30 17:34

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#36

帖子 gt945 » 2010-01-16 16:54

搞定,哈哈
头像
kuxinren
帖子: 38
注册时间: 2008-04-27 10:20

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#37

帖子 kuxinren » 2010-01-16 18:14

我用ibus成功了。fcitx更新后不好用,卸载了
头像
weilichun
帖子: 218
注册时间: 2007-09-09 15:41
来自: Beijing
联系:

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#38

帖子 weilichun » 2010-01-16 19:42

/usr/share/ibus-pinyin/engine/py.db

I replace this SQLite Database file with android.db ,I can not input with pinyin IME now >_<
sx-ljm
帖子: 22
注册时间: 2007-10-24 17:40

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#39

帖子 sx-ljm » 2010-01-17 10:40

我的是ibus 1.2 没有那个db目录,难道你们是1.3? 说下那里下载?
头像
weilichun
帖子: 218
注册时间: 2007-09-09 15:41
来自: Beijing
联系:

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#40

帖子 weilichun » 2010-01-17 12:17

代码: 全选

$ tree /usr/share/ibus-pinyin/
/usr/share/ibus-pinyin/
|-- db
|   |-- android.bak.db
|   |-- android.db
|   `-- google.db
|-- icons
|   |-- chinese.svg
|   |-- english.svg
|   |-- full-punct.svg
|   |-- full.svg
|   |-- half-punct.svg
|   |-- half.svg
|   |-- ibus-pinyin.svg
|   |-- simp-chinese.svg
|   `-- trad-chinese.svg
`-- setup
    |-- ibus-pinyin-preferences.ui
    |-- main.py
    `-- main.pyc

3 directories, 15 files
确实是版本低,升级到Ibus1.3,然后安装ibus-pinyin-db-android
然后就可以覆盖android.db数据库文件了


可以在Ubuntu-tweak里添加ibus源,然后升级ibus
jiyuyan
帖子: 257
注册时间: 2007-08-26 18:51

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#41

帖子 jiyuyan » 2010-01-17 16:07

有些应该在

代码: 全选

/usr/share/pinyin-database
头像
hubert_star
论坛版主
帖子: 5373
注册时间: 2007-10-29 22:12
系统: OSX 10.9 + Ub 1304
来自: 江苏南京

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#42

帖子 hubert_star » 2010-01-18 0:15

如果大家装的旧版本,直接替换也应该可以,只要是09年10月份以后的ibus版本应该都可以,不过我没有旧版本,无法测试

另外,我更新了词库,分成了三个词库,大家可以去看看。

词频信息现在很头疼,很多词在不同的文件中可能词频不一样,而且每个文件定义的词频我还没找到标准,只能是按照最大值来处理了。
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒  故我有罪!

我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;

特此声明!

有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。

欢迎来我的新浪微博@me
头像
hcym
帖子: 15634
注册时间: 2007-05-06 2:46

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#43

帖子 hcym » 2010-01-18 9:34

黑高手

词频要命啊,用了两天没适应

还是删尽配置文件,换alpha.gu的最新版了

:em04
头像
hubert_star
论坛版主
帖子: 5373
注册时间: 2007-10-29 22:12
系统: OSX 10.9 + Ub 1304
来自: 江苏南京

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#44

帖子 hubert_star » 2010-01-18 10:29

楼上,fcitx的词频问题我调整过了

对于fcitx原有词库的单词,总是排在最前面,而且按照原有词频来排列的

对于新增加的词频,目前词频也简单调整过,应该能满足日常需要了
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒  故我有罪!

我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;

特此声明!

有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。

欢迎来我的新浪微博@me
t3swing
帖子: 1028
注册时间: 2008-11-01 21:42
来自: 树下板凳

Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品

#45

帖子 t3swing » 2010-01-18 16:48

很快就搞定了哈 ,不过黑手的传上来的full就有点吓人了,我的慢网络 只能望洋兴叹了.
看了下代码 ,java的,不懂,词频信息是 0a后面的部分吧?不过后续处理看不明白了.
发现java的东西,空目录还真让人受不了,不知道要cd多少次才能看到代码
sw@~/桌面/sougou-phrases-project-src$tree
.
|-- data
|-- pom.xml
`-- src
|-- main
| |-- java
| | `-- org
| | `-- hubertstar
| | `-- system
| | `-- phrase
| | |-- ByteArrayUtils.java
| | |-- common
| | | `-- Phrase.java
| | |-- inputmethod
| | | |-- fcitx
| | | | `-- FcitxPhraseGenerator.java
| | | `-- ibus
| | | `-- IBusPhraseGenerator.java
| | `-- sougou
| | `-- SougouScel.java
| `-- resources
|-- script
`-- test
|-- java
| `-- org
| `-- hubertstar
| `-- system
| `-- phrase
| |-- FcitxTest.java
| `-- IBusTest.java
`-- resources
|-- a.scel
|-- android.db
|-- create_index.sql
|-- log4j.xml
`-- scel

23 directories, 12 files
sw@~/桌面/sougou-phrases-project-src$
黑手,貌似没看到词频调整的脚本 ,不会是用java写的吧?
民族的脊梁,是踏实做事的人,非只知道骂街的泼妇。
回复