谢谢!同时也谢谢楼主,我的成功了~~~adaml 写了:楼上几位的ibus版本忒低....
120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品 (附加说明)
- happyz90
- 帖子: 1230
- 注册时间: 2009-01-24 23:07
-
- 帖子: 18
- 注册时间: 2008-11-10 21:21
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
我覆盖了fcitx的词库,内存占用是80.7M,也还行,不算太大
不过词汇上倒是充实了,不过词频非常差,基本上常用的词都在后边甚至在第二列……
估计用一段时间后会好些。
不过说实话,这个sougou细胞词库合并没必要搞这么多阿
楼主能不能出一个sougou常用词汇+网络流型词的版本?
不过词汇上倒是充实了,不过词频非常差,基本上常用的词都在后边甚至在第二列……
估计用一段时间后会好些。
不过说实话,这个sougou细胞词库合并没必要搞这么多阿
楼主能不能出一个sougou常用词汇+网络流型词的版本?
-
- 帖子: 111
- 注册时间: 2010-01-02 18:39
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
看到说 fcitx 词频问题...下载了 但是还没开始用@ 先谢谢楼主,原来的那个,我还用着@ 发此帖,意在mark@
My name's tyro and u can call me wowoto instead.
- kunkun0217
- 帖子: 441
- 注册时间: 2007-11-14 17:39
- 联系:
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
好!!
Twitter@Yunkwan
http://yunkwan.wordpress.com
爱护地球,请尽量避免编译
Linux仿Mac之KDE篇
简单修复Grub2
解决英文环境Opera中文字体问题
解决Linux字体发虚的终极方法(适合用于假如你试过网上的方法都无效)
http://yunkwan.wordpress.com
爱护地球,请尽量避免编译
Linux仿Mac之KDE篇
简单修复Grub2
解决英文环境Opera中文字体问题
解决Linux字体发虚的终极方法(适合用于假如你试过网上的方法都无效)
- jiangkero
- 帖子: 704
- 注册时间: 2008-07-14 10:15
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
楼主经常自己和自己聊天
- gt945
- 帖子: 87
- 注册时间: 2008-07-30 17:34
- kuxinren
- 帖子: 38
- 注册时间: 2008-04-27 10:20
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
我用ibus成功了。fcitx更新后不好用,卸载了
- weilichun
- 帖子: 218
- 注册时间: 2007-09-09 15:41
- 来自: Beijing
- 联系:
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
/usr/share/ibus-pinyin/engine/py.db
I replace this SQLite Database file with android.db ,I can not input with pinyin IME now >_<
I replace this SQLite Database file with android.db ,I can not input with pinyin IME now >_<
-
- 帖子: 22
- 注册时间: 2007-10-24 17:40
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
我的是ibus 1.2 没有那个db目录,难道你们是1.3? 说下那里下载?
- weilichun
- 帖子: 218
- 注册时间: 2007-09-09 15:41
- 来自: Beijing
- 联系:
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
代码: 全选
$ tree /usr/share/ibus-pinyin/
/usr/share/ibus-pinyin/
|-- db
| |-- android.bak.db
| |-- android.db
| `-- google.db
|-- icons
| |-- chinese.svg
| |-- english.svg
| |-- full-punct.svg
| |-- full.svg
| |-- half-punct.svg
| |-- half.svg
| |-- ibus-pinyin.svg
| |-- simp-chinese.svg
| `-- trad-chinese.svg
`-- setup
|-- ibus-pinyin-preferences.ui
|-- main.py
`-- main.pyc
3 directories, 15 files
然后就可以覆盖android.db数据库文件了
可以在Ubuntu-tweak里添加ibus源,然后升级ibus
-
- 帖子: 257
- 注册时间: 2007-08-26 18:51
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
有些应该在下
代码: 全选
/usr/share/pinyin-database
- hubert_star
- 论坛版主
- 帖子: 5373
- 注册时间: 2007-10-29 22:12
- 系统: OSX 10.9 + Ub 1304
- 来自: 江苏南京
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
如果大家装的旧版本,直接替换也应该可以,只要是09年10月份以后的ibus版本应该都可以,不过我没有旧版本,无法测试
另外,我更新了词库,分成了三个词库,大家可以去看看。
词频信息现在很头疼,很多词在不同的文件中可能词频不一样,而且每个文件定义的词频我还没找到标准,只能是按照最大值来处理了。
另外,我更新了词库,分成了三个词库,大家可以去看看。
词频信息现在很头疼,很多词在不同的文件中可能词频不一样,而且每个文件定义的词频我还没找到标准,只能是按照最大值来处理了。
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒 故我有罪!
我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;
特此声明!
有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。
欢迎来我的新浪微博@me
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒 故我有罪!
我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;
特此声明!
有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。
欢迎来我的新浪微博@me
- hcym
- 帖子: 15634
- 注册时间: 2007-05-06 2:46
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
黑高手
词频要命啊,用了两天没适应
还是删尽配置文件,换alpha.gu的最新版了
词频要命啊,用了两天没适应
还是删尽配置文件,换alpha.gu的最新版了
- hubert_star
- 论坛版主
- 帖子: 5373
- 注册时间: 2007-10-29 22:12
- 系统: OSX 10.9 + Ub 1304
- 来自: 江苏南京
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
楼上,fcitx的词频问题我调整过了
对于fcitx原有词库的单词,总是排在最前面,而且按照原有词频来排列的
对于新增加的词频,目前词频也简单调整过,应该能满足日常需要了
对于fcitx原有词库的单词,总是排在最前面,而且按照原有词频来排列的
对于新增加的词频,目前词频也简单调整过,应该能满足日常需要了
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒 故我有罪!
我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;
特此声明!
有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。
欢迎来我的新浪微博@me
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒 故我有罪!
我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;
特此声明!
有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。
欢迎来我的新浪微博@me
-
- 帖子: 1028
- 注册时间: 2008-11-01 21:42
- 来自: 树下板凳
Re: 120余万的搜狗细胞词库-fcitx&ibus拼音输入法词库:个人无聊的作品
很快就搞定了哈 ,不过黑手的传上来的full就有点吓人了,我的慢网络 只能望洋兴叹了.
看了下代码 ,java的,不懂,词频信息是 0a后面的部分吧?不过后续处理看不明白了.
发现java的东西,空目录还真让人受不了,不知道要cd多少次才能看到代码
看了下代码 ,java的,不懂,词频信息是 0a后面的部分吧?不过后续处理看不明白了.
发现java的东西,空目录还真让人受不了,不知道要cd多少次才能看到代码
黑手,貌似没看到词频调整的脚本 ,不会是用java写的吧?sw@~/桌面/sougou-phrases-project-src$tree
.
|-- data
|-- pom.xml
`-- src
|-- main
| |-- java
| | `-- org
| | `-- hubertstar
| | `-- system
| | `-- phrase
| | |-- ByteArrayUtils.java
| | |-- common
| | | `-- Phrase.java
| | |-- inputmethod
| | | |-- fcitx
| | | | `-- FcitxPhraseGenerator.java
| | | `-- ibus
| | | `-- IBusPhraseGenerator.java
| | `-- sougou
| | `-- SougouScel.java
| `-- resources
|-- script
`-- test
|-- java
| `-- org
| `-- hubertstar
| `-- system
| `-- phrase
| |-- FcitxTest.java
| `-- IBusTest.java
`-- resources
|-- a.scel
|-- android.db
|-- create_index.sql
|-- log4j.xml
`-- scel
23 directories, 12 files
sw@~/桌面/sougou-phrases-project-src$
民族的脊梁,是踏实做事的人,非只知道骂街的泼妇。