唉!输入法又坏了!

系统字体配置、中文显示和输入法问题
头像
Ping-Wu
帖子: 1822
注册时间: 2012-11-14 9:34
系统: Debian 12

Re: 唉!输入法又坏了!

#76

帖子 Ping-Wu » 2019-11-28 0:53

百草谷居士 写了: 2019-11-27 21:02ibus-pinyin的词库文件是sqlite数据库,请问具体在什么位置,哪个文件?是用户词库还是系统词库?
我在另帖提到:
要使用ibus-pinyin时,必须先装pinyin-database(/usr/share/pinyin-database/main.db)。使用了一段时间以后,慢慢的建立了对自己最适合的pinyin 数据库,用起来就越来越顺了。

(这个私人的pinyin数据库储存在 ~/.cache/ibus/pinyin/user-1.0.db 档案里,安装新系统时,可以copy过去。)
viewtopic.php?f=8&t=484462

有关 ibus-pinyin 的 sqlite 架构,我也在这里提到过,没有人有兴趣,一下子找不到在那个帖子里,不想再浪费时间。

ibus-pinyin 的发明人 黄鹏 是一位少见的天才。花一点时间研究 ibus-pinyin 的数据架构后, I believe everyone will come out with the same conclusion。
Linux开始被企业界重视以后,为了统一中日文等的输入,大家同意了一个叫做 IIIMF (Internet/Intranet Input Method Framework)的开发平台。差不多 2007~8时(?),红帽的工程师 Shawn Huang (黄鹏)提出了 ibus 这个架构(印象中是这样的),大家发现比 IIIMF 进阶多了,于是 ibus变成Linux的主要成分之一。
不过,ibus-pinyin 已经很久没有人在维护了,如果有在校学生有这个雄心把它当作一个研究计划,我们非常愿意支持(但也只限于提供硬体支助)。Ubuntu 19.10 以后, ibus-pinyin 实质上已无法使用了。我提出了一个 bug report:

https://bugs.launchpad.net/ubuntu/+sour ... ug/1840022
头像
yq-ysy
论坛版主
帖子: 4449
注册时间: 2008-07-19 12:44
来自: 广西(桂)南宁(邕)

Re: 唉!输入法又坏了!

#77

帖子 yq-ysy » 2019-11-28 11:17

Ping-Wu 写了: 2019-11-28 0:53
百草谷居士 写了: 2019-11-27 21:02ibus-pinyin的词库文件是sqlite数据库,请问具体在什么位置,哪个文件?是用户词库还是系统词库?
有关 ibus-pinyin 的 sqlite 架构,我也在这里提到过,没有人有兴趣,一下子找不到在那个帖子里
在我们论坛的右上角,有个“高级搜索”,我按作者和关键字搜索,找到这个:
《为ibus输入法导入第三方词库 phrase_converter_for_ibus》
viewtopic.php?p=1277555
下面的截图显示ibus-pinyin sqlite 档案的database 格式
图片
头像
Ping-Wu
帖子: 1822
注册时间: 2012-11-14 9:34
系统: Debian 12

Re: 唉!输入法又坏了!

#78

帖子 Ping-Wu » 2019-11-29 0:35

yq-ysy 写了: 2019-11-28 11:17在我们论坛的右上角,有个“高级搜索”,我按作者和关键字搜索,找到这个:
《为ibus输入法导入第三方词库 phrase_converter_for_ibus》
我的那篇PO文时间比这个更早,里面简单谈到 ibus-pinyin 的基本结构,包括如何将拼音字母转换为数字,以及数据库里参数的简单解释等。
Ping-Wu 写了: 2019-11-28 0:53Ubuntu 19.10 以后, ibus-pinyin 实质上已无法使用了。我提出了一个 bug report:
https://bugs.launchpad.net/ubuntu/+sour ... ug/1840022

这个 bug report 有 “零” 人赞同,当然消失在成千上万的其他 bug reports 中了。

again,ibus-pinyin 已被 Ubuntu 官方放弃(deprecated) 了,一般 Ubuntu 使用者的程度也不够深,再谈不只是浪费时间,也把大家搞浑了。不过对源码有兴趣的学生,这其实是一个很好的题材。在开源世界里,不谈到源码,基本上无法真正聚合社群力量。
头像
yq-ysy
论坛版主
帖子: 4449
注册时间: 2008-07-19 12:44
来自: 广西(桂)南宁(邕)

Re: 唉!输入法又坏了!

#79

帖子 yq-ysy » 2019-11-29 9:47

Ping-Wu 写了: 2019-11-29 0:35
yq-ysy 写了: 2019-11-28 11:17在我们论坛的右上角,有个“高级搜索”,我按作者和关键字搜索,找到这个:
《为ibus输入法导入第三方词库 phrase_converter_for_ibus》
我的那篇PO文时间比这个更早,里面简单谈到 ibus-pinyin 的基本结构,包括如何将拼音字母转换为数字,以及数据库里参数的简单解释等。
按用户搜索关键词“ibus-pinyin”或“数字”也找不到你的这篇文章,也许你是发表在 ubuntu kylin 论坛的?
https://www.ubuntukylin.com/ukylin/foru ... &extra=%20...
https://www.ubuntukylin.com/ukylin/foru ... 029&extra=
不幸的是,页面显示“提示: 作者被禁止或删除 内容自动屏蔽”。
头像
Ping-Wu
帖子: 1822
注册时间: 2012-11-14 9:34
系统: Debian 12

Re: 唉!输入法又坏了!

#80

帖子 Ping-Wu » 2019-11-29 13:33

yq-ysy 写了: 2019-11-29 9:47也许你是发表在 ubuntu kylin 论坛的?
https://www.ubuntukylin.com/ukylin/foru ... &extra=%20...
https://www.ubuntukylin.com/ukylin/foru ... 029&extra=
不幸的是,页面显示“提示: 作者被禁止或删除 内容自动屏蔽”。
好久(最少好几年)没有在 UbuntuKylin 的论坛上活动了,今天进入,发现真的无法阅读我以前的PO文*。有一阵子 UbuntuKylin 常常被色情业攻入,整个晚上没有人处理。大概优麒麟的领导看不下去,决定删掉了一大堆会员的权力(UbuntuKylin 的注册会员有好几万,根本无法有效管理)。我想因为我太久没有活动了,也上了黑名单。不过我看 UbuntuKylin 就像在看中国足球一样,资源一大堆,但踢打都是花拳绣腿。绝对不是嘲笑,而是内心实在很难过。

在开源软件世界,更新一下中国一句老话:“万般皆下品,唯有源码高”。虽然我不愿意再谈 ibus-pinyin,以后如果有时间我还是会尽量把源码详细研读。把 ibus-pinyin 重新打包,再加入 “单手笔顺输入法”,其实是一个很好的(最少)硕士论文题目。雇主也会很喜欢有实际经验的毕业生。

* ibus-pinyin 把整个 database 分成 17 个 tables,从 py_phrase_0 (输入单元只包括一个单字)到 py_phrase_15(输入单元有 16 个单字),每个中文单字则拆成子音(以 integer 0~23 表示)跟 母音(24~56),如下:
ibus-pinyin.jpg
上次由 Ping-Wu 在 2019-12-08 12:45,总共编辑 2 次。
头像
百草谷居士
帖子: 3921
注册时间: 2006-02-10 16:36
系统: Mint21.1/Deepin20.8

Re: 唉!输入法又坏了!

#81

帖子 百草谷居士 » 2019-12-05 15:31

我下载了yq-ysy提供的183万的词库,安装了词库后,好像比以前更卡了,也许是心理感觉。另外词库里面有一些很偏僻的词,不知道啥意思。
单从个人角度考虑,每个人自己使用到的词是有限的,把自己使用的词库保存起来就行。
但从推广来说,还是需要一个大词库的。不过这样的词库应该优化。
比如输入词库时,会出现“此窟”,这可是个偏僻词,不知道啥场景用到
debian 12 / 深度系统 20.9 / Mint 21.3

为何热衷于搞发行版的多,搞应用程序开发的少?Linux最多余的就是各种发行版,最缺的就是应用程序,特别是行业应用程序。
头像
Ping-Wu
帖子: 1822
注册时间: 2012-11-14 9:34
系统: Debian 12

Re: 唉!输入法又坏了!

#82

帖子 Ping-Wu » 2019-12-06 1:25

百草谷居士 写了: 2019-12-05 15:31 我下载了yq-ysy提供的183万的词库,安装了词库后,好像比以前更卡了,也许是心理感觉。另外词库里面有一些很偏僻的词,不知道啥意思。
单从个人角度考虑,每个人自己使用到的词是有限的,把自己使用的词库保存起来就行。
但从推广来说,还是需要一个大词库的。不过这样的词库应该优化。
比如输入词库时,会出现“此窟”,这可是个偏僻词,不知道啥场景用到
加入 yq-ysy 的词库后,我输入 dshbshshrf 马上出现 「单手笔顺输入法」 :Haha
Screenshot from 2019-12-05 06-34-34.jpg
一般人如果想要第一次使用就能得心应手,可以利用像 GitHub 这种工具,合力把 yq-ysy 的词库 「训练」一下,让最常用的字/词出现在最前面。不过大家到这里来就像在野外找到厕所,可以拉就好。反正中文输入法多得像牛毛,到处试试不同的套件也很有意思。

谈一个题外话。最近我们又犯了旧毛病,又开始想推动 Ubuntu 了。要推动 Linux 桌面系统,唯一的方法当然是使用 customized LiveUSB。我把我个人已经训练超过一个月的 ibus-libpinyin 词复制到这个 LiveUSB 里面,即使是从优棒开机,打起中文来,也非常快。用官方的 iso 的话,不但有时候会卡,常常一个字要翻页好多次,快发疯了!
回复