分页: 1 / 1

我为`fcitx5`实现的一个中文语音输入法:fcitx5-net

发表于 : 2025-06-01 16:40
fuhuizn
为fcitx5实现一个中文语音输入法
我这几天为fcitx5实现一个中文语音输入法,由三部分组成:

1. fcitx5输入法模块fcitx5-net,名字是net,显示图标是汉字“网”,作用是向goimserver发送录音指令和结束录音指令。
2. 录音服务器goimserver,作用是按照fcitx5-net的指令录音,然后把录音发给asr-paddlespeech识别,再把识别结果发送给fcitx5-net。
3. 语音识别服务器asr-paddlespeech,用百度飞桨实现的著名语音AI-paddlespeech提供本地http语音识别服务。

安装方法:
一、安装fcitx5-net
源代码地址是https://gitee.com/rocket049/fcitx5-net,为ubuntu24.04打包好的DEB包下载地址是https://gitee.com/rocket049/fcitx5-net/releases,其他系统可以自己编译或者把这个包重新打包以适应其他系统。

二、安装goimserver
源代码地址是https://gitee.com/rocket049/goimserver,为ubuntu24.04编译好的程序压缩包下载地址是https://gitee.com/rocket049/goimserver/releases,编译时需要安装portaudio19-dev和libasound2-dev,运行只需要安装libporaudio2和libasound2。

三、安装asr-paddlespeech
源代码地址是https://gitee.com/rocket049/asr-paddlespeech,下载源代码后进入本目录,按照readme.txt装paddlespeech运行环境,然后运行脚本run-asr-server就可以了。脚本run-im-backend可以同时启动goimserver和asr-paddlespeech,但是要先把goimserver程序链接或复制到本目录下。脚本close-im-backend用来关闭后台运行的goimserver和asr-paddlespeech。

使用方法:
安装fcitx5-net后,先运行脚本run-im-backend,然后把输入法切换到fcitx5-net,输入法名字是net,显示图标是汉字“网”,点一下右侧Ctrl,开始录音,结束时在按一次右侧Ctrl,识别结果就会直接输入到光标处。

Re: 我为`fcitx5`实现的一个中文语音输入法:fcitx5-net

发表于 : 2025-06-03 14:04
南风夜雨
虽然暂时不用fcitx,电脑上也不用语音输入,但对作者必须点一个赞。
——话说论坛真的好冷清。

Re: 我为`fcitx5`实现的一个中文语音输入法:fcitx5-net

发表于 : 2025-06-03 16:32
imxys
板凳
牛逼啊

Re: 我为`fcitx5`实现的一个中文语音输入法:fcitx5-net

发表于 : 2025-06-03 17:58
百草谷居士
楼主很拽啊!

提个建议,把用户交互逻辑改下:按下右侧 ctrl 键开始录音,松开停止录音。理由不再阐述