我为`fcitx5`实现的一个中文语音输入法:fcitx5-net
发表于 : 2025-06-01 16:40
为fcitx5实现一个中文语音输入法
我这几天为fcitx5实现一个中文语音输入法,由三部分组成:
1. fcitx5输入法模块fcitx5-net,名字是net,显示图标是汉字“网”,作用是向goimserver发送录音指令和结束录音指令。
2. 录音服务器goimserver,作用是按照fcitx5-net的指令录音,然后把录音发给asr-paddlespeech识别,再把识别结果发送给fcitx5-net。
3. 语音识别服务器asr-paddlespeech,用百度飞桨实现的著名语音AI-paddlespeech提供本地http语音识别服务。
安装方法:
一、安装fcitx5-net
源代码地址是https://gitee.com/rocket049/fcitx5-net,为ubuntu24.04打包好的DEB包下载地址是https://gitee.com/rocket049/fcitx5-net/releases,其他系统可以自己编译或者把这个包重新打包以适应其他系统。
二、安装goimserver
源代码地址是https://gitee.com/rocket049/goimserver,为ubuntu24.04编译好的程序压缩包下载地址是https://gitee.com/rocket049/goimserver/releases,编译时需要安装portaudio19-dev和libasound2-dev,运行只需要安装libporaudio2和libasound2。
三、安装asr-paddlespeech
源代码地址是https://gitee.com/rocket049/asr-paddlespeech,下载源代码后进入本目录,按照readme.txt装paddlespeech运行环境,然后运行脚本run-asr-server就可以了。脚本run-im-backend可以同时启动goimserver和asr-paddlespeech,但是要先把goimserver程序链接或复制到本目录下。脚本close-im-backend用来关闭后台运行的goimserver和asr-paddlespeech。
使用方法:
安装fcitx5-net后,先运行脚本run-im-backend,然后把输入法切换到fcitx5-net,输入法名字是net,显示图标是汉字“网”,点一下右侧Ctrl,开始录音,结束时在按一次右侧Ctrl,识别结果就会直接输入到光标处。
我这几天为fcitx5实现一个中文语音输入法,由三部分组成:
1. fcitx5输入法模块fcitx5-net,名字是net,显示图标是汉字“网”,作用是向goimserver发送录音指令和结束录音指令。
2. 录音服务器goimserver,作用是按照fcitx5-net的指令录音,然后把录音发给asr-paddlespeech识别,再把识别结果发送给fcitx5-net。
3. 语音识别服务器asr-paddlespeech,用百度飞桨实现的著名语音AI-paddlespeech提供本地http语音识别服务。
安装方法:
一、安装fcitx5-net
源代码地址是https://gitee.com/rocket049/fcitx5-net,为ubuntu24.04打包好的DEB包下载地址是https://gitee.com/rocket049/fcitx5-net/releases,其他系统可以自己编译或者把这个包重新打包以适应其他系统。
二、安装goimserver
源代码地址是https://gitee.com/rocket049/goimserver,为ubuntu24.04编译好的程序压缩包下载地址是https://gitee.com/rocket049/goimserver/releases,编译时需要安装portaudio19-dev和libasound2-dev,运行只需要安装libporaudio2和libasound2。
三、安装asr-paddlespeech
源代码地址是https://gitee.com/rocket049/asr-paddlespeech,下载源代码后进入本目录,按照readme.txt装paddlespeech运行环境,然后运行脚本run-asr-server就可以了。脚本run-im-backend可以同时启动goimserver和asr-paddlespeech,但是要先把goimserver程序链接或复制到本目录下。脚本close-im-backend用来关闭后台运行的goimserver和asr-paddlespeech。
使用方法:
安装fcitx5-net后,先运行脚本run-im-backend,然后把输入法切换到fcitx5-net,输入法名字是net,显示图标是汉字“网”,点一下右侧Ctrl,开始录音,结束时在按一次右侧Ctrl,识别结果就会直接输入到光标处。