为fcitx5实现一个中文语音输入法
我这几天为fcitx5实现一个中文语音输入法,由三部分组成:
1. fcitx5输入法模块fcitx5-net,名字是net,显示图标是汉字“网”,作用是向goimserver发送录音指令和结束录音指令。
2. 录音服务器goimserver,作用是按照fcitx5-net的指令录音,然后把录音发给asr-paddlespeech识别,再把识别结果发送给fcitx5-net。
3. 语音识别服务器asr-paddlespeech,用百度飞桨实现的著名语音AI-paddlespeech提供本地http语音识别服务。
安装方法:
一、安装fcitx5-net
源代码地址是https://gitee.com/rocket049/fcitx5-net,为ubuntu24.04打包好的DEB包下载地址是https://gitee.com/rocket049/fcitx5-net/releases,其他系统可以自己编译或者把这个包重新打包以适应其他系统。
二、安装goimserver
源代码地址是https://gitee.com/rocket049/goimserver,为ubuntu24.04编译好的程序压缩包下载地址是https://gitee.com/rocket049/goimserver/releases,编译时需要安装portaudio19-dev和libasound2-dev,运行只需要安装libporaudio2和libasound2。
三、安装asr-paddlespeech
源代码地址是https://gitee.com/rocket049/asr-paddlespeech,下载源代码后进入本目录,按照readme.txt装paddlespeech运行环境,然后运行脚本run-asr-server就可以了。脚本run-im-backend可以同时启动goimserver和asr-paddlespeech,但是要先把goimserver程序链接或复制到本目录下。脚本close-im-backend用来关闭后台运行的goimserver和asr-paddlespeech。
使用方法:
安装fcitx5-net后,先运行脚本run-im-backend,然后把输入法切换到fcitx5-net,输入法名字是net,显示图标是汉字“网”,点一下右侧Ctrl,开始录音,结束时在按一次右侧Ctrl,识别结果就会直接输入到光标处。
我为`fcitx5`实现的一个中文语音输入法:fcitx5-net
-
- 帖子: 961
- 注册时间: 2006-01-06 22:55
- 系统: ubuntu
- 联系:
- 南风夜雨
- 帖子: 857
- 注册时间: 2007-01-04 9:49
- 系统: ubuntu-gnome
Re: 我为`fcitx5`实现的一个中文语音输入法:fcitx5-net
虽然暂时不用fcitx,电脑上也不用语音输入,但对作者必须点一个赞。
——话说论坛真的好冷清。
——话说论坛真的好冷清。
- imxys
- 帖子: 80
- 注册时间: 2014-05-03 22:44
- 系统: Ubuntu 24.04;Manjaro
- 百草谷居士
- 帖子: 4020
- 注册时间: 2006-02-10 16:36
- 系统: debian12/xubuntu2404
Re: 我为`fcitx5`实现的一个中文语音输入法:fcitx5-net
楼主很拽啊!
提个建议,把用户交互逻辑改下:按下右侧 ctrl 键开始录音,松开停止录音。理由不再阐述
提个建议,把用户交互逻辑改下:按下右侧 ctrl 键开始录音,松开停止录音。理由不再阐述
Mint 22 / Xubuntu 24.04
为何热衷于搞发行版的多,搞应用程序开发的少?Linux最多余的就是各种发行版,最缺的就是应用程序,特别是行业应用程序。
为何热衷于搞发行版的多,搞应用程序开发的少?Linux最多余的就是各种发行版,最缺的就是应用程序,特别是行业应用程序。