准备资源
1.唤醒词 snowboy
https://github.com/Kitt-AI/snowboy
需要在运行机上编译对应的库
下载源码进入swig/Python3目录执行 make
这里需要注意:MakeFile 文件里配置有点问题 make前需要修改
SNOWBOYDETECTLIBFILE = $(TOPDIR)/lib/aarch64-ubuntu1604/libsnowboy-detect.a
编译成功后 参照 github 上的说明集成到工程里
生成模型
https://snowboy.hahack.com/
在这个网页自行录音三个以上,生成模型下载到本地即可测试
detector = snowboydecoder.HotwordDetector(model模型, sensitivity=敏感度)
支持多组模型同时用
2.申请模型接口
以通义千问为例:阿里云注册账号,找到“模型服务灵积”菜单开启服务,获取api_key
按装 sdk dashscope
3.语音文字互转
我用的 azure 的,用法参考
https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/text-to-speech