香橙派Orangepi3B制作AI大模型语音对话盒子(二)
剑事
2023年10月24日 15:43
收录于文集
共3篇
AI教程~

准备资源

1.唤醒词 snowboy

https://github.com/Kitt-AI/snowboy

需要在运行机上编译对应的库

下载源码进入swig/Python3目录执行 make

这里需要注意:MakeFile 文件里配置有点问题 make前需要修改

SNOWBOYDETECTLIBFILE = $(TOPDIR)/lib/aarch64-ubuntu1604/libsnowboy-detect.a

编译成功后 参照 github 上的说明集成到工程里

生成模型

https://snowboy.hahack.com/

在这个网页自行录音三个以上,生成模型下载到本地即可测试

detector = snowboydecoder.HotwordDetector(model模型, sensitivity=敏感度)

支持多组模型同时用

2.申请模型接口

以通义千问为例:阿里云注册账号,找到“模型服务灵积”菜单开启服务,获取api_key

按装 sdk dashscope

3.语音文字互转

我用的 azure 的,用法参考

https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/text-to-speech