OpenAI开源Whisper,我来教你如何从零开始搭建
实时语音识别部署教程 | 可离线部署的实时语音识别项目 | funasr实时语音识别 | funasr | 实时语音识别 | 流式语音识别 | 语音识别
可本地部署的实时语音识别项目 | funasr实时语音识别 | 流式语音识别
免费开源语音转文字Whisper快速搭建,可生成字幕,媒体人的福音
说话人分离 | 录音分离 | 区分不同说话人声音 | 声纹识别 | 录音拆分 | 单轨录音拆分说话人 | 语音识别 | FunASR
VAD优化Whisper,faster-whisper-webui一个转录速度起飞的开源语音识别项目,转录效果很好
免费开源的语音转文本软件Whisper的本地搭建详细教程 | Whisper部署
whisper最新开源语音识别模型 | 企业级开源语音识别项目
从零开始部署Fun-ASR-Nano实时语音识别项目 | Linux中私有化部署实时语音识别 | Fun-ASR部署
日语语音识别 | Japanese ASR | 日语转写 | 日语视频提取字幕 | 音视频字幕提取 | OpenAI Whisper日语优化后的模型
基于faster whisper的实时语音识别项目
语音降噪与人声增强 | resemble enhance本地部署 | 语音降噪与人声增强体验 | 开源的语音降噪项目
实时区分说话人并实时语音识别 | Fun-ASR-Nano实时区分说话人 | 实时语音识别并区分说话人 | 流式语音转写并区分说话人 | FunASR
VSCode中如何修改默认的终端
Windows部署精准识别日语的语音识别模型 | Kotoba_Whisper日语增强型ASR模型本地化部署说明详细视频
Fun-ASR-Nano支持区分说话人了,但是还有问题 | FunASR大更新了,SenseVoice开始支持区分说话人
体验小米MiMo开源的ASR大模型 | MiMo-V2.5-ASR体验
流式转写并区分说话人 | Fun-ASR-Nano流式转写 | Fun-ASR-Nano实时语音识别并区分说话人 | Fun-ASR
语音合成速度最快的开源TTS | 基于MIT协议可商用的开源TTS | 这是我用过合成速度最快的开源TTS
噪音消除和人声增强 | 很好用的一个降噪和人声增强工具