基于faster_whisper的实时语音识别

5774
1
2023-12-20 00:50:30
44
10
126
26
基于faster_whisper的实时语音识别
一起学习编程吧!我创建了一个技术分享博客https://blog.lukeewin.top,欢迎大家来访问。
AI
(31/115)
自动连播
34.3万播放
简介
免费开源的语音转文本软件Whisper的本地搭建详细教程
24:10
免费开源语音转文字Whisper快速搭建,可生成字幕,媒体人的福音
13:34
OpenAI开源Whisper,我来教你如何从零开始搭建
18:46
基于清华大学开源的ChatGLM搭建属于自己的ChatGPT
24:52
【ChatGLM】搭建ChatGLM原来如此简单
14:22
【AI绘画】如何搭建Stable Diffusion
11:05
AI生成的手永远是个问题
03:53
可以白嫖的语音识别项目 | 小白都能懂的搭建OpenAI开源语音识别Whisper教程
32:28
Linux中搭建语音识别项目Whisper | 可免费使用的语音转文字项目
31:30
企业级CentOS系统安装开源免费的语音识别项目whisper | 可在RedHat系统中安装whisper | 免费制作字幕的开源软件
36:46
whisper-jax最详细的安装教程 | 一个号称比whisper快70倍的语音识别项目 | 免费开源的语音识别项目
29:36
VAD优化Whisper,faster-whisper-webui一个转录速度起飞的开源语音识别项目,转录效果很好
19:57
使用VAD优化过的whisper语音识别开源项目faster-whisper-webui,免费开源,福利多多
16:31
meta开源的这个AI厉害了,这个AI还真有点东西
08:10
基于faster whisper的实时语音识别项目
07:25
实时语音识别
17:42
离线部署Whisper | 如何在纯内网环境中安装Whisper
10:56
CentOS中部署语音识别Whisper
46:34
纯内网部署Whisper | 竟然可以这么简单在无外网环境下安装Whisper
38:17
内网环境部署Whisper
27:35
使用Whisper批量生成视频字幕 | 自媒体人的福利 | 自动批量生成视频字幕
08:39
实时语音识别部署教程 | 可离线部署的实时语音识别项目
36:31
faster whisper webui开源项目本地搭建教学分享 | 个人笔记本电脑可以搭建的语音识别项目
01:19:47
whisper最新开源语音识别模型 | 企业级开源语音识别项目
26:42
网易开源语音合成TTS项目演示 | 免费白嫖党的福音
21:07
开源EmotiVoice安装教程 | TTS | 免费开源TTS
56:37
部署OpenAI开源的Whisper语音识别项目
15:20
faster-whisper在windows中的搭建注意事项以及详细过程 | faster-whisper和openai-whisper对比
01:29:18
faster_whisper部署详细教程 | 可内网部署ASR | 开源ASR
07:33
faster_whisper封装成一个api接口
02:47
基于faster_whisper的实时语音识别
04:51
Java对接生成式大模型ChatGML
26:49
Java对接大模型ChatGML
26:28
语音合成 | TTS | 有声小说福利
03:57
可角色扮演的超拟人大模型 | 可做虚拟数字人的大脑
06:37
构建自己知识库的大模型
07:16
基于whisper实现的前端调用麦克风进行语音识别
06:06
Whisper | Faster Whisper | 语音识别 | 可内网部署的ASR
07:02
whisper-jax | 可在内网部署的语音识别开源项目
05:10
Linux搭建Whisper-JAX | 公司内网部署的开源语音识别项目
01:07:23
Linux中部署Whisper | whisper,whisper-jax,faster whisper三者速度对比 | 可以私有化部署的开源语音识别系统
01:07:07
whisper,whisper-jax和faster whisper速度对比
11:02
基于大模型的本地知识库问答系统 | 开源的大模型和本地知识库问题系统 | LangChain和LLM | 企业可免费商用的国内大模型
34:58
国内开源大模型演示 | ChatGLM3 | 大模型 | 可商用大模型
11:42
可在笔记本跑的大模型 | 超轻量级大模型 | 千问大模型笔记本可部署 | Qwen1.5笔记本部署 | 大模型毕设的福利
08:54
【大模型微调】ChatGLM3-6b大模型微调 | 基于开源的大模型的微调 | 使用自己的数据集来微调大模型 | 垂直领域大模型 | lora微调大模型
32:01
开源语音合成TTS | 有声小说的福音 | TTS
14:02
ChatTTS最详细搭建教程 | 开源ChatTTS | 开源语音合成 | 开源TTS | 开源TTS最详细部署教程
01:01:22
Linux中部署TTS API | ChatTTS API | 语音合成 | 最真实的语音合成 | 可内网部署的TTS
29:26
这是第一次尝试使用Python编写GUI程序 | ASR | 语音识别 | 批量语音识别
06:07
批量生成字幕 | 批量语音识别
08:06
asr | 基于faster whisper 开发的批量生成字幕软件 | 语音识别
07:39
faster_whisper转写泰语报错
06:28
libiomp5md.dll报错解决方案
10:33
开源人声分离解决方案spleeter | 从音乐中分离出人声
09:56
生成字幕还得是openai whisper
08:50
转换微调后的Whisper模型格式为OpenAI格式
12:30
噪音消除和人声增强 | 很好用的一个降噪和人声增强工具
11:27
AI降噪
06:28
基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别
06:12
基于faster_whisper的实时语音识别改进版 | whisper中出现繁体中文的解决方法 | 语音识别中繁体转简体 | OpenCC
05:57
faster_whisper对接大模型进行语音对话 | 人机对话 | 语音识别 | 大模型
10:13
自动化转写 | 自动化语音识别 | 对直播录屏自动化生成字幕 | 大模型总结视频内容
05:56
媒体人的福音 | 对直播自动录屏的视频生成字幕
09:33
记录语音识别开发中遇到的一个坑
07:14
python编写的一个自动化监听指定路径下的音视频,并对其进行转写 | 用大模型对视频内容进行总结 | 自动化生成视频字幕
07:51
解决字幕显示不完全问题 | 视频字幕自动生成脚本
04:30
内网环境中部署funasr说明视频 | 无网络环境中的实时语音识别 | 内网实时语音识别 | 内网部署funasr
07:50
自动生成字幕程序优化 | 视频字幕生成 | 制作视频字幕 | 自动化制作视频字幕
11:19
语音识别
04:46
语音识别模型微调 | 训练一个自己的模型 | 训练模型 | 大模型训练 | ASR模型训练 | 模型微调 | ASR模型微调
11:32
可用于智能呼叫中心的内网可用的区分说话人的语音识别 | 通话区分说话人语音识别 | 通话区分说话人语音转写
09:02
区分说话人转写 | 说话人区分 | 区分说话人的语音识别项目
04:26
whisper | 语音识别 | Openai Whisper | Whisepr GUI
08:22
语音合成速度最快的开源TTS | 基于MIT协议可商用的开源TTS | 这是我用过合成速度最快的开源TTS
15:33
多语种语音合成 | TTS
06:28
本地可运行的说话人拆分 | 说话人分离
03:37
语音分离|声纹对比|离线可用的语音分离|多个说话人分离|单声道录音说话人分离
02:32
开发一款web端智能聊天网站 | ASR | LLM | TTS
06:20
实时语音合成 | 流式语音合成 | 语音合成 | RealTime TTS
11:57
基于开源的openai whisper和LLM以及TTS开发的一款智能聊天机器人 | 网页智能聊天机器人 | 智能语音聊天机器人
03:04
智能聊天机器人网页端开发进度演示 | faster whisper | openai whisper | 大模型 | MeloTTS
05:03
开发一款在网页端可聊天的智能机器人项目演示只语音识别 | B站编程分享录分享开发一款网页端智能聊天机器人
01:27
基于大模型的智能聊天网页开发演示 | B站编程分享录 | Whisper | faster whisper | 大模型 | TTS
03:21
基于大模型的网页智能问答IM系统 | 基于大模型的智能问答系统
05:40
基于大模型的智能问答系统 | B站编程分享录开发的基于网页端的人机语音智能问答系统
01:15
基于大模型的智能语音交互问答系统 | B站编程分享录
02:50
内网离线环境中可用的智能语音交互大模型问答系统
12:29
纯内网运行的基于大模型的智能问答系统 | 内网中运行Whisper | 内网中运行大模型 | 内网中运行TTS
18:01
基于大模型的智能语音问答系统 | ASR_LLM_TTS | 网页端智能语音问答系统
19:06
记录在Linux中部署语音合成MeloTTS中遇到的问题以及对应的解决方法 | 语音合成 | TTS | MeloTTS
14:12
Linux中部署MeloTTS | TTS部署详细教程
01:23:12
训练MeloTTS模型详细教程 | TTS模型训练实录 | train TTS
02:57:22
验证训练后的MeloTTS模型 | TTS | 语音合成
18:31
TTS模型训练后的测试 | 语音合成模型训练 | MeloTTS
01:26
使用MeloTTS训练中文TTS模型 | MeloTTS训练中文语音合成模型 | MeloTTS模型训练 | 中文语音合成模型训练
02:39:15
训练中文MeloTTS模型演示 | 中文模型训练 | MeloTTS训练中文模型 | MeloTTS模型训练效果演示
06:37
使用派蒙语音训练的一个TTS中文语音合成模型 | MeloTTS训练中文模型效果演示 | MeloTTS中文模型 | MeloTTS
06:03
CosyVoice | 阿里开源TTS模型CosyVoice | TTS | 声音克隆 | 流式TTS
01:00
MeloTTS训练原神中派蒙的中文语音合成模型 | MeloTTS中文模型
04:29
MeloTTS训练派蒙中文语音合成模型成果演示
06:28
实时语音降噪 | 语音降噪
05:14
尝试一下3D-Speaker的说话人区分 | 通话录音区分说话人 | 说话人区分 | funasr | 3d-speaker | pyannote-audio
14:05
单轨录音区分说话人语音识别接口开发进度 | 单轨录音区分说话人语音识别 | 说话人区分 | 语音识别 | 声纹识别
21:44
视频音频中人物角色声音分离 | 人物角色声音分类 | 自动音视频切分
17:38
基于AI的说话人分离 | 自媒体声音分离 | 声音分类 | 语音识别 | 声纹识别 | 录音根据人物声音分离
13:23
AI大模型前后端分离智能问答系统
11:05
区分说话人语音识别
03:44
基于大模型的智能语音交互系统 | LLM | ASR | TTS | Whisper | MeloTTS
18:50
说话人分离 | 录音分离 | 区分不同说话人声音 | 声纹识别 | 录音拆分 | 单轨录音拆分说话人 | 语音识别 | FunASR
10:56
语音识别和声纹识别 | 通话录音区分说话人并转写录音 | 通话录音转写 | 语音转写
04:39
AI分离混杂音神器ClearerVoice | 阿里开源的处理两人对话中混合音频的分离难题
12:53
ClearerVoice语音分离和人声增强注意事项
17:05
阿里开源的ClearerVoice本地部署详细教程 | 语音分离与人声增强
49:04
新增视频切片功能 | 可根据视频中的不同说话人进行视频切片
08:31
和小动物一起蛇年大吉!
客服
顶部
赛事库 课堂 2021拜年纪