whisper实时转录
introduce
这是一个本地的语音识别模型
强无敌
官网介绍:Introducing Whisper
openAI官方的python版本安装
github仓库链接:whisper
- 使用anaconda
- 在anaconda环境中安装cuda(请耐心等待解压)
1
2# 安装CUDA
conda install cudatoolkit=11.6 # 指定版本 - pytorch
请到它的官网选择下载对应的你的cuda的版本 - 安装ffmpeg
1
conda install ffmpeg
- 运行安装其他依赖库
1
pip install git+https://github.com/openai/whisper.git
- enjoy it!(模型会在运行时下载)
具体使用方法见github,下面是一个示例1
whisper "3.3 Task 19 Gauss.mp3" --model base
cpp实现
TODO:
whisper实时转录
http://blog.1314171.xyz/post/221018whisper.html