遇到分割录音的问题,将录音文件转化为小小的分段,作为他用。主要是按照语音停顿进行分割。
准备工作
- 安装python
- 官网下载windows版本:https://www.python.org/downloads/windows/
- 32位基于网络安装版本Download Windows x86 web-based installer
- 32位安装版本Download Windows x86 executable installer
- 32位文件包Download Windows x86 embeddable zip file
- 64位基于网络安装版本Download Windows x86-64 web-based installer
- 64位基于网络安装版本Download Windows x86-64 executable installer
- 64位基于网络安装版本Download Windows x86-64 embeddable zip file
- 安装过程中有可能出现安装错误,可以尝试去掉every user选项
- 安装过程中选择pip插件
- 在windows系统中添加环境变量,path中添加python目录
- 安装pydub库
- 在cmd命令中执行
pip install pydub
- 在cmd命令中执行
- 安装ffmpeg插件
- 下载static版本https://ffmpeg.zeranoe.com/builds/
- 解压,将bin目录添加到环境变量
- 在cmd里执行
ffmpeg -version
就可以了查看版本信息了重要代码
基础代码
1
2
3
4
5from pydub.silence import split_on_silence
# 实现拆分,只要这一句代码就够了
chunks = split_on_silence(chunk,min_silence_len=700,silence_thresh=-70)
# 这里silence_thresh是认定小于-70dBFS以下的为silence,发现小于-70dBFS部分超过 700毫秒,就进行拆分。这样子分割成一段一段的。实现单段不超过60s切割
1 | from pydub import AudioSegment |
- 问题说明
- 出现问题,有可能是文件本身出现错误。
- 录音文件注意格式,转换函数需要修改
AudioSegment.from_wav
。 - 由于转换的是m4a格式的音频,直接使用有问题,将改为wav之后加载再进行。