将录音和视频文件中的语音转换成文字