视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
Python语言实现百度语音识别功能的实例
2020-11-27 14:22:38 责编:小采
文档


未来的一段时间,人工智能在市场上占有很重的位置,Python语言则是研究人工智能的最佳编程语言,下面,就让我们来感受一下它的魅力吧!

百度给的样例程序,不论C还是Java版,都分为method1和method2两种,前者称为隐式(post的是json串,音频数据编码到json里),后者称为显式(post的就是音频数据)本文主要介绍了Python语言实现百度语音识别API的使用实例,具有一定借鉴价值,需要的朋友可以参考下,希望能帮助到大家。

一开始考虑到pythonwave包处理的都是“字符串”,担心跟C语言的数组不一致,所以选择低效但保险的method1,

即先将音频数据base编码,再加上采样率、通道数等信息汇集成dict,最后总体编码成json串

结果老是报:

3300输入参数不正确

先后试过urllib2和pycurl包,都是上面情况

不得已换用method2,成功(看来wave包对音频的存储并不是“字符串”)

#encoding=utf-8 
import wave 
import urllib, urllib2, pycurl 
import base 
import json 
## get access token by api key & secret key 
 
def get_token(): 
 apiKey = "xxxxxxxx" 
 secretKey = "xxxxxxxxx" 
 auth_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=" + apiKey + "&client_secret=" + secretKey; 
 res = urllib2.urlopen(auth_url) 
 json_data = res.read() 
 return json.loads(json_data)['access_token'] 
 
def dump_res(buf): 
 print buf 
## post audio to server 
def use_cloud(token): 
 fp = wave.open('vad_0.wav', 'rb') 
 nf = fp.getnframes() 
 f_len = nf * 2 
 audio_data = fp.readframes(nf) 
 
 cuid = "xxxxxxxxxx" #my xiaomi phone MAC 
 srv_url = 'http://vop.baidu.com/server_api' + '?cuid=' + cuid + '&token=' + token 
 http_header = [ 
 'Content-Type: audio/pcm; rate=8000', 
 'Content-Length: %d' % f_len 
 ] 
 c = pycurl.Curl() 
 c.setopt(pycurl.URL, str(srv_url)) #curl doesn't support unicode 
 #c.setopt(c.RETURNTRANSFER, 1) 
 c.setopt(c.HTTPHEADER, http_header) #must be list, not dict 
 c.setopt(c.POST, 1) 
 c.setopt(c.CONNECTTIMEOUT, 30) 
 c.setopt(c.TIMEOUT, 30) 
 c.setopt(c.WRITEFUNCTION, dump_res) 
 c.setopt(c.POSTFIELDS, audio_data) 
 c.setopt(c.POSTFIELDSIZE, f_len) 
 c.perform() #pycurl.perform() has no return val 
if __name__ == "__main__": 
 token = get_token() 
 use_cloud(token)

运行结果

{"corpus_no":"6150045491002357923","err_msg":"success.","err_no":0,"result":["播放小苹果,"],"sn":"243903724071431919050"}

下载本文
显示全文
专题