利用Python和API轻松实现:语音转文字,文字转语音
off999 2024-10-22 13:32 24 浏览 0 评论
利用Python和API轻松实现:语音转文字,文字转语音。
语音转文字(支持实时麦克风输入和从音频文件读入):
- 百度 API
- 科大讯飞 API
- SpeechRecognition (CMU PocketSphinx)
文字转语音:
- pyttsx3
Environment
- Python 3.6.7
- MacOS(以下环境配置方式均基于Mac系统,其他系统的配置方式可能会有一些不同)
Speech to Text
百度
在 https://cloud.baidu.com/product/speech 申请API。
文档:http://ai.baidu.com/docs#/ASR-API
Configuration
安装:
pip install baidu-aip在 speech_to_text_baidu() 中填入APPID、API_KEY、SECRET_KEY:
APP_ID = ""
API_KEY = ""
SECRET_KEY = ""(也可以直接使用REST API:Demo
Usage
from Speech_and_Text import speech_to_text_baidu
# 从文件读入
speech_to_text_baidu(audio_path = "path_of_audio", if_microphone = False)
# 从麦克风读入
speech_to_text_baidu(if_microphone = True)
科大讯飞
在 https://www.xfyun.cn/services/voicedictation 申请API。
文档:https://doc.xfyun.cn/rest_api/index.html
Configuration
在 speech_to_text_ifly() 填入 APPID、API_KEY:
URL = "http://api.xfyun.cn/v1/service/v1/iat"
APPID = ""
API_KEY = ""要在讯飞管理面板中添加调用方api,否则会报错。
Usage
from Speech_and_Text import speech_to_text_ifly
# 从文件读入
speech_to_text_ifly(audio_path = "path_of_audio", if_microphone = False)
# 从麦克风读入
speech_to_text_ifly(if_microphone = True)
SpeechRecognition
使用了Python的语音识别库 SpeechRecognition
源码:https://github.com/Uberi/speech_recognition
Configuration
SpeechRecognition
安装:
pip install SpeechRecognitionPyAudio
使用麦克风进行输入
主页:http://people.csail.mit.edu/hubert/pyaudio/
# Mac上的安装方式
xcode-select --install # 安装xcode, 已经装好的的话,执行的时候会提示
# 先用homebrew安装portaudio(pyaudio需要的库),否则会提示:'portaudio.h' file not found
brew remove portaudio # 先用homebrew卸载
brew install portaudio # 重新安装
sudo pip install pyaudio # 安装pyaudioReference: https://stackoverflow.com/questions/33851379/pyaudio-installation-on-mac-python-3
PocketSphinx
CMU Sphinx 是卡内基梅隆大学开发的开源语音识别引擎,可以离线工作,支持多种语言(包括中文)。
源码:https://github.com/cmusphinx
PocketSphinx 是 CMU Sphinx 的 Python 封装接口。
源码:https://github.com/cmusphinx/pocketsphinx-python
安装:
pip install PocketSphinx
添加中文语言包:
查看 SpeechRecognition 包的安装路径('/path'):
python -c "import speech_recognition as sr, os.path as p; print(p.dirname(sr.__file__))"然后下载并解压 Mandarin Chinese 语言包,把 zh-CN 文件夹放入 '/path/pocketsphinx-data' 中
Usage
from Speech_and_Text import speech_to_text_cmu
# 从文件读入
speech_to_text_cmu(audio_path = "path_of_audio", if_microphone = False)
# 从麦克风读入
speech_to_text_cmu(if_microphone = True)
Text to Speech
使用了Python的文字转语音库 pyttsx3
源码:https://github.com/nateshmbhat/pyttsx3
文档:https://pyttsx3.readthedocs.io
Configuration
pip install pyttsx3
pip install pyobjc # 依赖模块Usage
from Speech_and_Text import text_to_speech
# Example
text_to_speech(sentence = "人类的本质是复读机")源码下载地址:https://github.com/Renovamen/Speech-and-Text/archive/master.zip
相关推荐
-
- 打印机脱机无法打印怎么办(打印机脱机无法打印故障处理)
-
打印机脱机无法打印怎么办?在使用打印机的过程中,经常会遇到打印机无法打印的问题,如果你的打印机已经正常使用了一段时间,而是现在打印机无法打印了,那么很可能是你的打印机脱机了。我们该怎么办呢?首先我们拿到打印机,要把它的电源线,USB打印线与...
-
2025-11-12 03:51 off999
- 激活码怎么激活(激活码怎么激活steam)
-
首先,启动电脑,在键盘按下“Win+R”,然后“运行”程序。然后,在“运行”的对话框输入“regedit”,回车确定输入命令然后,在窗口的左侧菜单选择“HKEY_LOCAL_MACHINE\SOFTW...
- 电脑动不动就卡住不动怎么回事
-
可能出现卡死原因:1、病毒引起,使你的电脑检测通过的程序太多,CPU主频性能不能充分发挥出来。2、温度过高,散热不好,使CPU性能下降。3、内存条太小,内存缺陷。5、可能设置了开机后自动登陆太多,自动...
- 笔记本风扇声音大怎么办(笔记本风扇声音非常大)
-
1.清理笔记本风扇灰尘一般而言,新买来的风扇总是噪声较小,而使用一段时间后会明显变大。其实,灰尘是造成风扇噪音上升的重要原因之一,因为无孔不入的灰尘总能钻进不完全密闭的机箱。当CPU风扇高速旋转时,漩...
- 如何添加无线网络打印机(如何添加无线网络打印机连接)
-
要添加网络打印机,您可以按照以下步骤进行操作:1.确保网络设置:首先,请确保您的计算机和打印机都已连接到同一个局域网或无线网络中,并且网络连接正常。确保您已经知道网络打印...
- 戴尔电脑一键重装系统(戴尔怎么一键重装系统)
-
若您需要重装戴尔系统,可以按照以下步骤进行操作:首先备份重要数据,然后获取系统安装介质,可以是光盘或USB驱动器。接下来,进入BIOS设置,将启动顺序调整为从安装介质启动。重启电脑后,按照屏幕提示进行...
- 电脑ip地址配置异常怎么修复
-
如果您发现IP地址配置异常,可以按照以下步骤尝试解决:1.检查网络连接:首先检查计算机、路由器或交换机等设备的网线、电源和连接状态是否正常,并确保网络设备正确连接。2.确认IP地址:检查您的计算机...
- 怎么把win7电脑恢复出厂设置
-
1.首先我们打开电脑找到“计算机”点击打开。2.进入页面然后我们点击“Windows7(C:)”打开C盘。3.我们在C盘界面找到Windows7并点击打开。4.进入到Win7文件夹中找到并双击“Sys...
- ctrl c 和 ctrl v 怎么按(一键复制粘贴)
-
左手小指按Ctrl键,食指按C键或者V键具体在按Ctrl+C的时候,无名指放在Z键上,中指放在X键上,食指按C键如果你也用这种方式的话,可能和我一样,第一次按的时候不习惯手指这样去分工的感觉,但是你...
- 玩游戏cpu温度多少正常(玩游戏cpu温度多少正常 贴吧)
-
在游戏过程中,CPU温度的正常范围通常在40°C至80°C之间。然而,具体的正常温度取决于CPU型号、散热系统和环境条件等因素。一般来说,如果CPU温度超过80°C,就可能存在过热的风险,需要采取措施...
- idm下载器(如何卸载idm下载器)
-
截至2023年9月3日,IDM(InternetDownloadManager)是一款非常受欢迎的下载工具,但它并没有被禁用。IDM可以帮助用户更快速、稳定地下载文件,提供了多线程下载、断点续传等...
- 电脑按f8后无法开机,三个键搞定
-
电脑开机按F8没有反应可能有多种原因,以下是一些可能的解决方法:尝试重启电脑:有时候,系统会出现临时问题,重启可能有助于解决。检查键盘连接和状态:确保键盘连接正常,没有故障。如果在其他地方测试过键盘是...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
