在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本

您是否厌倦了手动转录数小时的录音？您想节省时间并提高工作效率吗？然后，您会很高兴听到 OpenAI 用于语音到文本转换的新 Whisper API！借助这项尖端的 AI 技术，您现在可以在 Python 程序中轻松地将音频文件转换为文本。让我们在下面探讨这是如何工作的！

创建一个新文件python-whisper-api.py并通过插入以下 python 代码行开始：

import os
import openai
openai.api_key = "[INSERT YOUR OPENAI API KEY HERE]"
audio_file = open("sample.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
print(transcript.text)

上面的 Python 代码是如何使用 OpenAI 的 Whisper API 来使用 Python 转录音频文件的示例。以下是每一行代码的作用的细分：

import os：这会导入内置的 os 模块，它允许我们与操作系统交互并执行打开文件等任务。

import openai：这将导入openai模块，该模块提供对 OpenAI 的 API 的访问。如果您尚未在本地 Python 开发环境中安装该模块，则需要使用以下命令进行安装：pip install openai

openai.api_key = “[INSERT YOUR OPENAI API KEY HERE]”：这会设置 OpenAI API 的 API 密钥，这是进行 API 调用所必需的。

audio_file = open(“sample.mp3”, “rb”)：这将以读取二进制模式打开音频文件“sample.mp3”并将其分配给变量audio_file。

transcript = openai.Audio.transcribe(“whisper-1”, audio_file)：这是使用openai.Audio.transcribe()转录音频文件的方法。Screenpresso：强大的 Windows 屏幕捕获工具第一个参数是要使用的模型的名称（“whisper-1”），第二个参数是我们在第 4 步中打开的音频文件。该方法返回一个对象，我们将其分配transcribe()给Transcription变量transcript。

print(transcript.text)：这会打印出text转录的，可通过对象的文本属性访问Transcription。

总之，此代码使用 OpenAI Whisper API 转录音频文件并打印出生成的文本转录。

让我们运行应用程序

让我们通过输入以下命令来运行 Python 应用程序：

$ python python-whisper-api.py

您需要确保已将音频文件存储在名称为 sample.mp3 的同一文件夹中。然后您将收到由 Whisper 提供的文本抄本：

结论

OpenAI 的 Whisper API 为 Python 编程中的语音到文本转换开辟了一个充满可能性的世界。通过利用这项新技术，您可以通过自动化转录过程来提高工作效率并节省时间。无论您是记者、研究人员，还是需要定期处理音频内容的人，Whisper API 都可以成为您的武器库中的宝贵工具。凭借其令人印象深刻的准确性和易用性，Whisper API 有望在未来彻底改变我们处理音频内容的方式。那为什么还要等？立即开始探索 Whisper API，发现您可以使用这项突破性技术实现的所有令人惊奇的事情。

原文链接：https://blog.csdn.net/weixin_47967031/article/details/129656035

在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本

让我们运行应用程序

结论

相关推荐