接入云端语音模型教程

Written By smartmeng

Last updated 23 days ago

火山引擎

  1. 您已经看到需要填写 App ID 和 Access Token,这两个您暂时不用管,下一步会教您如何获取这两个东西。

  2. 打开字节的云服务火山引擎,点击这里:火山引擎官网,您会看到下面这个登录页面,然后正常使用手机进行登录注册就好了。

  3. 进入到官网之后,需要先走一个实名认证的流程,非常简单。

    先点击”前往实名认证”,再点击“微信/抖音扫脸认证”就可以了。字节的所有 API 开通都是需要实名认证的。这里认证过一次之后,以后就都非常方便了。

  4. 认证完成之后,再回到“豆包语音”。如果不知道怎么回去,点击这里:豆包语音。然后直接点击最中间的创建应用。

  5. 在创建应用里面,应用名称填“shandianshuo”(只支持英文),应用简介写“自己用“,接入能力选择:”豆包流式语音识别模型2.0 小时版“。点击右下角的“确定”,就把应用创建好了。

  6. 创建成功之后,您把这个创建应用的页面在右上角给叉掉。然后在左侧的 API 服务中心的菜单里面点到第一个”豆包流式语音识别模型 2.0”。就可以看到下面这个页面了,把这个页面滑到底部,您就能找到最开始我们在闪电说的配置里给您看的 App IDAccess Token(正常情况下是隐藏的,点击小眼睛可以打开) 。Access Token 是您的密码,一定要保存好,也不要告诉任何人。目前在字节火山引擎这个版本里面给您提供了 20 小时的免费额度,可以使用很久了。

  7. 回到闪电说 APP,把刚刚您获取的 App IDAccess Token 依次填进去。然后点击下方的运行速度测试,如果出结果了,就说明您的 API 接口是通的,有时候可能不稳定,您可以多点两次。但如果多次点击都不出结果的话,您可以看看之前的哪一步错了,如果确实不确定,可以来咨询我们。

  8. 最后您只需要在这个页面点击“设为默认模型”,您就已经获得了目前中文范围内,可以说是最好的语音转写体验。同样,阿里云的“qwen3-asr”模型也非常优秀,如果您感兴趣,可以自行设置体验。

  9. 最后我们回到模型界面检查一下,首先是语音识别模型已经更换为了”豆包流式”。其次,下方”火山引擎”的供应商栏有一个绿色小点,说明它运转正常。