接入云端语音模型教程

Written By smartmeng

Last updated 2 months ago

火山引擎

您已经看到需要填写 App ID 和 Access Token，这两个您暂时不用管，下一步会教您如何获取这两个东西。
打开字节的云服务火山引擎，点击这里：火山引擎官网，您会看到下面这个登录页面，然后正常使用手机进行登录注册就好了。
进入到官网之后，需要先走一个实名认证的流程，非常简单。
先点击”前往实名认证”，再点击“微信/抖音扫脸认证”就可以了。字节的所有 API 开通都是需要实名认证的。这里认证过一次之后，以后就都非常方便了。
认证完成之后，再回到“豆包语音”。如果不知道怎么回去，点击这里：豆包语音。然后直接点击最中间的创建应用。
在创建应用里面，应用名称填“shandianshuo”(只支持英文)，应用简介写“自己用“，接入能力选择：”豆包流式语音识别模型2.0 小时版“。点击右下角的“确定”，就把应用创建好了。
创建成功之后，您把这个创建应用的页面在右上角给叉掉。然后在左侧的 API 服务中心的菜单里面点到第一个”豆包流式语音识别模型 2.0”。就可以看到下面这个页面了,把这个页面滑到底部，您就能找到最开始我们在闪电说的配置里给您看的 App ID 和 Access Token（正常情况下是隐藏的，点击小眼睛可以打开）。Access Token 是您的密码，一定要保存好，也不要告诉任何人。目前在字节火山引擎这个版本里面给您提供了 20 小时的免费额度，可以使用很久了。
回到闪电说 APP，把刚刚您获取的 App ID 和 Access Token 依次填进去。然后点击下方的运行速度测试，如果出结果了，就说明您的 API 接口是通的，有时候可能不稳定，您可以多点两次。但如果多次点击都不出结果的话，您可以看看之前的哪一步错了，如果确实不确定，可以来咨询我们。
最后您只需要在这个页面点击“设为默认模型”，您就已经获得了目前中文范围内，可以说是最好的语音转写体验。同样，阿里云的“qwen3-asr”模型也非常优秀，如果您感兴趣，可以自行设置体验。
最后我们回到模型界面检查一下，首先是语音识别模型已经更换为了”豆包流式”。其次，下方”火山引擎”的供应商栏有一个绿色小点，说明它运转正常。