闪电说 V0.6 最佳实践(含保姆级教程)
闪电说 V0.6 在语音输入体验上正式追齐了第一梯队,在速度和准确上都有了显著提升。并新增语音助手和技能系统,让输入效率的提升远超4倍。
Written By smartmeng
Last updated 5 days ago
如何用闪电说获得最佳的语音输入体验?
我们先来看一下 V0.6 的最新效果展示。
语音输入实机演示( 不想听中间说话部分,可以直接拖到后面看输出结果 ):
语音助手实机演示( AI 一键回复群消息 ):
为了完整地使用上以上非常好用的语音输入体验,我们需要配置两个东西:
语音识别模型
具备视觉能力的 AI 大模型
下面的教程会一步步教大家进行完整的配置,非常详细,非常简单,很好操作,不用担心。
获得最佳语音输入体验的操作指南
就跟着下面这个指南一步一步的操作,一定能够搞定。 都是详细地拆到最细的步骤上了。
第一步:在闪电说内填入语音识别模型API
为了免费获得最快最准的语音识别体验。
打开闪电说 APP,点击左侧的模型,在语音识别服务商里面找到火山引擎,点击打开

打开之后,您会看到需要填写 App ID 和 Access Token,这两个您暂时不用管,下一步会教您如何获取这两个东西。

打开字节的云服务火山引擎,点击这里:火山引擎官网,您会看到下面这个登录页面,然后正常使用手机进行登录注册就好了。

进入到官网之后,需要先走一个实名认证的流程,非常简单。
先点击”前往实名认证”,再点击“微信/抖音扫脸认证”就可以了。字节的所有 API 开通都是需要实名认证的。这里认证过一次之后,以后就都非常方便了。


认证完成之后,再回到“豆包语音”。如果不知道怎么回去,点击这里:豆包语音。然后直接点击最中间的创建应用。

在创建应用里面,应用名称填“shandianshuo”(只支持英文),应用简介写“自己用“,接入能力选择:”豆包流式语音识别模型2.0 小时版“。点击右下角的“确定”,就把应用创建好了。

创建成功之后,您把这个创建应用的页面在右上角给叉掉。然后在左侧的 API 服务中心的菜单里面点到第一个”豆包流式语音识别模型 2.0”。就可以看到下面这个页面了,把这个页面滑到底部,您就能找到最开始我们在闪电说的配置里给您看的 App ID 和 Access Token(正常情况下是隐藏的,点击小眼睛可以打开) 。Access Token 是您的密码,一定要保存好,也不要告诉任何人。目前在字节火山引擎这个版本里面给您提供了 20 小时的免费额度,可以使用很久了。
注意:检查一下这里的应用名称是否是刚才设置的,因为是可以创建多个应用的
回到闪电说 APP,把刚刚您获取的 App ID 和 Access Token 依次填进去。然后点击下方的运行速度测试,如果出结果了,就说明您的 API 接口是通的,有时候可能不稳定,您可以多点两次。但如果多次点击都不出结果的话,您可以看看之前的哪一步错了,如果确实不确定,可以来咨询我们。

最后您只需要在这个页面点击“设为默认模型”,您就已经获得了目前中文范围内,可以说是最好的语音转写体验。同样,阿里云的“qwen3-asr”模型也非常优秀,如果您感兴趣,可以自行设置体验。

最后我们回到模型界面检查一下,首先是语音识别模型已经更换为了”豆包流式”。其次,下方”火山引擎”的供应商栏有一个绿色小点,说明它运转正常。

第二步:在闪电说内填入具备视觉能力的 AI 大模型 API
为了使用我们提供的 AI 输入技能和 AI 助手技能,获得完整的沟通 Agent 体验。
还是打开闪电说,然后在模型里面找到大模型服务商,然后选择火山引擎。

打开之后,您会看到需要填写 Access Token / API Key(这是一个东西,等会下面我们就会看到它了),API 地址已经填好了,您不用管。所以这回我们只用找一个东西就好了。

鉴于您刚刚已经进行了火山引擎的登录和实名认证的步骤,所以我这里直接引导你进入大模型的开通页面。打开字节火山引擎的 AI 开通页面,点击这里:火山方舟开通管理页面。

选择Doubao-Seed-2.0-lite,然后点击开通服务。

然后在开通服务的页面,为了方便以后更加简单易用,可以先点击”全选”,然后点击”自动开通新增模型”,最后点击”确定开通与授权”。这样不管以后就是需要用什么新模型,你都可以直接用了,就不用再做进一步的配置了。

然后在开通管理页面检查一下,看看这个模型是否已经开通成功。开通成功之后,操作那里会变成,会从”开通服务”变成”关闭服务”。如果出现意外情况没有开通服务,可以重新再走一遍刚刚那个流程。同时,字节提供了50万 token 的额度,也可以用很久了。

在”开通管理”下方有一个 “API Key 管理”,点击它。然后进到页面里面之后,点击”创建 API Key”。

点击之后,里面的信息都是默认填好的,直接点创建就可以了。

然后你就可以在,就是接下来这个页面里面去复制你的 API Key 了,还是点击小眼睛之后会出现密码和复制按钮。API Key 千万不要告诉别人,这个就是你的密码。

回到闪电说 APP,把刚刚获得的 API Key 填进去。先点击设为默认模型,把豆包 2.0 应用上。

检测之后,会出现一个通过的状态,说明 API Key 没有问题。

最后我们整体做一次检查,回到模型页面:
默认语音识别模型是”豆包流式语音识别模型2.0。”,默认的大模型是”Doubao-Seed-2.0-lite”
语音识别服务商火山引擎和大模型服务商火山引擎的小绿点都是亮着的。

达到上面这个状态,就完全配置完成了。