【优化建议】当豆包语音请求失败时,建议 fallback 到本地模型进行处理
【背景】有时候叽里呱啦说了一大堆,结果豆包语音请求失败了。非常沮丧,现在每次输入的时候都担心会不会成功? 【期望】 当投票召回失败的时候,fall back到本地模型进行处理。或者给一些重试上次录音的机制?让用户不再提心吊胆。 如果现在已有类似的机制,请忽略。 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 2 days ago
【优化建议】当豆包语音请求失败时,建议 fallback 到本地模型进行处理
【背景】有时候叽里呱啦说了一大堆,结果豆包语音请求失败了。非常沮丧,现在每次输入的时候都担心会不会成功? 【期望】 当投票召回失败的时候,fall back到本地模型进行处理。或者给一些重试上次录音的机制?让用户不再提心吊胆。 如果现在已有类似的机制,请忽略。 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 2 days ago
【优化建议】增加双击按钮进行语音输入功能
【问题】 我需要一只手举着麦克风,一只手按组合键。 但即使我把组合键放到一只手也能完成的按键上,有时候还要低头去看一下有没有按对。 会降低输入效率。 【期望】 可以类似macOS系统听写的快捷键一样,双击某个按键触发,单击或双击结束? 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 2 days ago
【优化建议】增加双击按钮进行语音输入功能
【问题】 我需要一只手举着麦克风,一只手按组合键。 但即使我把组合键放到一只手也能完成的按键上,有时候还要低头去看一下有没有按对。 会降低输入效率。 【期望】 可以类似macOS系统听写的快捷键一样,双击某个按键触发,单击或双击结束? 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 2 days ago
【优化建议】用户词典页面空白太多,查找效率较低,没有重复检测功能
【问题描述】 如题 【期望】 - 调整页面布局(没想好怎么改🤣),减少大面积空白,增加显示和查找效率 - 增加词语重复检测,不要出现相同的词语。(有时不记得有些词语有没有输入过,又没有查找手段,只好再重新输入一次) 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 2 days ago
【优化建议】用户词典页面空白太多,查找效率较低,没有重复检测功能
【问题描述】 如题 【期望】 - 调整页面布局(没想好怎么改🤣),减少大面积空白,增加显示和查找效率 - 增加词语重复检测,不要出现相同的词语。(有时不记得有些词语有没有输入过,又没有查找手段,只好再重新输入一次) 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 2 days ago
【优化建议】选中句子中间的文字后再输入,结果会自动带上句号,破坏了句型。希望能够优化
【问题描述】 选中句子中需要修改的那部分,再进行语音输入,完成之后会在结果后面加上句号,会破环句型。 示例:比如我要把「明天杭州的天气怎么样?」这句话中的「杭州的天气」改为「上海的天气」,那么我会用鼠标选中「杭州的天气」,然后语音输入「上海的天气」,结果会变成「明天上海的天气。怎么样?」 【期望】 - 能够根据修改的文字在句子中的位置自动调整标点符号 - 选中并修改「明天杭州的天气怎么样?」中的「杭州的天气」为「上海的天气」后,希望得到「明天上海的天气怎么样?」而不是「明天上海的天气。怎么样?」 - 选中并修改「明天杭州的天气怎么样?」中的「怎么样」为「如何」后,希望得到「明天杭州的天气如何?」而不是「明天杭州的天气如何??」 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 2 days ago
【优化建议】选中句子中间的文字后再输入,结果会自动带上句号,破坏了句型。希望能够优化
【问题描述】 选中句子中需要修改的那部分,再进行语音输入,完成之后会在结果后面加上句号,会破环句型。 示例:比如我要把「明天杭州的天气怎么样?」这句话中的「杭州的天气」改为「上海的天气」,那么我会用鼠标选中「杭州的天气」,然后语音输入「上海的天气」,结果会变成「明天上海的天气。怎么样?」 【期望】 - 能够根据修改的文字在句子中的位置自动调整标点符号 - 选中并修改「明天杭州的天气怎么样?」中的「杭州的天气」为「上海的天气」后,希望得到「明天上海的天气怎么样?」而不是「明天上海的天气。怎么样?」 - 选中并修改「明天杭州的天气怎么样?」中的「怎么样」为「如何」后,希望得到「明天杭州的天气如何?」而不是「明天杭州的天气如何??」 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 2 days ago
微信输入框输入长文本被自动分段发送
在使用闪电说向微信聊天输入框输入较长句子时,有时会被自动拆成多段后发出,只保留最后一段在输入框内,导致消息被误发送 设备:macbook pro 语音识别模型:豆包流式语音识别模型 2.0 大模型为 doubao-seed-2-0-lite-260215

gwenhuy11 2 days ago
微信输入框输入长文本被自动分段发送
在使用闪电说向微信聊天输入框输入较长句子时,有时会被自动拆成多段后发出,只保留最后一段在输入框内,导致消息被误发送 设备:macbook pro 语音识别模型:豆包流式语音识别模型 2.0 大模型为 doubao-seed-2-0-lite-260215

gwenhuy11 2 days ago
个性化偏好“去掉结尾最后一个句号”导致疑问句问号丢失
开启个性化偏好“去掉结尾最后一个句号”后,标点处理存在缺陷:部分疑问句会丢失句末问号,例如这条Case:“这是你的吗”。 当前使用官方推荐模型组合:语音识别为豆包流式语音识别模型 2.0,大模型为 doubao-seed-2-0-lite-260215。

gwenhuy11 2 days ago
个性化偏好“去掉结尾最后一个句号”导致疑问句问号丢失
开启个性化偏好“去掉结尾最后一个句号”后,标点处理存在缺陷:部分疑问句会丢失句末问号,例如这条Case:“这是你的吗”。 当前使用官方推荐模型组合:语音识别为豆包流式语音识别模型 2.0,大模型为 doubao-seed-2-0-lite-260215。

gwenhuy11 2 days ago
外接显示器时,在 macbook 内置显示器中输入,不展示正在语音输入的底部 UI
闪电说版本:MacOS Apple Silicon 0.62 复现环境 MacBook 外接显示器并将该显示器设置为主显示器(Main Display)。此时在 MacBook 内置显示器中输入。 steps 长按快捷键开启语音助手。 期待 看到正在语音输入的底部 UI 实际 没有任何。

Chen XI (xc1427) 2 days ago
外接显示器时,在 macbook 内置显示器中输入,不展示正在语音输入的底部 UI
闪电说版本:MacOS Apple Silicon 0.62 复现环境 MacBook 外接显示器并将该显示器设置为主显示器(Main Display)。此时在 MacBook 内置显示器中输入。 steps 长按快捷键开启语音助手。 期待 看到正在语音输入的底部 UI 实际 没有任何。

Chen XI (xc1427) 2 days ago
语音识别模型是不是也考虑可以自定义配置呢?
背景是我这边使用了原生支持的千问ASR,但填写了APIKey后,当晚就收到了千问的收费账单。然而据我了解,千问本身提供了免费的模型试用额度,只是需要配置类似0910这种日期的模型版本,但由于我们这边暂时不支持灵活配置,导致无法使用免费额度,必须直接付费,这种体验设计有些不合理。另外,如果能够支持接入多种ASR模型,我们也可以尝试接入其他厂商的API进行对比测试。

tyzzz 3 days ago
语音识别模型是不是也考虑可以自定义配置呢?
背景是我这边使用了原生支持的千问ASR,但填写了APIKey后,当晚就收到了千问的收费账单。然而据我了解,千问本身提供了免费的模型试用额度,只是需要配置类似0910这种日期的模型版本,但由于我们这边暂时不支持灵活配置,导致无法使用免费额度,必须直接付费,这种体验设计有些不合理。另外,如果能够支持接入多种ASR模型,我们也可以尝试接入其他厂商的API进行对比测试。

tyzzz 3 days ago