【优化建议】当豆包语音请求失败时,建议 fallback 到本地模型进行处理
【背景】有时候叽里呱啦说了一大堆,结果豆包语音请求失败了。非常沮丧,现在每次输入的时候都担心会不会成功? 【期望】 当投票召回失败的时候,fall back到本地模型进行处理。或者给一些重试上次录音的机制?让用户不再提心吊胆。 如果现在已有类似的机制,请忽略。 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 1 day ago
【优化建议】当豆包语音请求失败时,建议 fallback 到本地模型进行处理
【背景】有时候叽里呱啦说了一大堆,结果豆包语音请求失败了。非常沮丧,现在每次输入的时候都担心会不会成功? 【期望】 当投票召回失败的时候,fall back到本地模型进行处理。或者给一些重试上次录音的机制?让用户不再提心吊胆。 如果现在已有类似的机制,请忽略。 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 1 day ago
【优化建议】增加双击按钮进行语音输入功能
【问题】 我需要一只手举着麦克风,一只手按组合键。 但即使我把组合键放到一只手也能完成的按键上,有时候还要低头去看一下有没有按对。 会降低输入效率。 【期望】 可以类似macOS系统听写的快捷键一样,双击某个按键触发,单击或双击结束? 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 1 day ago
【优化建议】增加双击按钮进行语音输入功能
【问题】 我需要一只手举着麦克风,一只手按组合键。 但即使我把组合键放到一只手也能完成的按键上,有时候还要低头去看一下有没有按对。 会降低输入效率。 【期望】 可以类似macOS系统听写的快捷键一样,双击某个按键触发,单击或双击结束? 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 1 day ago
【优化建议】用户词典页面空白太多,查找效率较低,没有重复检测功能
【问题描述】 如题 【期望】 - 调整页面布局(没想好怎么改🤣),减少大面积空白,增加显示和查找效率 - 增加词语重复检测,不要出现相同的词语。(有时不记得有些词语有没有输入过,又没有查找手段,只好再重新输入一次) 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 1 day ago
【优化建议】用户词典页面空白太多,查找效率较低,没有重复检测功能
【问题描述】 如题 【期望】 - 调整页面布局(没想好怎么改🤣),减少大面积空白,增加显示和查找效率 - 增加词语重复检测,不要出现相同的词语。(有时不记得有些词语有没有输入过,又没有查找手段,只好再重新输入一次) 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 1 day ago
【优化建议】选中句子中间的文字后再输入,结果会自动带上句号,破坏了句型。希望能够优化
【问题描述】 选中句子中需要修改的那部分,再进行语音输入,完成之后会在结果后面加上句号,会破环句型。 示例:比如我要把「明天杭州的天气怎么样?」这句话中的「杭州的天气」改为「上海的天气」,那么我会用鼠标选中「杭州的天气」,然后语音输入「上海的天气」,结果会变成「明天上海的天气。怎么样?」 【期望】 - 能够根据修改的文字在句子中的位置自动调整标点符号 - 选中并修改「明天杭州的天气怎么样?」中的「杭州的天气」为「上海的天气」后,希望得到「明天上海的天气怎么样?」而不是「明天上海的天气。怎么样?」 - 选中并修改「明天杭州的天气怎么样?」中的「怎么样」为「如何」后,希望得到「明天杭州的天气如何?」而不是「明天杭州的天气如何??」 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 1 day ago
【优化建议】选中句子中间的文字后再输入,结果会自动带上句号,破坏了句型。希望能够优化
【问题描述】 选中句子中需要修改的那部分,再进行语音输入,完成之后会在结果后面加上句号,会破环句型。 示例:比如我要把「明天杭州的天气怎么样?」这句话中的「杭州的天气」改为「上海的天气」,那么我会用鼠标选中「杭州的天气」,然后语音输入「上海的天气」,结果会变成「明天上海的天气。怎么样?」 【期望】 - 能够根据修改的文字在句子中的位置自动调整标点符号 - 选中并修改「明天杭州的天气怎么样?」中的「杭州的天气」为「上海的天气」后,希望得到「明天上海的天气怎么样?」而不是「明天上海的天气。怎么样?」 - 选中并修改「明天杭州的天气怎么样?」中的「怎么样」为「如何」后,希望得到「明天杭州的天气如何?」而不是「明天杭州的天气如何??」 【测试环境】 闪电说v0.6.2 macOS M1 Max + 豆包语音模型

LiuChang 1 day ago
微信输入框输入长文本被自动分段发送
在使用闪电说向微信聊天输入框输入较长句子时,有时会被自动拆成多段后发出,只保留最后一段在输入框内,导致消息被误发送 设备:macbook pro 语音识别模型:豆包流式语音识别模型 2.0 大模型为 doubao-seed-2-0-lite-260215

gwenhuy11 1 day ago
微信输入框输入长文本被自动分段发送
在使用闪电说向微信聊天输入框输入较长句子时,有时会被自动拆成多段后发出,只保留最后一段在输入框内,导致消息被误发送 设备:macbook pro 语音识别模型:豆包流式语音识别模型 2.0 大模型为 doubao-seed-2-0-lite-260215

gwenhuy11 1 day ago
个性化偏好“去掉结尾最后一个句号”导致疑问句问号丢失
开启个性化偏好“去掉结尾最后一个句号”后,标点处理存在缺陷:部分疑问句会丢失句末问号,例如这条Case:“这是你的吗”。 当前使用官方推荐模型组合:语音识别为豆包流式语音识别模型 2.0,大模型为 doubao-seed-2-0-lite-260215。

gwenhuy11 1 day ago
个性化偏好“去掉结尾最后一个句号”导致疑问句问号丢失
开启个性化偏好“去掉结尾最后一个句号”后,标点处理存在缺陷:部分疑问句会丢失句末问号,例如这条Case:“这是你的吗”。 当前使用官方推荐模型组合:语音识别为豆包流式语音识别模型 2.0,大模型为 doubao-seed-2-0-lite-260215。

gwenhuy11 1 day ago
外接显示器时,在 macbook 内置显示器中输入,不展示正在语音输入的底部 UI
闪电说版本:MacOS Apple Silicon 0.62 复现环境 MacBook 外接显示器并将该显示器设置为主显示器(Main Display)。此时在 MacBook 内置显示器中输入。 steps 长按快捷键开启语音助手。 期待 看到正在语音输入的底部 UI 实际 没有任何。

Chen XI (xc1427) 2 days ago
外接显示器时,在 macbook 内置显示器中输入,不展示正在语音输入的底部 UI
闪电说版本:MacOS Apple Silicon 0.62 复现环境 MacBook 外接显示器并将该显示器设置为主显示器(Main Display)。此时在 MacBook 内置显示器中输入。 steps 长按快捷键开启语音助手。 期待 看到正在语音输入的底部 UI 实际 没有任何。

Chen XI (xc1427) 2 days ago
语音识别模型是不是也考虑可以自定义配置呢?
背景是我这边使用了原生支持的千问ASR,但填写了APIKey后,当晚就收到了千问的收费账单。然而据我了解,千问本身提供了免费的模型试用额度,只是需要配置类似0910这种日期的模型版本,但由于我们这边暂时不支持灵活配置,导致无法使用免费额度,必须直接付费,这种体验设计有些不合理。另外,如果能够支持接入多种ASR模型,我们也可以尝试接入其他厂商的API进行对比测试。

tyzzz 3 days ago
语音识别模型是不是也考虑可以自定义配置呢?
背景是我这边使用了原生支持的千问ASR,但填写了APIKey后,当晚就收到了千问的收费账单。然而据我了解,千问本身提供了免费的模型试用额度,只是需要配置类似0910这种日期的模型版本,但由于我们这边暂时不支持灵活配置,导致无法使用免费额度,必须直接付费,这种体验设计有些不合理。另外,如果能够支持接入多种ASR模型,我们也可以尝试接入其他厂商的API进行对比测试。

tyzzz 3 days ago
录音讲着讲着就没了。
因为没有看到小横条,所以说着说着的时候就不知道它已经停止收录了。比如说我说了四段话,但实际上它只录了三段话,我看不到录制状态。 所以我每次说话都有顾虑: 不敢说太长,而且这个长短似乎没有规律可循 不知道它的限额到底在哪,也就是说当我打开一次长时间的录音录制时,最多能录到哪?是几分钟?有没有相关的显示或者选项可以选择? 我现在的问题就是,当我说着说着,等到说完了,发现它出来的只有一半,我就已经忘记了我要说的话是什么了。 而且这样非常影响效率。

老杨 4 days ago
录音讲着讲着就没了。
因为没有看到小横条,所以说着说着的时候就不知道它已经停止收录了。比如说我说了四段话,但实际上它只录了三段话,我看不到录制状态。 所以我每次说话都有顾虑: 不敢说太长,而且这个长短似乎没有规律可循 不知道它的限额到底在哪,也就是说当我打开一次长时间的录音录制时,最多能录到哪?是几分钟?有没有相关的显示或者选项可以选择? 我现在的问题就是,当我说着说着,等到说完了,发现它出来的只有一半,我就已经忘记了我要说的话是什么了。 而且这样非常影响效率。

老杨 4 days ago