对应模型的选择

然后就我个人使用而言，我发现实际上越轻量的模型

体验相对思考深度高的模型，体验感会更好。

或者说实际上深度思考模型的配置

反而会影响用户的体验。可能对于语音助手的功能，他可能会回答的更全面，但是说对于平常的语音输入，他实际上是用轻量的模型比较好。

比如说我最近配置的 V4 Flash，它已经是轻量版了。但因为它的思考深度问题，导致我选择这个模型进行选择语音输入大模型的时候，它的语音输入都会很长时间，也就是思考时间会很长。

对应 OpenRoot 上的几个模型，我也进行了使用。有混元，还有 Gemma ，还有对应的千问。然后再就是 GPT 20S，最后发现千问的 Flash 模型输出会快很多。

而且它也有最基本的 skill 识别。因为我发现我使用 gemma 的时候，我的技能它是识别不了的。

也就是说需要平衡模型能力和思考时间,

要有基本的 skill 识别，他不需要太聪明，但是又不能太蠢，而且最重要的是他必须要输出快。不然会很影响使用体验。

而对应的，千问现在的模型，实际上它很多都进行了开源。那么我觉得，实际上是可以进行在闪电说里边的链接下载。而不是靠 ollama。

也就是说，既然语音识别服务商中有本地模型的配置，那为什么大模型服务商里面不添加一个本地大模型的配置？

所以对应的改进点，我觉得有以下两点:

一.希望官方能测试出能够平衡模型能力和思考时间,去筛选出用户体验最优的一系列模型。
二.

希望能添加一些官方认为轻量化，但是使用体验上佳的本地模型链接进行下载，并且对接闪电说。

闪电说