对应模型的选择

然后就我个人使用而言,我发现实际上越轻量的模型

体验相对思考深度高的模型,体验感会更好。

或者说实际上深度思考模型的配置

反而会影响用户的体验。可能对于语音助手的功能,他可能会回答的更全面,但是说对于平常的语音输入,他实际上是 用轻量的模型比较好。

比如说我最近配置的 V4 Flash,它已经是轻量版了。但因为它的思考深度问题,导致我选择这个模型进行选择语音输入大模型的时候,它的语音输入都会很长时间,也就是思考时间会很长。

对应 OpenRoot 上的几个模型,我也进行了使用。有混元,还有 Gemma ,还有对应的千问。然后再就是 GPT 20S,最后发现千问的 Flash 模型输出会快很多。

而且它也有最基本的 skill 识别。因为我发现我使用 gemma 的时候,我的技能它是识别不了的。

也就是说需要平衡模型能力和思考时间,

要有基本的 skill 识别,他不需要太聪明,但是又不能太蠢,而且最重要的是他必须要输出快。不然会很影响使用体验。

而对应的,千问现在的模型,实际上它很多都进行了开源。那么我觉得,实际上是可以进行在闪电说里边的链接下载。而不是靠 ollama。

也就是说,既然语音识别服务商中有本地模型的配置,那为什么大模型服务商里面不添加一个本地大模型的配置?

所以对应的改进点,我觉得有以下两点:

一.希望官方能测试出能够平衡模型能力和思考时间,去筛选出用户体验最优的一系列模型。
二.

希望能添加一些官方认为轻量化,但是使用体验上佳的本地模型链接进行下载,并且对接闪电说。

Please authenticate to join the conversation.

Upvoters
Status

In Review

Board
💡

Feature Request

Date

6 days ago

Author

陈文斗

Subscribe to post

Get notified by email when there are changes.