然后就我个人使用而言,我发现实际上越轻量的模型
体验相对思考深度高的模型,体验感会更好。
或者说实际上深度思考模型的配置
反而会影响用户的体验。可能对于语音助手的功能,他可能会回答的更全面,但是说对于平常的语音输入,他实际上是 用轻量的模型比较好。
比如说我最近配置的 V4 Flash,它已经是轻量版了。但因为它的思考深度问题,导致我选择这个模型进行选择语音输入大模型的时候,它的语音输入都会很长时间,也就是思考时间会很长。
对应 OpenRoot 上的几个模型,我也进行了使用。有混元,还有 Gemma ,还有对应的千问。然后再就是 GPT 20S,最后发现千问的 Flash 模型输出会快很多。
而且它也有最基本的 skill 识别。因为我发现我使用 gemma 的时候,我的技能它是识别不了的。
也就是说需要平衡模型能力和思考时间,
要有基本的 skill 识别,他不需要太聪明,但是又不能太蠢,而且最重要的是他必须要输出快。不然会很影响使用体验。
而对应的,千问现在的模型,实际上它很多都进行了开源。那么我觉得,实际上是可以进行在闪电说里边的链接下载。而不是靠 ollama。
也就是说,既然语音识别服务商中有本地模型的配置,那为什么大模型服务商里面不添加一个本地大模型的配置?
所以对应的改进点,我觉得有以下两点:
一.希望官方能测试出能够平衡模型能力和思考时间,去筛选出用户体验最优的一系列模型。
二.
希望能添加一些官方认为轻量化,但是使用体验上佳的本地模型链接进行下载,并且对接闪电说。
Please authenticate to join the conversation.
In Review
Feature Request
27 days ago

陈文斗
Get notified by email when there are changes.
In Review
Feature Request
27 days ago

陈文斗
Get notified by email when there are changes.