#DeepSeekV31 有一點比 #Qwen3 做得好,它沒有reasoning的chat模型可以做到有少許類似快速思考的效果,有一點點像是用reasoning模型但只分配了少許reasoning tokens,它沒reasoning的過程但回答時會有少許類似思考的過程,如果是直接比較沒有reasoning的Qwen3 235B A22B 和DeepSeek V3.1 chat,可能DeepSeek會更聰明。
平時都用Reasoning的Qwen3,原來沒reasoning的Qwen3和DeepSeekV3.1一樣在回答中會有少許思考過程 😂
GLM則沒有的,其他應該都沒有,沒仔細考證。