把这两个结合起来很可能就是 deepseek v4 的雏形。 这种架构一旦跑通我们可能会看到模型在参数量暴涨的同时推理成本却能控制在极低的水平。 未来的大模型,可能是一个“小而精”的推理核心,外挂着. Deepseek r1 的定价是 ¥4 和 ¥16,就这也足以打得国外同级别模型找不着北了。 现在你跟我说,deepseek 在模型参数量级不变、推理能力不下滑的情况下,让价格重回 ¥2/¥3,我 xxxxx!. Subreddit for the deepseek coder language model
family of Travis Alexander 425/13 Jodi arias trial, Travis alexander