刷到微博大模型真有点意外,本来以为大模型都得靠堆参数烧钱,结果它15亿参数就干过

小西探车啊啊 2025-11-18 00:34:04

刷到微博大模型真有点意外,本来以为大模型都得靠堆参数烧钱,结果它15亿参数就干过了DeepSeek R1的数学能力,训练成本还不到同类的三十分之一。 对我来说,数学能力好用在日常太香了~比如算旅游人均花费、凑满减折扣,甚至帮我老妹检查口算题,不用再掏手机计算器反复核对,快不说,还准,也不用花钱买专门的工具。

0 阅读:0
小西探车啊啊

小西探车啊啊

感谢大家的关注