万益资讯网

没有发布会、满屏的宣传稿。Anthropic 这家公司就是这样,闷头做事,做完了

没有发布会、满屏的宣传稿。Anthropic 这家公司就是这样,闷头做事,做完了轻飘飘发个推送就完事了。

说说我摸到的一些变化。

编码更猛了。4.6 在 SWE-bench 上已经 80.8%,你让它写个项目基本不会掉链子。4.7 在这上面又往上顶了一截,尤其是那种七拐八绕、要走好多步才能完成的任务。

它能一路跟着你走到底,不跑偏,也不会走到一半把你最开始说的东西忘掉。

看图这块是真的惊到我了。以前传张高清图过去,糊成一片,细节全没了。现在最长边能到 2576 像素,差不多 375 万像素,等于以前的三倍多。截图、设计稿、手写笔记,它都能看清楚。做设计的、做产品的朋友应该会很爽。

推理多了一档叫「xhigh」,卡在 high 和 max 之间。以前就是要么随便想想,要么火力全开,现在中间多了一档刚刚好的。

价格没动,5 刀/25 刀每百万 token,跟 4.6 一样。

说点真心话吧。

我现在其实形容不出来我用它的感受。是它太强了,强到我聊两句根本测不出来什么。这种模型你得让它真的去跑点活儿,写代码、做分析、处理复杂的东西,跑着跑着你才会突然「哦」一下,感觉到一些东西。

单靠聊天是试不出深浅的。我得再多折腾几天,有了具体的感受再回来跟你们讲。

先留个坑在这儿。