刚刚改着我自己的代码,顺便去研究了一下Milla Jovovich 美女新做的这套系统当然!有些部分也启发了我一点但有些我真的……比如,她的 Readme 里写了一个已经比较乐观的口径: wake-up 大约 170 tokens,5 次搜索大约 13,500 tokens而且!她这个软件是强制先搜索再进入对话的!这是啥概念呢就算用 GPT-4o 级别模型,一次记忆调用(5 次搜索)也要 0.2-0.3 元人民币就是说,有可能,你才说了一句“昨天那个披萨挺好吃的”,这系统就框框往水里扔了两毛钱……这是什么 tokens 自由的富人玩法啊?!?!看了一下我设计的、同样是持久化记忆、但是记忆召回再注入成本是她的 1/200 的一套系统……我陷入了沉默 红烧小狮子头佑酱的日常 上海

