核心观点: Nano banana2正式发布,我们认为核心突破在于引入类LLM思考链路,先理解语义与逻辑,再执行像素生成,从扩散式生成跃迁到推理驱动的视觉智能生成,更接近具备图像生成能力的推理引擎,重构未来图像模型范式。 Nano2的突破性进步在于: (1)世界理解能力【基于世界知识储备的推理式生成能力】:用户输入提示词后,模型会自主搜索知识,如物理规律、文献资料等。部分实例测试Nano2在数学解题、产品线路图生成、时间信息理解、经纬度信息还原场景等表现出色(见正文图)。我们判断可能系,架构中搭载Gemini 3 pro的推理模块,且内置生成前自行纠错的循环机制,可进行Search Grounding帮助生成准确性,充分发挥先进Google全模态模型优势,及搜索语料库的知识积淀。 (2)文字渲染大幅改善,中文能力提升,语义响应更精准:Nano2文本渲染能力全面突破,幻觉生成概率显著降低,透明、阴影、艺术字体等渲染精度提升,且中文能力极大优化,对于画面局部调整语义理解更为精准。 (3)画质清晰度提升至2K和4K级别,更能响应专业级产出,如UI原型快速生成、产品渲染、商业摄影、概念设计等。 我们观点是:底模能力为应用(用增)第一生产力,Gemini 3 Pro上线及NanoBanana 2集成,看好Gemini APP、及Google AI系列用增进一步上行。 投资建议与投资标的 (1)我们看好具有硬件-研究-模型-应用场景全栈AI路径的科技大厂,相关标的:阿里巴巴-W(09988,买入)、谷歌(ALPHABET)-A(GOOGL.O,未评级)。 (2)图像一致性对后端视频一致性保持有益,AI视频场景有望加速渗透。建议关注:快手-W(01024,买入)、美图公司(01357,买入)。 (3)重视其他具备模型能力的厂商及相关产业链,以及受益于底模能力迭代、下游应用场景体验改善,相关标的:腾讯控股(00700,买入)、同道猎聘(06100,未评级)、北森控股(09669,未评级)。
为什么感觉欧美AI比我们强?
【10评论】【3点赞】