最近我在 GitHub 上发现了一个让我眼前一亮的项目——Nano-Bananary,这个名字就很有趣,叫”香蕉超市”。作为一个经常折腾 AI 图像生成的人,我见过太多需要复杂提示词的工具,但这个项目真的让我有种”终于等到你”的感觉。

让我先说说我为什么会被它吸引。大家都知道 AI 图像生成通常需要写很长的提示词,而且效果往往不如预期。但 Nano-Bananary 的厉害之处就在于,它完全不需要你写提示词,只需要选择用法、上传图片、点击生成,就能得到各种有趣的效果。这种”丝滑衔接”的体验让我想起了第一次用 iPhone 的感觉。

我花了一个下午的时间来体验这个工具,整个过程让我印象特别深刻。首先,它的界面设计很简洁,黑橙配色看起来很专业,而且操作逻辑非常直观。你只需要选择你想要的效果类型,上传一张图片,然后点击生成按钮,就能得到结果。最让我惊喜的是,每次输出的图像都能直接作为输入进行下一次编辑或生成,这种连续编辑的能力真的很强大。
我试了一个简单的图像风格转换。上传了一张风景照片,选择了”艺术风格”选项,几秒钟后就得到了一张很有油画感的图片。然后我又把这张生成的图片作为输入,选择了”动漫风格”,结果又得到了一张完全不同的动漫风格图片。整个过程就像在玩一个图像处理的游戏,每次都有新的惊喜。
最让我兴奋的是它的局部涂选功能。你可以选择图片的特定区域进行编辑,而不是整张图片。我试了一张人像照片,只选择了背景部分,然后应用了”梦幻背景”效果,结果背景变成了很梦幻的星空,而人物部分完全没有变化。这种精确控制的能力让我觉得这个工具真的很专业。


Nano-Bananary 还支持历史记录功能,这让我觉得特别贴心。每次生成的图像都会保存在历史记录中,你可以随时回到之前的版本,或者直接使用之前的图像作为新的输入。这种设计让整个创作过程变得很有连续性,不会因为一次操作失误就前功尽弃。
让我特别想分享的是它的对比功能。你可以把原图和生成后的图片放在一起对比,有横置对比和滑块对比两种模式。横置对比特别适合发社交媒体,而滑块对比则能让你更清楚地看到每个细节的变化。这种设计让整个创作过程变得很透明,你能清楚地知道 AI 对图片做了什么改变。
在体验过程中,我发现它的自定义提示词模块也很实用。虽然主打”无需提示词”,但如果你有特殊需求,还是可以添加自定义的提示词。这种灵活性让我觉得这个工具既适合新手,也适合有经验的用户。

让我特别想分享的是它的放大预览功能。生成的图像可以放大查看细节,这对于需要高质量输出的场景特别有用。而且你可以直接下载对比图,方便直接发到社交媒体上分享。
我在使用过程中也遇到了一些小问题,比如某些复杂的效果生成时间会比较长,但这些都是可以理解的技术限制。而且项目在 GitHub 上有 436 个星标,说明已经有不少人在关注和使用。
最让我觉得这个项目有潜力的是它的技术架构。项目基于 TypeScript 和 Vite 构建,代码结构很清晰,而且支持本地部署。如果你有自己的 Gemini API 密钥,完全可以搭建一个自己的版本。这种开源精神让我觉得这个项目很有价值。
作为一个经常需要处理图像内容的人,Nano-Bananary 真的解决了我很多痛点。以前我需要花很多时间写提示词,现在只需要点几下就能得到想要的效果。而且它的连续编辑能力让整个创作过程变得很有趣味性,就像在玩一个创意游戏。
如果你也对 AI 图像生成和创意设计感兴趣,我强烈推荐你试试 Nano-Bananary。它不仅能让你体验到 AI 图像生成的乐趣,更重要的是,它让复杂的图像处理变得触手可及。在这个 AI 快速发展的时代,像 Nano-Bananary 这样真正解决实际问题的工具,才是我们最需要的。
项目地址:https://github.com/ZHO-ZHO-ZHO/Nano-Bananary
在线体验:https://ai.studio/apps/drive/1JknFrFFdiOm7FIA8MLOJa%5FvtJN2g24c1

如果你正在为大模型训练、推理或 AIGC 应用寻找“便宜、随取随用、还能秒级扩容”的算力,共绩算力几乎是目前最具性价比的国内选择。平台把散户与机房的闲置 GPU 统一池化,用 Serverless 方式按秒计费,无需运维、无需包月,就能把 4090、L40、A100 等算力像自来水一样拧开即用。再加上预置的 ComfyUI、Stable Diffusion、FastAPI 等镜像和 99.9% SLA,开发成本直接腰斩,冷启动却不到 30 秒。注册就送算力券,首充再返 20%,强烈建议先把券领了跑一轮模型,体验“半价算力”的快乐——用一次,基本就回不去了。