Skip to content
共绩算力文档中心

容器化部署 LongCat-Image

LongCat-Image 是美团 LongCat 团队开源的一款新一代图像生成与编辑基础模型,主打高效、小参数与强中文能力。它在仅约 60 亿参数规模下,在文生图和图像编辑多项公开基准中达到或接近开源 SOTA 水平。

我们提供了构建完毕的 LongCat-Image 镜像可以直接部署使用。

1.2 基于自身需要进行配置,参考配置为单卡 4090 和 1 个节点(初次使用进行调试)。

Section titled “1.2 基于自身需要进行配置,参考配置为单卡 4090 和 1 个节点(初次使用进行调试)。”

1.4 点击部署服务,耐心等待节点拉取镜像并启动。

Section titled “1.4 点击部署服务,耐心等待节点拉取镜像并启动。”

1.5 节点启动后,你所在“任务详情页”中看到的内容可能如下:

Section titled “1.5 节点启动后,你所在“任务详情页”中看到的内容可能如下:”

1.6 我们可以点击快速访问下方“7891”端口的链接,测试 Gradio 运行情况

Section titled “1.6 我们可以点击快速访问下方“7891”端口的链接,测试 Gradio 运行情况”

打开链接后默认为「文生图」部分:

接下来填写 prompt,可根据自身需要填充对应参数,然后点击生成按钮,耐心稍等片刻 10s - 20s 后显示生成结构:

在左上角的 tab 中选择「图像编辑」,点击或者拖拽图片上传后添加提示词以及对应参数,点击「开始生成」后等待结果即可:

如果我们需要保存/放大该图片,可以单击图片后在右上角选择下载或者全屏:

Gradio 页面右下角点击「Use via API」可以查看完整调用示例:

调用接口有

  • /generate_t2i
  • /exchange_width_height
  • /scale_resolution_1_5
  • /stop_generate
  • /generate_edit
  • /stop_generate_1

效果测试

from gradio_client import Client
client = Client("https://deployment-8728-wzvka8i5-7891.550w.link/")
result = client.predict(
prompt="A photo of a cat",
negative_prompt="",
width=1024,
height=1024,
num_inference_steps=28,
batch_images=1,
seed_param=-1,
api_name="/generate_t2i"
)
print(result)

可以看到文件已经保存在本地,直接 open 即可看到:

open "/private/var/folders/8r/xj_b9xgx1fn54j87jwrdtk6c0000gn/T/gradio/ab0c989247e6f74d8c54e5b957b3afe679009fbbc042e46662ebc785ec49637a/image.webp"