容器化部署 LongCat-Image
0.LongCat-Image 简介
Section titled “0.LongCat-Image 简介”LongCat-Image 是美团 LongCat 团队开源的一款新一代图像生成与编辑基础模型,主打高效、小参数与强中文能力。它在仅约 60 亿参数规模下,在文生图和图像编辑多项公开基准中达到或接近开源 SOTA 水平。
1 部署步骤
Section titled “1 部署步骤”我们提供了构建完毕的 LongCat-Image 镜像可以直接部署使用。
1.1 访问共绩算力控制台 https://console.suanli.cn,点击新增部署。
Section titled “1.1 访问共绩算力控制台 https://console.suanli.cn,点击新增部署。”
1.2 基于自身需要进行配置,参考配置为单卡 4090 和 1 个节点(初次使用进行调试)。
Section titled “1.2 基于自身需要进行配置,参考配置为单卡 4090 和 1 个节点(初次使用进行调试)。”
1.3 选择相应预制镜像
Section titled “1.3 选择相应预制镜像”
1.4 点击部署服务,耐心等待节点拉取镜像并启动。
Section titled “1.4 点击部署服务,耐心等待节点拉取镜像并启动。”
1.5 节点启动后,你所在“任务详情页”中看到的内容可能如下:
Section titled “1.5 节点启动后,你所在“任务详情页”中看到的内容可能如下:”
1.6 我们可以点击快速访问下方“7891”端口的链接,测试 Gradio 运行情况
Section titled “1.6 我们可以点击快速访问下方“7891”端口的链接,测试 Gradio 运行情况”2 Gradio 效果测试
Section titled “2 Gradio 效果测试”2.1 LongCat-Image 文生图
Section titled “2.1 LongCat-Image 文生图”打开链接后默认为「文生图」部分:
接下来填写 prompt,可根据自身需要填充对应参数,然后点击生成按钮,耐心稍等片刻 10s - 20s 后显示生成结构:
2.2 LongCat-Image-Edit 图片编辑
Section titled “2.2 LongCat-Image-Edit 图片编辑”在左上角的 tab 中选择「图像编辑」,点击或者拖拽图片上传后添加提示词以及对应参数,点击「开始生成」后等待结果即可:
2.3 保存/放大图片
Section titled “2.3 保存/放大图片”如果我们需要保存/放大该图片,可以单击图片后在右上角选择下载或者全屏:
3 API 调用测试
Section titled “3 API 调用测试”Gradio 页面右下角点击「Use via API」可以查看完整调用示例:
调用接口有
/generate_t2i/exchange_width_height/scale_resolution_1_5/stop_generate/generate_edit/stop_generate_1
效果测试
from gradio_client import Client
client = Client("https://deployment-8728-wzvka8i5-7891.550w.link/")result = client.predict( prompt="A photo of a cat", negative_prompt="", width=1024, height=1024, num_inference_steps=28, batch_images=1, seed_param=-1, api_name="/generate_t2i")print(result)
可以看到文件已经保存在本地,直接 open 即可看到:
open "/private/var/folders/8r/xj_b9xgx1fn54j87jwrdtk6c0000gn/T/gradio/ab0c989247e6f74d8c54e5b957b3afe679009fbbc042e46662ebc785ec49637a/image.webp"