Qwen 图像格式(Image)¶
📝 简介¶
给定文本提示,模型将生成新的图片。Qwen/Alibaba Cloud 提供强大的图像生成和编辑模型,可以根据自然语言描述创建图像或编辑现有图像。
🤖 支持的模型¶
目前支持的模型包括:
| 模型 | 描述 |
|---|---|
| qwen-image-plus | Qwen 图像生成模型,支持根据文本提示生成高质量图像 |
| wan2.5-t2i-preview | Wan 2.5 文本到图像预览模型 |
| qwen-image-edit-plus | Qwen 图像编辑模型,支持基于输入图像和文本提示进行图像编辑 |
| qwen-image-edit | Qwen 图像编辑模型 |
| wan2.5-i2i-preview | Wan 2.5 图像到图像预览模型 |
💡 请求示例¶
创建图片 ✅¶
# 基础图片生成
curl "https://computevault.unodetech.xyz/v1/images/generations" \
-H 'Content-Type: application/json' \
-H "Authorization: Bearer $API_KEY" \
-X POST \
-d '{
"model": "qwen-image",
"prompt": "给我一个猫的图片",
"n": 1,
"size": "1328*1328"
}'
响应示例:
{
"created": 1234567890,
"data": [
{
"url": "https://example.com/image.png",
"b64_json": "..."
}
]
}
编辑图片 ✅¶
# 图片编辑(使用 multipart form)
curl -X POST "https://computevault.unodetech.xyz/v1/images/edits" \
-H "Authorization: Bearer $API_KEY" \
-F "image=@hand-statue.png" \
-F "model=qwen-image-edit" \
-F "prompt=The broken remains of the hand-shaped statue, with all parts above the wrist missing. These broken pieces are jutting out of the water surrounding the statue."
响应示例:
{
"created": 1234567890,
"data": [
{
"url": "https://example.com/edited-image.png",
"b64_json": "..."
}
]
}
📮 请求¶
端点¶
创建图片¶
根据文本提示创建图片。支持 qwen-image* 和 wan2.*-t2i* 模型。
编辑图片¶
基于输入图像和文本提示编辑或生成新图片。支持 qwen-image-edit*、wan2.5-i2i-preview 和 wanx2.1-imageedit 模型。图像数据通过 multipart form 请求提供。
鉴权方法¶
在请求头中包含 API 密钥:
其中 $API_KEY 是您的 API 密钥。
请求体参数¶
文本到图像生成(/v1/images/generations)¶
| 参数 | 类型 | 必需 | 描述 |
|---|---|---|---|
model |
字符串 | 是 | 模型名称,如 "qwen-image" 或 "wan2.-t2i" |
prompt |
字符串 | 是 | 期望生成图片的文本描述 |
n |
整数 | 否 | 生成图片数量,固定为 1 |
size |
字符串 | 否 | 图片分辨率,格式为 width*height。默认值为 1328*1328。可选值及其对应的宽高比: - "1664*928" (16:9)- "1472*1140" (4:3)- "1328*1328" (1:1,默认)- "1140*1472" (3:4)- "928*1664" (9:16) |
response_format |
字符串 | 否 | 响应格式,"url" 或 "b64_json" |
prompt¶
- 类型:字符串
- 必需:是
- 说明:期望生成图片的文本描述。
- 提示:
- 使用具体和详细的描述
- 包含关键的视觉元素
- 指定期望的艺术风格
- 描述构图和视角
图像编辑(/v1/images/edits)¶
图像编辑使用 multipart form 请求格式。
| 参数 | 类型 | 必需 | 描述 |
|---|---|---|---|
model |
字符串 | 是 | 模型名称,如 "qwen-image-edit"、"wan2.5-i2i-preview" 或 "wanx2.1-imageedit" |
image |
文件 | 是 | 要编辑的输入图像文件 |
prompt |
字符串 | 是 | 描述如何修改输入图像的文本提示 |
image¶
- 类型:文件(multipart form)
- 必需:是
- 说明:要编辑的输入图像文件。
prompt¶
- 类型:字符串
- 必需:是
- 说明:描述希望如何修改输入图像的文本提示。
- 提示:
- 明确描述要添加、移除或替换的元素
- 使用具体和详细的描述
- 描述期望的修改效果
📥 响应¶
成功响应¶
文本到图像生成响应¶
{
"created": 1234567890,
"data": [
{
"url": "https://example.com/image.png",
"b64_json": "..."
}
]
}
响应字段说明:
| 字段 | 类型 | 描述 |
|---|---|---|
created |
整数 | 创建时间戳 |
data |
数组 | 生成的图片数组 |
data[].url |
字符串 | 图片 URL(如果 response_format 为 "url") |
data[].b64_json |
字符串 | Base64 编码的图片数据(如果 response_format 为 "b64_json") |
图像编辑响应¶
{
"created": 1234567890,
"data": [
{
"url": "https://example.com/edited-image.png",
"b64_json": "..."
}
]
}
响应格式与文本到图像生成相同。
错误响应¶
如果请求失败,将返回错误响应:
🌟 最佳实践¶
Prompt 编写建议¶
- 使用清晰具体的描述
- 指定重要的视觉细节
- 描述期望的艺术风格和氛围
- 注意构图和视角的说明
- 可以包含颜色、光线、情绪等细节
参数选择建议¶
-
模型选择
qwen-image*:适合快速生成高质量图像wan2.*-t2i*:Wan 系列文本到图像模型qwen-image-edit*:支持图像编辑,适合需要基于现有图像进行编辑的场景wan2.5-i2i-preview:Wan 2.5 图像到图像预览模型wanx2.1-imageedit:WanX 2.1 图像编辑模型
-
Prompt 优化
- 使用详细和描述性的文本
- 包含具体的视觉元素和风格要求
- 避免模糊或过于简短的描述
- 编辑图片时,明确描述希望如何修改输入图像(添加、移除、替换元素等)
-
图像编辑注意事项
- 确保输入图像格式正确
- 使用 multipart form 格式上传图像
- 提供清晰的编辑指令
常见问题¶
-
图片生成失败
- 检查 prompt 是否符合内容政策
- 验证 API 密钥权限
- 确认请求格式正确
- 检查模型名称是否正确
-
结果与预期不符
- 优化 prompt 描述,使其更加具体和详细
- 添加更多视觉细节和风格描述
- 尝试不同的描述方式
-
图像编辑失败
- 确认图像文件格式正确
- 检查是否使用 multipart form 格式
- 验证 prompt 是否清晰描述了编辑需求