1. Openai Dall-e 格式
简体中文
  • English
  • 简体中文
  • OpenAI官方库使用教程
  • 前言(必读)
  • 获取 Base URL 和 API Key
  • 聊天(chat)
    • 所有对话模型均兼容 OpenAI 格式
    • Realtime (实时语音、对话)
    • 聊天完成对象
    • 聊天完成块对象
    • 视觉语言模型介绍
    • Claude 官方格式
      • 所有 OpenAI格式 LLM 模型均支持 Claude 官方格式
      • Messages(官方Anthropic格式)
      • Messages(识图)
      • Messages(思考)
      • Messages(函数调用)
    • Gemini 官方格式
      • Gemini 官方格式
    • Chat(聊天)
      POST
    • Chat(分析图片)
      POST
    • Chat(分析视频)
      POST
    • Chat(结构化输出)
      POST
    • Chat(修改图片)
      POST
    • Chat(生成图片)
      POST
    • Chat(工具tools调用)
      POST
    • Chat(Claude Thinking)
      POST
    • Chat(Claude Thinking)
      POST
  • 聊天(Responses)
    • Responses API与Chat API对比
    • 创建模型响应
      POST
    • 创建模型响应(流式返回)
      POST
    • 创建模型响应(调用联网)
      POST
  • 绘图模型
    • 生图模型简介
    • Openai Dall-e 格式
      • Dalle 格式介绍
    • Nano-banana 官方格式
      POST
    • Gemini Image Generation (Native)
      POST
  • 视频模型
    • 视频生成模型简介
    • 统一格式接口
      • 统一格式接口介绍
      • Google-Veo
        • Veo文生视频
        • Veo图生视频
        • Veo 生成视频查询
        • Veo 任务结果查询
      • Sora2 视频
        • Sora生成
        • Sora 生成视频查询
        • Sora 任务结果查询
  • RAG(嵌入,重排序)
    • 嵌入(Embeddings)
      • 嵌入对象
      • 创建嵌入
      • 多模态向量嵌入
    • 重排序(Reranker)
      • 介绍
      • rerank
  • 音频(Audio)
    • suno
      • Suno文生歌
      • GoAmz配置
      • 音乐版本以及生成参数介绍
      • 场景一: 灵感模式
      • 场景二: 自定义.歌词歌名
      • 场景三: 纯音乐.自定义
      • 场景四: 纯音乐.灵感模式
      • 场景五: 续写自定义音频
      • 场景六: 续写音乐并获取完整音乐
    • Audio接口 / 输出
    • Audio接口 / 输入
    • 文本转语音 / TTS
    • 语音转文本 / whisper-1
    • 语音转文本 / gpt-4o-transcribe
  • OpenAI
    • Chat模型
    • dall-e-3
    • Chat (o1-o4系列模型)
    • gpt-image-1
    • Image edit图片编辑
    • Analyze image分析图片
    • Analyze PDF分析PDF
    • o3-pro-responses
  • Gemini
    • gemini
    • Gemini JSON PDF
  • Schemas
    • GenerateContentRequest
  1. Openai Dall-e 格式

Dalle 格式介绍

1. Generations 通用 (图生图 & 文生图)#

用途:用文字或文字+图片来生成一张全新的图片。
场景:
单纯输入文本 Prompt → 生成图片(文生图)。
上传一张参考图 + 文本 Prompt → 按照描述生成新的变体或带风格的图片(图生图)。
关键点:
1.通常是文生图,以及没有局部 Mask 修改
2.传递文件链接

2. Edits 通用 (图像编辑)#

用途:对已有图片进行编辑或局部修改。
场景:
上传图片 + 蒙版(mask)+ 文本 Prompt → 指定区域被替换/修改。
例如:去掉背景、换衣服颜色、在空白处加物体。
关键点:
1.官方 gpt-image-1 模型支持 “编辑”,需要传 mask(或透明区域)
2.传递文件流

3. Chat 通用 (对话格式)#

用途:快速在客户端支持绘图模型
场景:仅支持对话的客户端,可以快速体验

dalle 接口 model 枚举值#

gpt-image-1
gpt-4o-image
gpt-4o-image-vip
sora_image-vip
sora_image
flux-kontext-pro\max\dev
flux -*
nano-banana
nano-banana-hd
dall-e-3
recraftv3
qwen-image
qwen-image-edit
doubao-seedream-4-0-250828
doubao-seededit-3-0-i2i-250628
doubao-seedream-3-0-t2i-250415
说明
支持所有 flux-kontext 系列,flux-kontext-dev 必须有参考图
支持所有flux 系列
Modified at 2025-11-08 10:15:25
Previous
生图模型简介
Next
Nano-banana 官方格式
Built with