1. 统一格式接口
简体中文
  • English
  • 简体中文
  • OpenAI官方库使用教程
  • 前言(必读)
  • 获取 Base URL 和 API Key
  • 聊天(chat)
    • 所有对话模型均兼容 OpenAI 格式
    • Realtime (实时语音、对话)
    • 聊天完成对象
    • 聊天完成块对象
    • 视觉语言模型介绍
    • Claude 官方格式
      • 所有 OpenAI格式 LLM 模型均支持 Claude 官方格式
      • Messages(官方Anthropic格式)
      • Messages(识图)
      • Messages(思考)
      • Messages(函数调用)
    • Gemini 官方格式
      • Gemini 官方格式
    • Chat(聊天)
      POST
    • Chat(分析图片)
      POST
    • Chat(分析视频)
      POST
    • Chat(结构化输出)
      POST
    • Chat(修改图片)
      POST
    • Chat(生成图片)
      POST
    • Chat(工具tools调用)
      POST
    • Chat(Claude Thinking)
      POST
    • Chat(Claude Thinking)
      POST
  • 聊天(Responses)
    • Responses API与Chat API对比
    • 创建模型响应
      POST
    • 创建模型响应(流式返回)
      POST
    • 创建模型响应(调用联网)
      POST
  • 绘图模型
    • 生图模型简介
    • Openai Dall-e 格式
      • Dalle 格式介绍
    • Nano-banana 官方格式
    • Gemini Image Generation (Native)
  • 视频模型
    • 视频生成模型简介
    • 统一格式接口
      • 统一格式接口介绍
      • Google-Veo
        • Veo文生视频
        • Veo图生视频
        • Veo 生成视频查询
        • Veo 任务结果查询
      • Sora2 视频
        • Sora生成
        • Sora 生成视频查询
        • Sora 任务结果查询
  • RAG(嵌入,重排序)
    • 嵌入(Embeddings)
      • 嵌入对象
      • 创建嵌入
      • 多模态向量嵌入
    • 重排序(Reranker)
      • 介绍
      • rerank
  • 音频(Audio)
    • suno
      • Suno文生歌
      • GoAmz配置
      • 音乐版本以及生成参数介绍
      • 场景一: 灵感模式
      • 场景二: 自定义.歌词歌名
      • 场景三: 纯音乐.自定义
      • 场景四: 纯音乐.灵感模式
      • 场景五: 续写自定义音频
      • 场景六: 续写音乐并获取完整音乐
    • Audio接口 / 输出
    • Audio接口 / 输入
    • 文本转语音 / TTS
    • 语音转文本 / whisper-1
    • 语音转文本 / gpt-4o-transcribe
  • OpenAI
    • Chat模型
    • dall-e-3
    • Chat (o1-o4系列模型)
    • gpt-image-1
    • Image edit图片编辑
    • Analyze image分析图片
    • Analyze PDF分析PDF
    • o3-pro-responses
  • Gemini
    • gemini
    • Gemini JSON PDF
  • Schemas
    • GenerateContentRequest
  1. 统一格式接口

统一格式接口介绍

实现统一的接口格式接入,方便用户集成
接口会根据传参里是否有imagese字段判断为图片生成视频, videos字段判断为视频生成视频

任务状态#

NOT_START : 未开始
SUBMITTED : 已提交任务
QUEUED : 队列中
IN_PROGRESS : 正在执行
SUCCESS : 执行完成
FAILURE : 失败

接口定义#

1. 提交#

scope: images\videos\audio
Post: /v2/{scope}/generations
例如: Post: /v2/videos/generations
header:
Authorization: Bearer <API-Key>
input:
{
    "prompt": "", // 必须
    "model": "", // 必须
    "duration": 5,
    "aspect_ratio": "16:9",
    "size": "",
    "resolution": "780P",
    "images": [""], // url or b64
    "videos": [""], // only url
    "watermark": false
    ......
}
output:
{
    "task_id": "f186f65a-8657-4e83-b0e3-67facf1b2576",
}

2. 获取#

Get: /v2/{scope}/generations/:task_id
header:
Authorization: Bearer <API-Key>
output:
{
    "task_id": "f4a94d75-087b-4bb1-bd45-53ba293faf96",
    "status": "SUCCESS",
    "fail_reason": "",
    "submit_time": 1716192124,
    "start_time": 1716192124,
    "finish_time": 1716192124,
    "progress": "100%",
    "data": {
        "output": "",
        "outputs": ["",""],
        other...
    }
  }

使用示例#

以 Veo 视频生成为例
1.
准备
获取 API-Key,为所有请求加
Authorization: Bearer <API-Key>
2.
提交任务(POST /v2/{scope}/generations)
存在 images → 视为“图片生成视频”;存在 videos → 视为“视频生成视频”;都无 → 纯文生视频
返回
{ "task_id": "f186f65a-8657-4e83-b0e3-67facf1b2576" }
3.
轮询查询进度
客户端每 2s → 4s → 8s 指数退避调用
GET /v2/{scope}/generations/:task_id
当 status为 SUCCESS / FAILURE 即停止;
超过自定义超时(如 30 分钟)提示超时
返回
{
    "task_id": "veo3:1756693796-YQVHH4A3Lg",
    "platform": "google",
    "action": "google-videos",
    "status": "SUCCESS",
    "fail_reason": "",
    "submit_time": 1756693797,
    "start_time": 1756693808,
    "finish_time": 1756693898,
    "progress": "100%",
    "data": {
        "output": "https://filesystem.site/cdn/20250901/018eg2SgUpHMT6EEuQbfeRLWeUhE75.mp4"
    },
    "search_item": ""
}
4.
取回并持久化结果
读取 data.output 或 data.outputs
Modified at 2025-11-08 09:57:42
Previous
视频生成模型简介
Next
Veo文生视频
Built with