1. 视频模型
简体中文
  • English
  • 简体中文
  • OpenAI官方库使用教程
  • 前言(必读)
  • 获取 Base URL 和 API Key
  • 聊天(chat)
    • 所有对话模型均兼容 OpenAI 格式
    • Realtime (实时语音、对话)
    • 聊天完成对象
    • 聊天完成块对象
    • 视觉语言模型介绍
    • Claude 官方格式
      • 所有 OpenAI格式 LLM 模型均支持 Claude 官方格式
      • Messages(官方Anthropic格式)
      • Messages(识图)
      • Messages(思考)
      • Messages(函数调用)
    • Gemini 官方格式
      • Gemini 官方格式
    • Chat(聊天)
      POST
    • Chat(分析图片)
      POST
    • Chat(分析视频)
      POST
    • Chat(结构化输出)
      POST
    • Chat(修改图片)
      POST
    • Chat(生成图片)
      POST
    • Chat(工具tools调用)
      POST
    • Chat(Claude Thinking)
      POST
    • Chat(Claude Thinking)
      POST
  • 聊天(Responses)
    • Responses API与Chat API对比
    • 创建模型响应
      POST
    • 创建模型响应(流式返回)
      POST
    • 创建模型响应(调用联网)
      POST
  • 绘图模型
    • 生图模型简介
    • Openai Dall-e 格式
      • Dalle 格式介绍
    • Nano-banana 官方格式
      POST
    • Gemini Image Generation (Native)
      POST
  • 视频模型
    • 视频生成模型简介
    • 统一格式接口
      • 统一格式接口介绍
      • Google-Veo
        • Veo文生视频
        • Veo图生视频
        • Veo 生成视频查询
        • Veo 任务结果查询
      • Sora2 视频
        • Sora生成
        • Sora 生成视频查询
        • Sora 任务结果查询
  • RAG(嵌入,重排序)
    • 嵌入(Embeddings)
      • 嵌入对象
      • 创建嵌入
      • 多模态向量嵌入
    • 重排序(Reranker)
      • 介绍
      • rerank
  • 音频(Audio)
    • suno
      • Suno文生歌
      • GoAmz配置
      • 音乐版本以及生成参数介绍
      • 场景一: 灵感模式
      • 场景二: 自定义.歌词歌名
      • 场景三: 纯音乐.自定义
      • 场景四: 纯音乐.灵感模式
      • 场景五: 续写自定义音频
      • 场景六: 续写音乐并获取完整音乐
    • Audio接口 / 输出
    • Audio接口 / 输入
    • 文本转语音 / TTS
    • 语音转文本 / whisper-1
    • 语音转文本 / gpt-4o-transcribe
  • OpenAI
    • Chat模型
    • dall-e-3
    • Chat (o1-o4系列模型)
    • gpt-image-1
    • Image edit图片编辑
    • Analyze image分析图片
    • Analyze PDF分析PDF
    • o3-pro-responses
  • Gemini
    • gemini
    • Gemini JSON PDF
  • Schemas
    • GenerateContentRequest
  1. 视频模型

视频生成模型简介

使用场景#

视频生成模型是一种利用文本或图像描述生成动态视频内容的技术,随着技术的不断发展,它的应用场景也越来越广泛。以下是一些潜在的应用领域:
动态内容生成:视频生成模型可以生成动态的视觉内容,用于描述和解释信息;
多模态智能交互:结合图像和文本输入,视频生成模型可用于更智能、更交互式的

应用场景#

替代传统视觉技术:视频生成模型可以替代或增强传统的机器视觉技术,解决更复杂的多模态问题; 随着技术的进步,视频生成模型的多模态能力会与视觉语言模型融合,推动其在智能交互、自动化内容生成以及复杂场景模拟等领域的全面应用。此外,视频生成模型还能与图像生成模型(图生视频)结合,进一步拓展其应用范围,实现更加丰富和多样化的视觉内容生成。

使用建议#

在编写提示词时,请关注详细、按时间顺序描述动作和场景。包含具体的动作、外貌、镜头角度以及环境细节,所有内容都应连贯地写在一个段落中,直接从动作开始,描述应具体和精确,将自己想象为在描述镜头脚本的摄影师,提示词保持在200单词以内。
为了获得最佳效果,请按照以下结构构建提示词:
从主要动作的一句话开始
示例:A woman with light skin, wearing a blue jacket and a black hat with a veil,She first looks down and to her right, then raises her head back up as she speaks.
添加关于动作和手势的具体细节
示例:She first looks down and to her right, then raises her head back up as she speaks.
精确描述角色/物体的外观
示例:She has brown hair styled in an updo, light brown eyebrows, and is wearing a white collared shirt under her blue jacket.
包括背景和环境的细节
示例:The background is out of focus, but shows trees and people in period clothing.
指定镜头角度和移动方式
示例:The camera remains stationary on her face as she speaks.
描述光线和颜色效果
示例:The scene is captured in real-life footage, with natural lighting and true-to-life colors.
注意任何变化或突发事件
示例:A gust of wind blows through the trees, causing the woman’s veil to flutter slightly.
Modified at 2025-11-08 09:56:45
Previous
Gemini Image Generation (Native)
Next
统一格式接口介绍
Built with