概述
OpenAI API 由一组具有不同功能和价格点的多样化模型驱动。您还可以通过微调对我们原始基础模型进行有限的自定义,以适应您特定的用例。
我们还发布了开源模型,包括 Point-E、Whisper、Jukebox 和 CLIP。
访问我们的模型索引以了解更多信息,了解哪些模型在我们的研究论文中得到了特别关注,以及 InstructGPT 和 GPT-3.5 等模型系列之间的区别。这对于研究人员来说非常有用。
GPT-4 有限的 beta 版本
GPT-4 是一个大型多模态模型(目前接受文本输入并输出文本,未来将接受图像输入),可以比我们以前的任何模型更准确地解决困难问题,这要归功于其更广泛的常识知识和先进的推理能力。与 gpt-3.5-turbo 一样,GPT-4 专为聊天优化,但也适用于传统的自动补全任务。在我们的聊天指南中了解如何使用 GPT-4。
目前,GPT-4 处于有限的 beta 版本,并且只对被授权的用户开放。请加入等待列表,以便在有空余容量时获取访问权限。
对于许多基本任务而言,GPT-4 和 GPT-3.5 模型之间的差异并不显著。然而,在更复杂的推理情况下,GPT-4 比我们以前的任何模型都更具有能力。
GPT-3.5
GPT-3.5 模型能够理解和生成自然语言或代码。在 GPT-3.5 系列中,我们最强大且性价比最高的模型是 gpt-3.5-turbo,它专为聊天优化,但也适用于传统的自动补全任务。
我们建议使用 gpt-3.5-turbo 而不是其他 GPT-3.5 模型,因为它的成本更低。
OpenAI 模型是非确定性的,这意味着相同的输入可能会产生不同的输出。将 temperature 设置为 0 可以使输出基本上是确定性的,但仍可能存在一些微小的变化。
特定特征模型
尽管新的 GPT-3.5-Turbo 模型针对聊天进行了优化,但它在传统的文本完成任务上也表现出色。原始的 GPT-3.5 模型则是针对文本自动补全进行了优化。
我们创建嵌入和编辑文本的端点使用了各自的专业模型。
找到合适的模型
通过尝试使用 GPT-3.5-Turbo 来了解 API 的能力是一个很好的方法。在你有了想要实现的想法后,你可以选择继续使用 GPT-3.5-Turbo 或另一个模型,并尝试优化其能力。
你可以使用 GPT 比较工具,让你同时运行不同的模型以比较输出、设置和响应时间,然后将数据下载到 Excel 电子表格中。
DALL·E Beta
DALL·E 是一个可以根据自然语言描述创建逼真图像和艺术作品的 AI 系统。我们目前支持根据提示来创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体。
我们 API 中当前可用的 DALL·E 模型是第二代 DALL·E 模型,比原始模型拥有更逼真、准确和分辨率提高了 4 倍的图像。你可以通过我们的实验室界面或 API 来尝试它。
Whisper Beta
Whisper 是一个通用的语音识别模型。它是在一个大型多样化音频数据集上进行训练的多任务模型,可以执行多语言语音识别、语音翻译和语言识别。目前,我们 API 中提供的是 Whisper v2-large 模型,模型名称为 whisper-1。
目前,Whisper 的开源版本与我们 API 中提供的版本没有区别。但是,通过我们的 API,我们提供了一种优化的推断过程,使得通过我们的 API 运行 Whisper 比其他方式更快。有关 Whisper 的更多技术细节,你可以阅读相关论文。
嵌入
嵌入是文本的数值表示形式,可用于衡量两个文本片段之间的相关性。我们的第二代嵌入模型 text-embedding-ada-002 专门设计用来取代先前的 16 个第一代嵌入模型,成本只有一小部分。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。你可以在官方博客文章中阅读有关我们最新嵌入模型的更多信息。
内容审核
Embeddings 是文本的数字表示形式,可用于衡量两个文本之间的相关性。我们的第二代 embedding 模型,text-embedding-ada-002,旨在以较低的成本取代先前的 16 个第一代 embedding 模型。Embeddings 可用于搜索、聚类、推荐、异常检测和分类任务。您可以在公告博客文章中阅读更多关于我们最新 embedding 模型的信息。
Moderation 模型
旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供分类功能,可查找以下类别的内容:仇恨、仇恨 / 威胁、自残、性行为、未成年人性行为、暴力和暴力 / 图形。您可以在我们的 Moderation 指南中了解更多信息。
Moderation 模型接收任意大小的输入,并自动分割为适合该模型特定上下文窗口的尺寸。
GPT-3
GPT-3 模型能够理解和生成自然语言。这些模型已经被更强大的 GPT-3.5 一代模型所取代。然而,原始的 GPT-3 基础模型(davinci、curie、ada 和 babbage)目前是唯一可供微调的模型。
Codex
Codex 模型现已停用。它们是我们 GPT- 3 模型的后代,可以理解并生成代码。它们的训练数据包含来自 GitHub 的自然语言和数十亿行公共代码。了解更多信息。
它们在 Python 中最为强大,并精通包括 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL 和 Shell 在内的十多种编程语言。
以下是现已停用的 Codex 模型:
连续的模型升级
随着 gpt-3.5-turbo 的发布,我们的一些模型现在正在持续更新。为了减少模型更改对用户产生意外影响的可能性,我们还提供了静态的模型版本,每个版本会保持 3 个月的时间。通过新的模型更新节奏,我们还给人们提供了贡献评估的能力,以帮助我们改进模型适应不同的用例。如果您有兴趣,请查看 OpenAI Evals 存储库。
以下是将在指定日期停用的临时快照模型。如果您想使用最新的模型版本,请使用标准模型名称,如 gpt- 4 或 gpt-3.5-turbo。
原文链接:https://zhuanlan.zhihu.com/p/620085153