6 月 13 日 OpenAI 官网突然发布了重磅的 ChatGPT 最新能力更新。重点如下:
1、新功能:在 Chat Completions API 中添加了新的函数调用能力,能让模型在需要的时候调用函数并生成对应的 JSON 对象作为输出。这使开发人员能更准确地从模型获取结构化数据,实现从自然语言到 API 调用或数据库查询的转换,也可以用于从文本中提取结构化数据。
(相关资料图)
(也就是经过 OpenAI 的微调后,你跟它说人话,它就能识别后给你转换成函数,进一步不需要编程也能实现编程的能力了,并且还能更方便从混乱结构里获取结构化数据)
2、模型更新:更新了更可控制的 gpt-4 和 gpt-3.5-turbo 版本,以及 gpt-3.5-turbo 的新 16k 上下文版本,相比标准的 4k 版本能处理更长的文本。
(可以支持 20 页文本了!)
3、模型弃用:公布了 gpt-3.5-turbo-0301 和 gpt-4-0314 模型的弃用时间线。这些模型的用户可以在特定时间之前选择升级到新的模型,过了这个时间后,旧模型将不再可用。
(一方面,还在使用这些模型的注意了,请跟上疯狂的 OpenAI 的节奏。另一方面,很多对标 OpenAI 过往版本模型的人们,OpenAI 人家自己已经弃用了。。)
4、价格调整:最先进的嵌入模型的价格降低了 75%,gpt-3.5-turbo 的输入代币价格降低了 25%。
(Sam Altman 最近在巡游里到处说会继续降价,这不就来了。而且要降就是最强模型脚踝斩式的降价。最新价格,每 1k token,0.0001 美金)
OpenAI 还强调了一下,所有的这些模型都继续保持在 3 月 1 日推出的数据隐私和安全保证 —— 客户拥有他们请求生成的所有输出,他们的 API 数据不会被用于训练。通过这些更新,我们将邀请更多的等待名单上的人尝试 GPT-4,我们期待看到你使用 GPT-4 构建的项目!我们鼓励开发者反馈,以帮助我们确保模型更新的平稳过渡。
以下为公告全文:
今年初我们发布了 gpt-3.5-turbo 和 gpt-4 模型,仅仅几个月的时间,我们已经看到开发者们在这些模型上构建出了令人难以置信的应用。今天,我们要跟进一些令人兴奋的更新:
· Chat Completions API 中新的函数调用功能
· 更新并增加可控制性的 gpt-4 和 gpt-3.5-turbo 版本
· gpt-3.5-turbo 的新 16k 上下文版本(与标准 4k 版本对比)
· 我们最先进的嵌入模型的价格降低了 75%
· gpt-3.5-turbo 输入令牌的价格降低了 25%
· 公布 gpt-3.5-turbo-0301 和 gpt-4-0314 模型的弃用时间线
所有这些模型都带有我们在 3 月 1 日推出的相同的数据隐私和安全保证——客户拥有他们的请求生成的所有输出,他们的 API 数据不会被用于训练。函数调用
开发者现在可以描述函数到 gpt-4-0613 和 gpt-3.5-turbo-0613,并让模型智能地选择输出包含调用这些函数的参数的 JSON 对象。这是一种更可靠地将 GPT 的能力与外部工具和 API 连接的新方法。这些模型已经被微调,既能检测出何时需要调用函数(取决于用户的输入),又能回应符合函数签名的 JSON。函数调用让开发者能更可靠地从模型获取结构化数据。例如,开发者可以:
· 创建通过调用外部工具(如 ChatGPT 插件)来回答问题的聊天机器人;
· 将 " 询问 Anya 是否想在下周五喝咖啡 " 这样的问题转换为诸如 send_email ( to: string, body: string ) 的函数调用,或者 " 波士顿现在的天气怎么样?" 转换为 get_current_weather ( location: string, unit: "celsius" | "fahrenheit" ) ;
· 将自然语言转换为 API 调用或数据库查询;
· 将 " 这个月我的前十名客户是谁?" 转换为内部 API 调用,如 get_customers_by_revenue ( start_date: string, end_date: string, limit: int ) ,或者 " 上个月 Acme, Inc. 下了多少订单?" 使用 sql_query ( query: string ) 转换为 SQL 查询;
· 从文本中提取结构化数据;
· 定义一个名为 extract_people_data ( people: [ {name: string, birthday: string, location: string} ] ) 的函数,从维基百科文章中提取所有提到的人物。
这些用例都由我们的 /v1/chat/completions 端点中的新 API 参数,functions 和 function_call 实现,这些参数允许开发者通过 JSON Schema 向模型描述函数,并选择性地要求它调用特定的函数。请开始使用我们的开发者文档,如果您发现哪些情况下函数调用可以得到改进,请添加评估。
函数调用示例
现在波士顿的天气怎么样?
步骤 1OpenAI API
使用函数和用户的输入调用模型
步骤 2
第三方 API
使用模型的响应调用你的 API
步骤 3
将响应发送回模型进行总结波士顿现在的天气是晴朗的,温度为 22 摄氏度。自从 ChatGPT 插件的 alpha 版本发布以来,我们对如何使工具和语言模型安全地协同工作了解了很多。然而,仍然存在一些开放的研究问题。例如,一个概念验证漏洞说明了如何从工具的输出中获取不受信任的数据,使模型执行未预期的行动。我们正在努力减轻这些和其他风险。开发者可以通过只使用来自受信任的工具的信息,并在执行具有现实世界影响的行动,如发送电子邮件,在线发布,或进行购买之前,包括用户确认步骤来保护他们的应用。
新模型
GPT-4
gpt-4-0613 包括了更新和改进的模型,以及函数调用功能。
gpt-4-32k-0613 包括了与 gpt-4-0613 相同的改进,以及增加的上下文长度,用于更好地理解较大的文本。
有了这些更新,我们将在未来几周内邀请更多的等待名单上的人来试用 GPT-4,我们的目标是完全取消这个模型的等待名单。感谢所有耐心等待的人们,我们很期待看到你们用 GPT-4 构建的作品!
GPT-3.5 Turbo
gpt-3.5-turbo-0613 包括了与 GPT-4 相同的函数调用功能,以及通过系统消息更可靠地控制性,这两个特性都允许开发者更有效地引导模型的回应。
gpt-3.5-turbo-16k 提供了 gpt-3.5-turbo 四倍的上下文长度,但价格是双倍的:每 1K 输入令牌 $0.003,每 1K 输出令牌 $0.004。16k 的上下文意味着模型现在可以在一次请求中支持大约 20 页的文本。
模型弃用
今天,我们将开始为我们在 3 月宣布的 gpt-4 和 gpt-3.5-turbo 的初始版本升级和弃用的过程。使用稳定模型名称的应用(gpt-3.5-turbo,gpt-4,和 gpt-4-32k)将在 6 月 27 日自动升级为上面列出的新模型。为了比较模型版本之间的性能,我们的 Evals 库支持公共和私有评估,以展示模型变化将如何影响你的用例。
需要更多时间进行过渡的开发者可以通过在他们的 API 请求的‘ model ’参数中指定 gpt-3.5-turbo-0301,gpt-4-0314,或 gpt-4-32k-0314 来继续使用旧模型。这些旧模型将在 9 月 13 日之后仍然可以访问,之后指定这些模型名称的请求将失败。你可以通过我们的模型弃用页面来了解模型弃用的最新信息。这是对这些模型的第一次更新;因此,我们非常欢迎开发者的反馈,以帮助我们确保平稳过渡。
降低价格
我们会继续提高我们的系统效率,并将这些节省下来的成本传递给开发者,即日起生效。
Embeddings
text-embedding-ada-002 是我们最受欢迎的嵌入模型。今天我们将其成本降低了 75%,到每 1K 令牌 $0.0001。
gpt-3.5-turbo 是我们最受欢迎的聊天模型,为数百万用户提供 ChatGPT 服务。今天我们将 gpt-3.5-turbo 的输入令牌成本降低了 25%。开发者现在可以以每 1K 输入令牌 $0.0015 和每 1K 输出令牌 $0.002 的价格使用这个模型,这相当于每美元可以处理大约 700 页。
gpt-3.5-turbo-16k 的价格将是每 1K 输入令牌 $0.003,每 1K 输出令牌 $0.004。
开发者的反馈是我们平台演化的基石,我们将根据收到的建议继续进行改进。我们期待看到开发者如何在他们的应用中使用这些最新的模型和新功能。