在刚刚过去的 2024 年,OpenAI 推出了 o 系列模型。相比于以往大型语言模型,o 系列模型使用更多的计算进行更深入的「思考」,能够回答更复杂、更细致的问题。
通过在推理时执行思维链推理,o 系列模型在新兴用例中表现出色,包括多步骤规划、图像推理和长期编码。那么,具体如何使用 o 系列模型来构建需要复杂推理的应用程序呢?
最近,OpenAI 联合人工智能著名学者、斯坦福大学教授吴恩达推出了一门关于使用 o1 进行推理的免费 DeepLearning.AI 课程 —— Reasoning with o1,讲师是 OpenAI 战略解决方案架构主管 Colin Jarvis。
课程地址:https://www.deeplearning.ai/short-courses/reasoning-with-o1
Reasoning with o1课程内容主要包括:
o1 即时工程的基础知识 规划和执行多步骤任务 创建和编辑代码 图像推理 可提高模型性能的 Metaprompting
通过这门课程,学生将:
了解 o1、它的工作原理、性能以及使用它的最佳场景。 了解如何有效地提示 o1 以及何时将任务委派给更具成本效益、更低延迟的模型。 了解 o1 如何在编码和视觉推理任务上表现出色,以及如何应用 Metaprompting 来优化应用程序。
具体来说,在 Reasoning with o1课程中,学生将了解 OpenAI 如何利用强化学习来构建使用「测试时计算」来提高推理任务性能的模型;了解什么是「思维链」提示,以及 o1 如何自主地利用它来将问题分解为更小的步骤,尝试多种策略,并在回答问题之前仔细思考。
o1 模型特别擅长抽象推理任务。它在规划、编码、分析、特定领域推理(如法律)和 STEM 科目等任务上具有破纪录的性能。Reasoning with o1课程内容涵盖:
学习识别 o1 模型适合哪些任务,以及何时需要使用更小或更快的模型,或将这两者结合起来。 了解使用 o1 进行提示的四个关键原则,并探索性能上的差异。 实现一个多步骤任务,其中 o1 作为协调器创建规划并将其交给 4o-mini 模型按顺序执行规划,平衡智能和成本之间的权衡。 使用 o1 执行编码任务,构建新应用程序、编辑现有代码,并通过在 o1-mini 和 GPT 4o 之间运行编码竞赛来测试性能。 使用 o1 进行图像理解,并了解它如何通过层次推理获得更好的性能,其中它会预先产生延迟和成本,预处理图像并使用丰富的细节对其进行索引,以便稍后用于问答。 学习一种称为 Metaprompting 的技术,以使用 o1 来改进提示。
怎么说?来学习吗?