论文标题:Formal Mathematical Reasoning: A New Frontier in AI
论文地址:https://arxiv.org/pdf/2412.16075
从教科书、论文和讲义中自动形式化非形式化数学内容
基于数学公理生成合成的猜想和证明
从不同的证明框架和代码等数据丰富的领域迁移知识
建立自动形式化语句的评估指标
将形式化过程分解为小步骤
加强与形式系统的交互
增强多步推理、长文本处理、抽象和分层规划能力
通过合成基准诊断推理失败之处
利用检索和搜索等推理技术辅助模型
对搜索进行扩展以利用更多的测试时间计算;
对模型、搜索算法和超参数进行系统性评估;
用于评估证明目标并为其设定优先级的价值模型。
将大型、高级证明目标逐步分解为较小的目标。
学习在成熟的证明助手中构建新的定义、引理和策略。
为形式数学推理量身定制的检索器;
处理动态增长的知识库。
识别跨领域联系的通用方法;
针对各个领域的有效性的专家方法以及与数学家合作的专家方法;
将通用方法和专家方法结合起来,例如为 LLM 配备特定领域的工具。
资源、激励措施和工程开发,以提高可用性和用户友好性;
研究数学家如何使用形式化工具的行为;
支持大规模分布式协作的工具。
将形式化方法纳入 AI 辅助的系统设计和实现中;
增强 AI 进行形式化软件和硬件验证的能力;
将基于 AI 的生成与形式化验证结合起来。