ai人工智能

关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。他是 OpenAI 的一位资深研究科学家,也常在 OpenAI 的发布活动中露脸。更重要的是,他是思维链概念开山之作《Chain-of-Thought Prompting El...
2019 年问世的 GPT-2,其 tokenizer 使用了 BPE 算法,这种算法至今仍很常见,但这种方式是最优的吗?来自 HuggingFace 的一篇文章给出了解释。「9.9 和 9.11 到底哪个大?」这个问题一度难坏了各家大模型...
预训练语言模型通常在其参数中编码大量信息,并且随着规模的增加,它们可以更准确地回忆和使用这些信息。对于主要将信息编码为线性矩阵变换权重的密集深度神经网络来说,参数大小的扩展直接与计算和能量需求的增加相关。语言模型需要学习的一个重要信息子集是...
AIxiv专栏是人工智能站发布学术、技术内容的栏目。过去数年,人工智能站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:li...
项目地址:https://github.com/HKUDS/GraphAgent论文链接:https://arxiv.org/abs/2412.17029实验室主页: https://sites.google.com/view/chaoh港...
文章分类
联系我们
联系人: 透明七彩巨人
Email: weok168@gmail.com