ai人工智能
238
2024-12-26
引入长思维链!微信基于阿里千问大模型搞出个翻译版o1
最近,类 o1 模型的出现,验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考(long thought)的帮助下,LLM 倾向于探索、反思和自我改进推理过程,以获得更准确的答案。在最近的一项研究中,微信 AI 研究团队...
236
2024-12-26
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级
AIxiv专栏是人工智能站发布学术、技术内容的栏目。过去数年,人工智能站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:li...
233
2024-12-26
ScienceAI 2024「AI+材料&化学」专题年度回顾
编辑 | 2049在数字化转型的背景下,人工智能技术正在从根本上改变化学与材料科学的研究范式。2024年,这场技术革新在多个领域展现其变革力量。在分子设计领域,基于图神经网络(GNN)和 Transformer 架构的深度学习模型,结合分子...
235
2024-12-26
速度提升44%,节能153倍,清华使用内存计算硬件高效标记数据
编辑丨&对于现在的许多 AI 任务来说,标记数据是一个耗时、劳动密集型且昂贵的过程。深度贝叶斯主动学习 (DBAL) 以指数级方式提高标记效率,从而大幅降低成本。为了解决 DBAL 需要高带宽的数据传输和概率计算的问题,来自清华大学...
239
2024-12-26
独享MRDIMM有多强?至强6性能核处理器的内存二三事
至强 6 性能核处理器在核数、内存带宽均大幅提升的加持下,推理性能激增,进一步提升了推理的性价比。至强 6 性能核的核心规模在之前的文章中,有从业者预测至强 6 性能核处理器每颗计算单元芯片中的内核数量为 43,加上每个计算单元有两组双通道...
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |