ai人工智能
258
2024-12-26
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
在 2024 年底,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了最新的混合专家(MoE)语言模型 DeepSeek-V3-Base。不过,目前没有放出详细的模型卡。HuggingFace 下载地址:https://h...
255
2024-12-26
中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集,仅三个大模型达及格线
在当今迅速发展的人工智能时代,大语言模型(LLMs)在各种应用中发挥着至关重要的作用。然而,随着其应用的广泛化,模型的安全性问题也引起了广泛关注。探讨如何评估和提升这些模型在复杂的法律、政策和伦理领域的安全性,成为了学术界和工业界亟待解决的...
251
2024-12-26
引入长思维链!微信基于阿里千问大模型搞出个翻译版o1
最近,类 o1 模型的出现,验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考(long thought)的帮助下,LLM 倾向于探索、反思和自我改进推理过程,以获得更准确的答案。在最近的一项研究中,微信 AI 研究团队...
256
2024-12-26
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级
AIxiv专栏是人工智能站发布学术、技术内容的栏目。过去数年,人工智能站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:li...
254
2024-12-26
ScienceAI 2024「AI+材料&化学」专题年度回顾
编辑 | 2049在数字化转型的背景下,人工智能技术正在从根本上改变化学与材料科学的研究范式。2024年,这场技术革新在多个领域展现其变革力量。在分子设计领域,基于图神经网络(GNN)和 Transformer 架构的深度学习模型,结合分子...
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |