ai人工智能
244
2024-12-18
李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪
人类的沟通交流充满了多模态的信息。为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。因此,为了理解和生成人类动作,理解这些多模态的行为至关重要,而且这一研究方向最近受到的关注也越来越多。而多...
245
2024-12-18
英伟达下代RTX 50系列显卡规格被泄露,旗舰5090显存达32GB
自 2022 年 10 月以来,高端显卡性能终于又将迎来大幅度升级。明年的国际消费类电子产品展览会(CES 2025)将在北京时间 1 月 8 日至 11 日举行,包括英特尔、英伟达和 AMD 在内的各大 CPU、GPU 厂商将带着自家最新...
245
2024-12-18
Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息
AIxiv专栏是人工智能站发布学术、技术内容的栏目。过去数年,人工智能站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:li...
246
2024-12-17
AI大模型时代,人才的需求已经变了
什么是 AI 发展的第一驱动力?最近,全球科技大厂都在用行动告诉我们:人才。本月初,谷歌 NotebookLM 的核心团队共同宣布离职创业,他们新公司的网站已经进入了「建设中」的状态。 ...
243
2024-12-17
OpenAI被偷家,谷歌Veo 2反超Sora
视频生成领先 OpenAI 了?今天是个好日子,至少谷歌这么想。几个小时前,该公司一键三连,一口气发布了两款视觉生成模型和一个工具:Veo 2:视频生成模型,可使用文本或图像 prompt 生成高真实感、高质量的视频;Imagen 3:文生...
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |