ai人工智能

351   2020-10-28

大规模图训练调优指南

最近对一个大规模的图训练嵌入,发现相关的中文资料还是很欠缺的,把自己踩的一些坑记下来。本文主要针对 DGL [1] 和 PyTorch [2] 两个框架。 一、训练大规模图对于大规模图不能像小图一样把整张图扔进去训练,需要对大图进...
阿里妹导读:数据湖可以很好地帮助企业应对当前数据场景越来越多、数据结构越来越复杂、数据处理需求越来越多样化的问题。阿里云从2018年起就开始布局数据湖,推出了云原生数据湖分析Data Lake Analytics(DLA),从数据湖管理(帮...
自今年 6 月份发布以来,OpenAI 的文本生成人工智能工具 GPT-3 获得了极大的关注。它被用来在论坛上发表评论、写诗、甚至在《卫报》中发表文章。当 GPT-3 没有经过专门培训就学会自动完成某项任务时,人们开始思考它是否可以成为通向...
343   2020-10-27

文本摘要论文列表

摘要(Summarization)是传统的自然语言处理任务之一[1],多年以来,一直被广大研究者持续挖掘推进,该任务旨在将输入数据转换为包含关键信息的简短概述。在早些年,该方向一直以DUC,CNNDM,Gigaword等数据集为核心进行研究...
在今年3月,哈工大讯飞联合实验室推出了中文ELECTRA预训练模型,并将相关资源进行开源,目前在GitHub上已获得580个star。本次更新中,我们将预训练语料从原有的约20G提升至180G,利用接近9倍大小的数据集。在阅读理解、自然语言...
文章分类
联系我们
联系人: 透明七彩巨人
Email: weok168@gmail.com