中兴官网消费者业务运营商业务政企业务

终端商城

选择语言

简体中文 English

自然语言处理技术发展

2022-04-08 作者：王海宁

自然语言处理技术发展 - 中兴通讯技术

您当前访问的的浏览器版本过低，为了给您带来更好的体验，建议您升级至Edge浏览器或者推荐使用Google浏览器。

中兴官网消费者业务运营商业务政企业务

首页公司刊物中兴通讯技术

自然语言处理技术发展

发布时间：2022-04-08 作者：王海宁阅读量：

自然语言处理技术发展

王海宁

（英特尔（中国）有限公司，中国北京 100013）

摘要：基于神经网络和深度学习的预训练语言模型为自然语言处理技术带来了突破性发展。基于自注意力机制的Transformer模型是预训练语言模型的基础。GPT、BERT、XLNet等大规模预训练语言模型均基于Transformer模型进行堆叠和优化。认为目前依赖强大算力和海量数据的大规模预训练语言模型存在实用问题，指出轻量预训练语言模型是未来重要的发展方向。

关键词：自然语言处理；预训练语言模型；Transformer；GPT；BERT；XLNet；模型优化

Development of Natural Language Processing Technology

WANG Haining

(Intel China Ltd., Beijing 100013, China)

Abstract: The pre-trained language model based on neural network and deep learning has brought breakthrough development for natural language processing technology. The Transformer model based on self-attention mechanism is the basis of the pre-trained language model. Large-scale pre-trained language models such as GPT, BERT, XLNet, etc. are based on the Transformer model or its optimization. However, the current large-scale pre-training language models that rely on powerful computing resources and massive data have practical problems. It is pointed out that lightweight pre-trained language models are an important development direction in the future.

Keywords: natural language processing; pre-trained language model; Transformer; GPT; BERT; XLNet; model optimization

在线PDF浏览： PDF

本期相关文章

5G行业虚拟专网能力提升与实践

数字基础设施建设的思考与实践

高效训练百万亿参数预训练模型的系统挑战和对策

超大规模多模态预训练模型M6的关键技术突破及产业应用

鹏程·盘古：大规模自回归中文预训练语言模型及应用

悟道·文澜：超大规模多模态预训练模型带来了什么？

知识增强预训练模型

： PDF