首页编程正文内容

【预训练语言模型】ERNIE1.0: Enhanced Representation through Knowledge Integration

编程

更新时间：2026-04-03 09:45:54 47

admin 管理员组

文章数量: 1184232

【预训练语言模型】ERNIE1.0: Enhanced Representation through Knowledge Integration

简要信息：

序号	属性	值
1	模型名称	ERNIE1.0
2	发表位置	-
3	所属领域	自然语言处理、预训练语言模型
4	研究内容	知识增强的预训练语言模型
5	核心内容	BERT改进
6	GitHub源码	https://github/PaddlePaddle/ERNIE
7	论文PDF	https://arxiv/pdf/1904.09223

一、动机

先前的大部分工作只使用了文本来预测missing word，忽略了文本自身的先验信息，例如文本中的实体；
除了传统的single toke masking，对整个entity（multi tokens word或phrase）进行mask，在训练时则可以捕捉实体的语义信息；

二、方法

2.1 Transformer

选择多层Transformer作为基础模型，使用WordPiece进行分词，并获得token、segment和position embedding。

2.2 Knowledge Integration

并非将实体knowledge embedding融合到context word embedding（ERNIE-TsingHua版本），而是借助先验知识改进masking策略。
提出三种不同的Masking策略，如下图所示：

Basic-level Masking：采用最基础的masking策略，不论文英文还是中文，以single token作为mask对象；
Entity-level Masking：实体包含person、location和organization等；
Phrase-level Masking：例如词法分析和chunking工具获得一个句子的所有phrase，使用dependent segmentation工具获得word、phrase的属性信息。

在训练时，依然使用word piece进行分词，但选择不同的masking策略。对于mask的token，训练让模型预测正确的token。

如下图所示，可以直观地看出ERNIE与传统BERT的区别：

三、实验

实验设置：

● 数据：选择多个不同的语料，包括中文Wikipedia、百度百科、百度贴吧和百度新闻等；
● 模型：与BERT-base完全相同；

实验任务：

● NLI：XNLI；
● 语义相似度：LCQMC；
● 实体识别：MSRA-NER；
● 情感分析：ChnSentiCorp；
● 检索式问答：NLPCC-DBQA

实验结果

不同的Masking策略对比：

取10%的训练数据进行pre-train，并在XNLI任务验证集和测试集上进行测试：

本文标签：模型语言 Enhanced Knowledge Representation

版权声明：本文标题：【预训练语言模型】ERNIE1.0: Enhanced Representation through Knowledge Integration 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1766364045a3452896.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

51c大模型~合集151

编程

3月前

我自己的原文哦~ https:blog.51ctowhaosoft14038324 #用隐藏指令诱导AI给论文打高分谢赛宁合著论文被点名：认错&

基于Erlang语言的视频相似推荐系统 | 深度

编程

3月前

作者丨gongyouliu来源 | 转载自大数据与人工智能（ID:ai-big-data）【导语】：作者在上一篇文章《基于内容的推荐算法》中介绍了基于内容的推荐算法的实现原理

微PE官网之外的技术延伸：用U盘装系统不如跑个TTS模型

编程

2月前

微PE官网之外的技术延伸：用U盘装系统不如跑个TTS模型在不少人的印象里，U盘启动盘的使命就是重装系统、修复引导、拷贝数据——一个沉默的工具，一次性的救援手段。但你有没有想

windows 安装 Go 语言

编程

2月前

想学学后端语言，本来想学 python 来着，买了一堆书，但是感觉 go 语言好像更好使，准备学 go 语言 Go 语言安装 Go 语言下载网站O

R语言的下载与安装（win&mac）

编程

2月前

R语言的下载与安装（win&mac） 数据分析软件之R语言 R语言的下载： 1.搜索R语言2.打开官网选择download R3.根据不同的系统需要下载不同版本

浏览器打开Axure RP模型

编程

2月前

1，直接使用chrome打开，提示下载插件 2，需要做一些操作打开原型文件，找到resourceschromeaxure-chrome-exte

探索3DLL技术：从基础到应用

技术日记

2月前

Windows 10用户必看：快速设置中文美式键盘教程

技术日记

1月前

在中很多朋友发现没有简体中文(美式键盘)的选项，而如果使用“英语-美式键盘”作为默认输入法，有ModernApp的界面会变成英文，这十分不方便，那么有没有方可以在Win10中添加一个简体中文(美式键盘)呢？一起来看看下面的方法

从无到有：GLM-4.7-Flash 教程，助你快速掌握文本生成技巧

编程

1月前

手把手教你用GLM-4.7-Flash：快速生成高质量文本内容你是不是也遇到过这些情况？写营销文案卡在第一句，改了八遍还是像AI写的；整理会议纪要时翻着几十页录音转文字，越看越头大；给客户

多语言浏览大法，谷歌浏览器和你一起开启全球探索之旅！

技术日记

1月前

在全球化的今天，互联网已经成为连接世界的桥梁。作为最常用的网页浏览器之一，谷歌浏览器（Google Chrome）提供了强大的多语言支持功能，让不同语言的用户都能轻松访问和浏览网页。本文将详细介绍如何在谷歌浏览器中进行语言设置、启用消

ForcedAligner 0.6B：让复杂口音挑战迎刃而解，实现98.2%精准字级匹配的秘诀揭晓！

编程

1月前

Qwen3-ForcedAligner-0.6B惊艳案例：带口音中文访谈音频实现98.2%字级对齐准确率 1. 为什么这个对齐模型让人眼前一亮你有没有遇到过这样的情况：一段粤语口音浓重的深圳科技公司内部访谈录音，转文

从新手到大神：使用SHAP进行模型解释时遇到的UTF-8编码错误如何解决？ —— XGBoost版本兼容秘籍

技术日记

1月前

XGBoost模型可视化翻车实录：手把手解决SHAP的UTF-8编码报错（附版本兼容方案）最近在做一个金融风控项目，用XGBoost训练完模型后，想用SHAP做特征可解释性分析，结果一运行 shap.TreeEx

从GPT基础到GPT3大突破：揭秘Adobe Flash与AI融合

技术日记

1月前

every blog every motto:Although the world is full of suffering， it is full also of the overcoming of it 0.

Adobe Flash Player的安全挑战：企业如何建立有效的人力资源控制体系？

技术日记

1月前

旨在提供分析视角，所有策略均存在重大法律、道德与合规风险，严禁在现实世界中实施或效仿。企业非正当利益运作与人员控制策略框架编号策略名称核心操作执行要点

GTE升级版来袭：小容量CPU支持下的可视化界面和API便捷调用

技术日记

1月前

GTE中文语义相似度服务上线｜轻量级CPU版支持可视化仪表盘与API调用 1. 项目概览：GTE 中文语义相似度服务是什么？在自然语言处理（NLP）领域，语义相似度计算是构建智能系统的核心能

UML入门到精通：构建软件系统的核心语言

编程

20天前

UML(Unified Modeling Language) 统一建模语言，又称标准建模语言。是用来对软件密集系统进行可视化建模的一种语言。UML的定义包括UML语义和UML表示法两个元素。UML是在开发阶段，说明、可视

从UML到实际应用：Adobe Flash中心的模型构建艺术

技术日记

20天前

UML(Unified Modeling Language) 统一建模语言，又称标准建模语言。是用来对软件密集系统进行可视化建模的一种语言。UML的定义包括UML语义和UML表示法两个元素。UML是在开发阶段，说明、可视

Yolo火焰检测实战：突破视觉检测新境界，火光不再隐藏！

编程

20天前

本文采用YOLOv11作为核心算法框架，结合PyQt5构建用户界面，使用Python3进行开发。YOLOv11以其高效的实时检测能力，在多个目标检测任务中展现出卓越性能。本研究针对火焰与烟雾数据集进行训练和优化，该数据集包含丰富的火焰

火灾烟雾智能检测

技术日记

11天前

1 项目说明据统计，2020年全国共接报火灾25.2万起，直接财产损失高达40.09亿元。火灾已经成为危害人们生命财产安全的一种多发性灾害。针对住宅、加油站、公路、森林等火灾高发场景，应用飞桨的目标检测技术，

Swift-All小白教程：快速部署大模型，解决环境配置难题

技术日记

9天前

Swift-All小白教程：快速部署大模型，解决环境配置难题你是不是刚接触大模型，被各种复杂的安装命令、环境依赖、版本冲突搞得头大？是不是想快速体验一下大模型的能力，却卡在第一步的部署上？或者，你听说过LoRA微调、量化部署

发表评论

全部评论 0

暂无评论

推荐文章

360安全浏览器如何彻底卸载_怎么卸载360浏览器

linux 下 centos 8Fedora 32下玩游戏 steam dota2 的问题_centos 玩dota2

磁盘分区基本磁盘卷简单卷跨区卷_新建简单卷

Linux mint18通过禁用nouveau解决显示器出现“输入不支持”问题_linux mint 禁用nouveau

PrintScreen是什么键_priintscreen jian

热门文章

MFC71.dll困境？一文搞定Adobe Flash Player与你的代码冲突
18天前
电脑慢到飞起？5个被忽视的优化技巧助你一臂之力！
18天前
2021 CPU性能大比拼：谁更胜一筹？
18天前
电脑反应慢？3招快速释放内存，提升效率！
17天前
IBM T42笔记本触摸板操作大全：提升日常使用效率
17天前
27、Python面向对象编程：时间类、私有属性与卡牌模拟
16天前
ubuntu笔记本外置显卡开展深度学习_ubuntu1804 外接显卡扩展坞计算卡
16天前
linux清理内存
10天前
docker中创建虚拟网卡_ubantu 创建docker 网卡
10天前
小米路由器安装Misstar tools 和MIXBOX
10天前

最新文章