admin 管理员组

文章数量: 1086019


2024年5月1日发(作者:vertical farm)

第25卷

2015年10月 

第l0期 

计算机技术与发展 

COMPUTER TECHN0L0GY AND DEVELOPMENT 

Vo1.25 No.10 

0ct. 2015 

基于MySQL的诗歌翻译语料库系统数据库设计 

邓 民 

(渤海大学,辽宁锦州121013) 

摘要:诗歌翻译语料库用于存储诗歌翻译的精华,为研究诗歌翻译、传播诗歌意境提供了新途径。针对诗歌翻译语料库 

构建的难点问题,文中基于MySQL进行数据库设计。按照新奥尔良法的设计步骤进行了概念结构设计、逻辑结构设计和 

完整性设计。概念结构设计通过E—R图描述了6个实体以及实体间的7个一对多联系;逻辑结构设计运用MySQL的数 

据类型设计了数据存储表的逻辑结构;完整性设计通过对主键和外键的阐释设计了实体完整性和参照完整性的实现方 

法。实际应用时要根据需要采用灵活的存储结构和存取方法来提高数据库性能。 

关键词:诗歌翻译;语料库系统;数据库设计;MySQL 

中图分类号:TP311 文献标识码:A 文章编号:1673-629X(2015)10-0179—04 

doi:10.3969/j.issn.1673—629X.2015.10.039 

Database Design on Poetry Translation Corpus System 

Based on MySQL 

DENG Min 

(Bohm University,Jinzhou 121013,China) 

Abstract:Poetry translation corpus used for storage of the essence of poetry translation,provide a new way for the study of poetry transla- 

ifon and dissemination of the artistic conception of poetry.In view of the difficulty of poetry translation corpus construction,carry on the 

database design based on MySQL.In accordailce with the design steps of the laws of New Orleans,make he tconceptual structure design, 

logical structure design and the integrity of design.Conceptual structure design describes 6 entities and the 7 one to many relationship a. 

mong entities by E—R diagram.Logical structure design uses the MySQL data type to design the logical structure of data storage table. 

The integrity design designs impMmenmtion method ofthe integrity of entity and referential integrity by the explanation of the primary 

key and foreign key.The actual application to improve database performance uses the storage structure and access methods flexibly ac— 

cordingtothe need. 

Key words:poetry translation;corpus system;database design;MySQL 

O 引 言 

语料库(Corpus)是在语言实际应用中真实再现过 

的语言材料,是经过分析、加工、处理后语言学研究的 

基础资源,也是经验主义语言研究方法的主要资源。 

自从计算机化语料库出现后,语料库语言学发展迅猛, 

利用语料库进行语言对比研究、语言本体研究已取得 

了丰硕的成果 。语料库翻译学已经走过二十年历 

史,最早应用于小说文本翻译,经历了从研究途径到方 

法论,再到新研究范式的发展过程。语料库能快捷、可 

靠地发现和验证某些翻译规范和翻译普遍性,从而克 

服了翻译学研究的主观性和随意性,成为翻译学研究 

的重要工具 。 

文学翻译难,诗歌翻译更难,这是翻译界的共识。 

唐诗三百首选译的英译者索姆・詹宁斯(Som Jen. 

nings)曾经说过 :“从某种意义上说,译诗是徒劳的。 

因为诗之美妙更在于诗人的个性表现,诗的翻译犹如 

枝娇嫩的鲜花,根本无法嫁接到异株”。因为一般 

翻译,只要译出原文意思、语言通顺即可。但诗歌翻 

译,除了要忠实于原文外,还要传达原文的风格,表现 

原文的美感。诗歌翻译对于传承民族文化、促进世界 

文化交流具有重要意义。已翻译好的诗歌资源是宝贵 

的财富。诗歌翻译语料库系统用于存储诗歌翻译的精 

华,为研究诗歌翻译、传播诗歌意境提供了新的途径。 

收稿日期:2015一O1一l9 

作者简介:邓

修回日期:2015—04—23 网络出版时间:2015—09—23 

基金项目:2014中华人民共和国教育部人文社会科学研究规划基金一般项目(14YJA740039) 

民(1973一),女,副教授,硕士,研究方向为现代教育技术。 

网络出版地址:http://www.cnki.net/kcms/detail/61.1450.TP.20150923.1503.014.html 

180・ 计算机技术与发展 第25卷 

数据库设计是计算机语料库系统开发的基础和保 

个维度,横向是语言维,从“中文一英文”;纵向是粒度 

维,粒度从精到细分为“诗歌一分句一词语”。两个维 

障。文中结合诗歌翻译的特点,基于MySQL数据库 

管理系统,以中文诗歌翻译成英文为例,按照数据库设 

计步骤进行设计,为开发诗歌翻译语料库系统提供技 

术支持。 

度构成了一个2乘3阶矩阵,因此,系统由6个实体构 

成,分别是“诗歌信息(中文)”、“诗歌信息(英文)”、 

“分句信息(中文)”、“分句信息(英文)”、“词语信息 

(中文)”、“词语信息(英文)”。6个实体问存在7个 

一一一l一一一一一 一l一一一一一 

1概念结构设计 

数据库概念结构设计是按照用户的观点来对数据 

对多联系,实体联系如图1所示。其中,“诗歌信 

息”用于存储整篇诗歌的整体信息;“分句信息”用于 

存储每一句诗歌的信息;“词语信息”用于存储每一个 

词语的信息。这样存储语料库不但便于使用者根据需 

要选择相应的精度,还可以提高检索速度。 

和信息进行建模,通过系统特性和静态描述得到概念 

数据模型,通常利用实体关系图(Entity Relationship,E 

R)来表达。 

诗歌翻译语料库从存储结构上分为横向和纵向两 

创作年代 

诗歌内容 

存储文档 

诗歌简介 

存在 

— 厂 ◇ 

m 

竺l 

存在 

包含 

包含 

m 

词语信息(中文)卜-——<存在)—— 词语信息(英文) 

H 分旬编号 

词语内容H 词语解释 

一l—l—l一一~一一l一一一一一一一一一一一一一一一 

诗歌编号

译者编号H词语编号 

图1 诗歌翻译语料库系统数据库概念结构模型 

独立的关系模式,则与该联系相连的各实体的码以及 

2逻辑结构设计 

数据库逻辑结构设计的任务是把概念结构模型转 

换为具体的数据库管理系统(DataBase Management 

System,DBMS)所支持的数据模型。逻辑结构设计需 

要把好两方面的问题: 

联系本身的属性均转换为关系的属性,而关系的码为 

多端实体的码”。 

(2)数据类型。文中选用MySQL数据库管理系 

统,共涉及到四种数据类型 。 。一是数值型,所有编号 

都采用数值型,数值型包括定点数和浮点数。定点数 

(1)转换规则。转换规则包括实体和联系的转换 

方法。实体的转换规则是“一个实体转换为一个关系 

是以字符串形式存放的,可以精确地表达数据,选用表 

示定点数据的Decimal型;二是字符型,字符型包括少 

模式。实体的属性就是关系的属性,实体的码就是关 

系的码”;联系的转换规则分为“一对一二元联系”、 

量字符和大文本,少量字符选用可变长度的Varchar 

型,大文本选用Text型;三是日期时间型,MySQL提 

对多二元联系”、“多对多二元联系”以有“多元联 

供5种表示日期时间的数据类型,“创作年代”只需要 

保存4位年份即可,选用Year型,“翻译时间”要求保 

系”,文中系统只涉及“一对多二元联系”,转换规则是 

个一对多联系可以转换为一个独立的关系模式, 

存具体的日期时间,选用Datetime型;四是二进制文件 

型,“存储文档”保存具体的诗歌文件,可以是Word、 

也可以与多端对应的关系模式合并。如果转换为一个 

第l0期 邓 民:基于MySQL的诗歌翻译语料库系统数据库设计 ・18l・ 

WPS、JPG、Text、XML等任何类型文件,保存具体的文 

件选用Blog型。 

诗歌信息表(中文) 

ChinaPoetrylnformationTable 

FK EC 

Poetry 

根据以上的分析,基于MySQL数据库管理系统 

设计的数据结构及关系如图2所示。 

诗歌信息表(英文) 

EnglishPoetryInformationTable 

诗歌编号(PoetryNumber,Decimal,6,o) 

诗歌标题(PoetryTitle,Varchar,too) 

诗歌作者(PoetryAuthor,Varchar,30) 

诗歌编号(PoetryNumber,Decimal,6,O) 

译者编号(InterpreteNumber,Decimal,5,O) 

译者姓名(InterpreteName,Varchar,1 00) 

翻译时间(InterpreteTime,Datetime,8) 

诗歌类别(PoetryCategory,Varchar,20) 

诗歌来源(PoetrySource,Varchar,l 00) 

创作年代(CreationTime,Year,1) 

诗歌标题(PoetryTitle,Varchar,300) 

诗歌作者(PoetryAuthor,Varchar,50) 

诗歌类别(PoetryCategory,Varchar,30) 

诗歌来源(PoetrySource,Varchar,200) 

创作年代(CreafionTime,Year,1) 

诗歌内容(PoetryContent,Text) 

存储文档(StorageDocument,Blog) 

诗歌内容(Poetrycontent,Text) 

存储文档(StorageDocument,Blc} 

诗歌简介(Poetrylntroduction,Text) 

FK

ryClause 

Cn

Poet

诗歌简介(Poetrylntroduction,Text) 

FK 

En PoetryClause 

分句信息表(中文) 

ChinaClauselnformationTable 

FK EC 

Clause 

分句信息表(英文) 

EnglishClauseInformationTable 

诗歌编号 

(PoetryNumber,Decimal,6,0) 

分句编号 (ClauseNumber,Decimal,8,O) 

诗歌内容 

(ClauseContent,Varchar,100) 

分句解释 (Clause Introduction,Text) 

FK

诗歌编号(PoetryNumber,Decimal,6,0) 

译者编号(InterpreteNumber,Decimal,5,0) 

分句编号(ClauseNumber,Decimal,8,o) 

诗歌内容(ClauseContent,Varchar,300) 

分句解释(Clause Introduction,Text) 

Cn

ClauseWord 

——

FKEn

——

ClauseWord 

词语信息表(中文) 

ChinaWordlnformati0nTable 

词语信息表(英文) 

EnglishWordlnformationTable 

FK EC 

诗歌编号(PoetryNumber,Decimal,6,O) 

分句编号(ClauseNumber,Decimal,8,0) 

词语编号(WordNtmaber,Decimal,10,0) 

词语内容(WordContent,Varchar,50) 

词语解释(Wordlntroduction,Text) 

Word 

诗歌编号(PoetryNumber,Decimal,6,0) 

译者编号(InterpreteNumber,Decimal,5,O) 

分句编号(ClauseNumber,Decimal,8,0) 

词语编号(WordNumber,Decimal,10,0) 

词语内容(WordContent,Varchar,50) 

词语原型(WordPrototype,Varchar,5o) 

词语解释(Wordlntroduction,Text) 

图2诗歌翻译语料库系统数据库逻辑结构模型 

设 是关系模式R(U,F)中的属性或属性组, 

3完整性设计 

数据库完整性(Database Integrity)是指数据库中 

是K的任一子集。若K— ,而不存在 —U,则K 

为R的候选关键字(Candidate Key),若关系模式R的 

数据在逻辑上的一致性、正确性、有效性和相容性 。 

主要包括实体完整性和参照完整性。 

3.1实体完整性 

候选关键字有多个,则选择其中一个作为主关键字。 

图2所示数据库逻辑结构的主关键字设计如表1 

所示。 

实体完整性(Entity Integrity)通过主关键字(Pri— 

mary Key,PK)实现,主关键字通常简称为主键。PK是 

作为表的行的唯一标识的候选关键字 。主键可以由 

3.2参照完整性 

参照完整性(Referential Integrity)通过外关键字 

(Foreign Key,FK)实现,外关键字通常简称为外键。 

个字段,也可以由多个字段组成。 

表l 相关表的主关键字设计 

l82・ 计算机技术与发展 第25卷 

参照完整性实现了表之间的联系,FK取值必须是 

另一个表主键的有效值,或是“空”值 。 

若属性(字段)组F是关系模式 。的主键,同时F 

也是关系模式 的外键,则在R 关系中,F的取值只 

允许两种可能:空值或等于R 关系中某个主键值 。 

称为“被参照关系(主表)”模式, 称为“参照关系 

(从表)”模式。 

文中实现主表与从表间参照完整性的外键在图2 

中已在箭头旁标识出来。如通过外键FK—EC—Poetry 

实现ChinaPoetrylnformationTable表与EnglishPoetyrIn- 

formationTable表的参照完整性。实现外键的字段如表 

2所示。 

表2 实现外关键字的属性 

外关键字 构成字段 

FK EC

Poetry 

PoetryNumber 

FK ECClause PoetryNumber,ClauseNumber 

FK

ECWord PoetryNumber,ClauseNumber,WordNumber 

..—.

FKCn

PoetryClause 

PoetryNumber 

FK—Cn—ClauseWord 

PoetryNumber,ClauseNumber 

FK_En_Poe竹Clause 

oPetryNumber,InterpreteNumber 

FK En ClauseW0rd PoetryNumber,InterpreteNumber,ClauseNumber 

4结束语 

翻译学语料库研究近年来发展非常迅速,许多翻 

译语料库、平行语料库和可比语料库先后建成并投入 

使用,文中的研究内容,填补了翻译学语料库的空白。 

利用诗歌翻译语料库,可以促进诗歌翻译研究变革、引 

导诗歌翻译深化、摆脱诗歌翻译局限、拓展诗歌翻译思 

路¨卜 。文中构建的诗歌翻译语料库系统,存储结构 

合理、存取效率高,可以满足不同人员的需求。实际应 

用时可根据需要,通过建立倒排索引来提高全文检索 

速度,建立唯一索引来保证数据的一致性,通过触发器 

来实现关联操作等手段 “ ,提高并优化数据库 

性能。 

参考文献: 

[1] Stoykova V.Teaching corpus linguistics[J].Procedia—Social 

and Behavioral Sciences,2014,143(8):437—441. 

[2] Klimova B F.Using corpus linguistics in the development of 

writing[J].Procedia—Social and Behavioral Sciences,2014, 

141(1):124—128. 

[3]黄立波.《语料库翻译学:研究与应用》评介[J].外语教学 

与研究,2013,45(4):623—628. 

[4]李平.翻译语料库简介[EB/OL].2015一O1—12.http:// 

nip.nju.edu.en/kep/L_CL-Lee-LiPing-TCorpora.htm. 

[5]冯菲菲.哲学阐释学视角下汉诗英译的“三美”原则研 

究一再现中国古典诗词英译意境美[J].东北农业大学学 

报:社会科学版,2013,11(4):61—65. 

[6]黄莉,刘丁酉.利用MySQL研究公共自行车服务系统 

[J].湖北民族学院学报:自然科学版,2014,32(1):78— 

80. 

[7] Flesca S,Furfaro F,Parisi F.Consistency checking and quer— 

ying in probabilistic databases under integrity constraints[J]. 

Journal of Computer and System Sciences,2014,80(7):1448 

1489. 

[8]林英建.数据库逻辑设计性能优化关键技术研究[J].计算 

机技术与发展,2013,23(12):74—77. 

[9] 黄慧,毛宇光.基于时区的次协调数据库的完整性约束 

及模型[J].计算机应用与软件,2014,31(3):22—26. 

『l0]nesca S,Furfaro F.Parisi F.The semantics of an extended ref- 

erential integrity for a multilevel secure relational data model 

[J].Data&Knowledge Engineering,2014,48(1):129-152. 

[11]余国良语料库对翻译研究的促进作用[J].外国语文, 

2010,26(2):117—121. 

[12]胡开宝.语料库翻译学:内涵与意义[J].夕 国语:上海外国 

语大学学报,2012,35(5):59—7O. 

[13]Jung W,Roh H,Shin M,et a1.Inve ̄ed index maintenance 

strategy for flashSSDs:revitalization of in—place index update 

strategy[J].Information Systems,2015,49(4):25-39. 

[14]刘维学.对SQL Server数据库触发器的深入研究[J].计算 

机技术与发展,2013,23(10):48—51. 


本文标签: 诗歌 翻译 语料库 研究 数据库