admin 管理员组

文章数量: 1086019


2024年5月1日发(作者:javascript常用方法)

生物信息学复习资料

第一章

1、什么是生物信息学?

生物信息学是一门交叉科学,它包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方

面,它综合运用数学、计算机科学和生物学的各种工具来阐明和理解大量数据所包含的生物学意义

2、BIOINFORMATICS这个词是谁提出的?

林华安

3、生物信息学的发展经过了哪些阶段?

前基因组时代、基因组时代、后基因组时代

4、HGP是什么意思?什么时候开始?什么时候全部结束?

人类基因组计划、1990.10、2003

5、生物信息学的研究对象是什么?

6、生物信息学的研究内容有哪些?

获取人和各种生物的完整基因组、新基因的发现、SNP分析(单核苷酸多态性:single nucleotide

polymorphism,SNP)、非编码区信息结构与分析、生物进化;

全基因组的比较研究、蛋白质组学研究、基因功能预测、新药设计、遗传疾病的研究以及关键基因鉴定、

生物芯片

7、学习生物信息学的目的是什么?

阐明和理解大量数据所包含的生物学意义

第二章

1、生物信息数据库有哪些要求?

时间性、注释、支撑数据、数据质量、集成性

2、生物信息数据库分为哪几级,每一级是如何让定义的,每一级各包含哪些数据库?

一级数据库二级数据库;

一级数据库:

数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释

二级数据库:

对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的

应用目标而建立的

一级数据库:包括基因组数据库、核酸和蛋白质一级结构数据库、生物大分子(主要是蛋白质)三维空间结

构数据库

二级数据库:根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以

及文献等数据进行分析、整理、归纳、注释,构建具有特殊生物学意义和专门用途的数据库

3、请列出至少三个国际知名生物信息中心网站、至少三个核酸数据库、至少三个蛋白数据库。

网站:NCBI、EBI、SIB、HGMP、CMBI、ANGIS、NIG、BIC

核酸数据库:EMBL、DDBJ、GenBank

蛋白质序列数据库:PIR(Protein Information Resource)、SWISS-PROT、TrEMBL、UniProt、NCBI

生物大分子数据库:PDB(Protein Data Bank)

蛋白质结构分类数据库SCOP、蛋白质二级结构数据库DSSP、蛋白质同源序列比对数据库HSSP

4、NCBI和EBI使用的搜索引擎分别是什么?

NCBI提取工具:Entrez EBI提取工具:SRS6

5、GENBANK使用的基本信息单位是什么,包括哪几个部分,最后以什么字符结尾?

基本信息单位:GBFF(GenBank flatfile, GenBank平面文件)格式:GBFF是GenBank数据库的基本信息单

位,是最为广泛使用的生物信息学序列格式之一

哪几个部分:头部包含整个记录的信息(描述符)、第二部分包含了注释这一记录的特性、第三部分是核

苷酸序列本身

最后字符:所有序列数据库记录都在最后一行以“//”结尾

6、什么是Refseq?

The Reference Sequence database 参考序列数据库

RefSeq数据库,即RefSeq参考序列数据库,美国国家生物信息技术中心(NCBI)提供的具有生物意义上的

非冗余的基因和蛋白质序列

7、FASTA格式有哪些部分组成,以什么字符开始?

的在线和离线序列提交软件是什么?

在线提交软件:Bankit 离线提交软件:Sequin


本文标签: 生物 数据库 数据 蛋白质 分析