人类结构基因4个区域:①编码区,包括外显子与内含子;②前导区,位于编码区上游,相当于RNA5’末端非编码区(非翻译区);③尾部区,位于RNA3’编码区下游,相当于末端非编码区(非翻译区);④调控区,包括启动子和增强子等。基因编码区的两侧也称为侧翼顺序。
外显子和内含子大多数真核生物的基因为不连续基因(interrupted或discontinuous gene)。所谓不连续基因就是基因的编码序列在DNA分子上是不连续的,被非编码序列隔开。编码的序列称为外显子(exon),是一个基因表达为多肽链的部分;
非编码序列称为内含子(intron),又称插入序列(intervening sequence,IVS)。内含子只参与转录形成pre-mRNA,在pre-mRNA形成成熟mRNA时被剪切掉。如果一个基因有n个内含子,一般总是把基因的外显子分隔成n+1部分。内含子的核苷酸数量可比外显子多许多倍。