塩基配列
生物学における塩基配列(えんきはいれつ)とは、DNA、RNAなどの核酸において、それを構成しているヌクレオチドの結合順を、ヌクレオチドの一部をなす有機塩基類の種類に注目して記述する方法、あるいは記述したもののこと。DNAは、物質として遺伝情報を保持している本体であるが、この情報は塩基配列の形になっている。例えば、DNAの塩基配列の情報は、コドンの形で、細胞が作り出す蛋白質の決定している他、特定の蛋白質が、DNAのうちのある決まった塩基配列部分にだけ結合することが遺伝子発現を左右する現象などが広く知られている。また、細胞の分裂の際や生殖による子孫となる個体の形成時には、塩基配列がそれらに伝わることが、形質の保持や遺伝という現象を支えているといえる。したがって、核酸の塩基配列を調べることは、遺伝情報の解析の上で非常に基本的な作業である。ゲノムプロジェクトはある生物のゲノムの全塩基配列の読み取りを目標としている。
核酸は、モノマーであるヌクレオチドが、直鎖状に多数接続してできたポリマーである。ヌクレオチドには、通称"塩基"と呼ばれる有機塩基(プリン塩基またはピリミジン塩基)が結合している。塩基は、DNAではアデニン (A) 、グアニン (G) 、チミン (T) 、シトシン (C) の4種類があり、RNAでは、チミンのかわりにウラシル (U) になる。( )内は、各塩基の一文字略称である。ヌクレオチドがポリマーを作るときには方向性があり、ヌクレオチドを構成するリボースの5員環の炭素の位置で、5'炭素と3'炭素がリン酸基を介してエステル結合し伸張するので、塩基配列を記述するときもそれに合わせ、核酸の5'側端から3'側端の方向に記述する。DNA の場合、一文字略称で表すと、例えば"GAATTC"のように端から順に塩基を記述できる。
核酸の塩基配列のことを、単にシークエンスと呼ぶことも多い。ある核酸の塩基配列を調べて明らかにする操作・作業のことを、塩基配列決定、あるいはシークエンシングと呼ぶ。
塩基配列の法則としては 1)に2重螺旋構造の対になるのは A-T(あるいはA-U、2本の水素結合)とG-C(3本の水素結合)の結合のみである。2)に 同じ螺旋上では プリン系A,とG とピリミジン系T,あるいはU,とC,の系統に関わらず どの順列でも存在している。この各塩基の順列がさまざまな性質をもたらすが、A,の後にG,TあるいはCなどと短い順列ではほとんど法則らしきものは見出されておらず、AtRandomに存在していると言ってよい。3個の配列64種はコドンと呼ばれ、アミノ酸を決定する。例えば合成の開始コードとしてAUGなど、終結コドンと呼ばれるUAAなどがある。