ゲノムって何だっけ

 遺伝情報、つまり生物の体の設計図は、「DNA」という長い長い鎖状の分子に記録されています。どれほど長いかというと、例えばヒトの細胞1個の中に収納されているDNAをほぐして全部1列に並べると、約2mにもなります。

 このうち半分の1m分は父親から、もう1m分は母親から受け継いだものです。この1m分の遺伝情報を「ゲノム」と呼びます。生物のゲノムの1セットには、生物の体の設計図が一通りそろっています。

 DNAは「アデニン(A)」「グアニン(G)」「シトシン(C)」「チミン(T)」という4種の「塩基」という部品が連なってできています。(長い長い焼き鳥を思い浮かべてください。)遺伝情報はA、G、C、Tという4文字で書かれた文書といえます。ACGTCC・・・という具合に続く文書です。(焼き鳥なら砂肝、ネギ、モモ、シイタケ、ネギ、ネギ、・・・という感じでしょうか。)

 ゲノムという文書は、「遺伝子」という文の集合です。ヒトのゲノムは2万~2万5000の遺伝子からなります。遺伝子の1文は、「タンパク質分子」の1種類を表すと考えても、まあ大体合ってます。詳細は省きますが、生物の細胞はあるタンパク質分子が必要になると、ゲノム中でそのタンパク質分子の作り方が記述されている1文を参照して、その文にしたがってタンパク質分子を製造します。ヒトの体内では2万種~2万5000種のタンパク質分子が製造され、働いています。

 またゲノム中には、過去のコピーミスのために使えなくなってしまった遺伝子や、同じ文字列が繰り返し書いてある部分や、過去にウイルスが勝手に挿入した部分や、タンパク質分子ではなく「RNA」の設計図や、結局何の役に立つのか分からない意味不明の文字列や、とてもここに全部は紹介できない誠にさまざまな落書きがひしめいています。

 それら全部を引っくるめて、ヒトのゲノムは約30億字ほどです。30億「塩基対」という言い方をします。情報量にして1ギガバイト弱です。