「分子生物学実験：塩基配列情報の解析とデータベースの利用」

担当：安居佑季子（生命科学研究科　統合生命科学専攻　遺伝子特性学分野）

開講期間：2025 年 10 月 1 日（火）〜　3 限目～５限目

（注意）

本実習の受講は、学術情報メディアセンターの利用アカウントを取得していることが前提です。また，基本的な事項は「分子生物学１」の補助ページに説明があるので，参照してください。

1.9.1 データベースを利用した塩基配列の解析

遺伝情報は、DNAの塩基（G, A, T, C）配列にコードされていることから、DNAの正確な一次構造（塩基配列）を知ることは、遺伝子の機能や調節を研究する上で重要である。DNAシークエンサーから得られた塩基配列データには、不正確な部分や間違った部分があるので、正確に読めている部分のみを抽出もしくは利用する必要がある。DNA断片の塩基配列を決定するためには、研究（補助）者が正しい配列かどうかを判定（解読）する必要がある。DNA塩基配列の決定は、現在、Sanger法を改変した以下の手順で行われることが多い。

塩基配列決定操作の概要

(1)	塩基配列を決定したい大腸菌プラスミドやPCR (Polymerase Chain Reaction) 断片を調製する。
(2)	このDNA断片に、相補的なオリゴヌクレオチドプライマー（20～23 mer）、蛍光色素を結合したジデオキシヌクレオチド3-リン酸、ヌクレオチド3-リン酸、バッファー、耐熱性DNAポリメラーゼを混合し、DNA合成反応を行なう。この時、塩基特異的にDNA合成反応が停止し、種々の長さを持った新しいDNA鎖が合成される。この鎖の3’末端には塩基特異的な蛍光色素が結合している。
(3)	反応液から、未反応の蛍光色素を結合したジデオキシヌクレオチド3-リン酸をエタノール沈殿で除去する。
(4)	生成した塩基配列特異的な鎖長を持つDNAをゲル電気泳動やキャピラリー電気泳動で分離し、蛍光用のレーザー検出器で検出する（「DNAシ－ケンサ－」）。
(5)	(4)のシグナルをデータファイルとしてコントロ－ル用コンピューターに取り込む。得られた波形データから解析プログラム（「ベースコーラー」 “base caller”）を用いて配列データを生成し、素データとする。素データは、コントロ－ル用コンピュ－タ－のハードディスクにテキストデータとして記録される。

ここでは、（１）例題（unknown-1）について解析の練習を行い，次に（２）実際に自分たちがクローン化した断片の配列について解析する。（２）の解析では、配布される波形データと塩基配列データを用いる。波形データはプリントで、配列データはこのページの最後に掲載されているので、各自のプリントにあるデータの番号と対応する配列を選んで解析に用いる。実習終了時には，解析結果を各自のディスク領域に保存し，最終的にレポートにまとめること。

まず、例題（unknown-1）について説明するので、その説明に従って得られた結果を見て、以下の問いに対する答えをレポートで提出する。なお、今回配布する塩基配列データは、大腸菌DNAをクローニングベクターpBluescript SK+にクローン化したものから得られたものである。

１０月１4日＜練習課題＞

１.	与えられた配列unknown-1は、大腸菌ゲノム上のどの部分か？制限酵素HindIIIの認識部位（AAGCTT）2カ所とタンパク質コード領域の位置関係を図示すること。タンパク質コード領域の翻訳開始コドンと終止コドンを記入せよ。
２.	与えられた配列に含まれる遺伝子は何か？また、その遺伝子の周辺はどのような構成になっているかを図示せよ。オペロンを構成している遺伝子なら、そのオペロン全体を含むように図示せよ。転写方向を矢印で示し、発現調節領域の場所を記入すること。
３.	近傍に遺伝子が見つかれば、その遺伝子産物の機能が何であるかをコンピューター上で調べる。さらに、その遺伝子の機能について、関連文献をインターネットや図書館で探し出し、説明すること。例えば，アミノ酸生合成経路（糖代謝・複製・翻訳など）の中でも「トリプトファンの生合成の段階で，中間反応産物○○○を○○○に変換する反応を触媒する」など詳細に記載する．レポートには参考とした論文を記載すること．

下記の配列「unknown-1」は、FASTA形式で記載した塩基配列である。１行目の「>unknown-1」の「>」の記号は、この行がコメント行であることを示し、次の行からの配列が「unknown-1」という名称の配列であることを示す。また、この次の「>」の記号が出てくるまでは、改行やスペースがあっても、ひと続きの配列と見なされる。

>Unknown-1
NNNNNNNNANNNCCCTCACTAAAGGGAACAAAAGCTGGAGCTCCACCGCGGTGGCGGCCGCTCTAGAACT
AGTGGATCCCCCGGGCTGCAGGAATTCGATATCAAGCTTCGCACGGTTTTGCCAGCATTCAGACGCTCAA
GCACACGGTTTTCAAAGGCCTGGGTTTGTTCCATTGTTGCCTGCATATCTGACAATCTGTTATTCGGGCG
CAGGGTGTCCTGCGCCTGGTCCACCATTATTGCATTGCTTTATAAGCGGTTACCGCCTCGGATACAACCT
CGCTGTTGGCATCAAGACCGGAAATCTGTGCCAGCGCCGCCTGCGGACCTTTGTCAGCGATCAGTGCTGC
CAGTTCCTGAGCCTGCGGATCATCTTCACTGCGGAAGTGCATTGCAGCGGCAATACCTTCAATCAGGTTT
TTATGTGGCAGACCATATTCCAGCGTACCGAGCAGTGGCTTGATCAGACGGTCGCCAGCACTCAGTTTAC
GCAGTGGCTGACGGCCTACGCGCTCTACATCATCTTTCAGATACGGGTTCTCAAAACGGCCGAGAATTTT
CTGGATGTACGCCGCATGCTTGTCAGCGTCAAAGCCGTAGCGCTTGATCAATACTGCACCACTTTCTTCC
ATCGCACCTTTTACCACCGCGCGGATTTTCTCGTCGAGAATCGCGTCACGAATGGTCTGATGACCGGCCA
GTTTTCCGAGGTACGCGGTTATAGCATGACCCGTGTTCAGGGTGAAGAGTTTACGTTCGACAAATGNCAT
CAGGTTGTCGGTTAACTCCATGCCTGGGATGTTCGGCAGTGCGCCTTTGAACTGCGTTTTATCGACAATC
CATTCGCTGAANGTTTCTACCGTCACTTNCAGCGGATCGTTAGTTGCCGAAGCCCGAANGNGGTACGATG
CGGTCAACGGCGGGAATCGACAAAGCCAACGTGTTCTTCTACCCACGCTTTGGCGNCCTTCCNGGCAGGG
CGTTCATCACATGNNNTTCAGCTGNNNNNNNCCGCGTACNATGTTTNNCCNGGNNATGATGTNCAGCGGG
ATNNNTNCCTTGNTCTTNNNTTNNCNNNNNNNNNNNANNGCGNNNNNNNNNNNNNNNANNGNNNAANNGN
GNANNGNNNTAANNNANCNCNNNNNNNN

注）2行目中央にHindIII認識部位（AAGCTT）がある。この配列から以降はインサートDNA由来である。配列の終わりに近づくと未決定塩基（確定できない塩基：Ｎで表示）が頻繁にあらわれ、不正確な配列が含まれていることが分かる。場合によっては、波形データと照合しても塩基を確定できないこともある。

1.　DNA塩基配列データの処理

（１）前処理

１.	ワードプロセッサ（例えばMS-Word）やエディタで塩基配列データを開く。
２.	波形データがある場合は、各塩基のピークが明確に判定できない部分を削除する。特に始めの部分には、蛍光基質の残存が原因と思われる判別不可能な蛍光シグナルのピークが認められる場合があるので、この部分に相当する塩基配列データを削除する。今回はNが見られる部分までを削除する。
３.	波形データの読み取り不能な残基（Nと表示される）が現れたら、それ以降のデータを削除する。明らかに各塩基のピークが不明瞭になり始める部分を探し出す。そのような部分から以降の塩基配列は信頼性が低いので削除する。今回はNが見られ始めた部分以降の配列を削除する。
４.	編集した塩基配列データを、新規文書ファイルとして各自のディスク領域に保存しておく。

（２）ベクター配列の除去

クローニングベクターpBluescript SK+の説明（廃番となったため後継のpBluescript IIの説明）は、下記アドレスにある。

https://www.chem-agilent.com/contents.php?id=300267

配列は以下のアドレスから入手可能

https://www.addgene.org/vector-database/1951/

配布された塩基配列データ（Accession number: X52328）は、pBluescript SK+（またはpBS SK+）の一部から始まり、クローン化に用いた制限酵素の認識部位が現れる。それ以降はクローン化したDNA断片の塩基配列である。ベクターとクローン化したDNA断片の配列を区別する必要があるので、まず、HindIII 制限酵素認識部位（制限サイト）を、実際に目で探してみる。次に、この検索を下記のWWWブラウザ上のプログラムを利用して行う。

　　http://tools.neb.com/NEBcutter2/index.php

配布された塩基配列データのベクター配列が、公開されているベクター配列と一致しているかどうかをまず確認する。次に、クローニングに用いられた制限酵素認識部位を見い出す。挿入断片の配列情報は、このクローニングサイトから数百塩基である

2. データベースを利用した塩基配列の相同性検索

　ある配列が、データベースに登録されている配列と相同性をもつかどうかは、相同性検索プログラムを用いて調べることができる。最も一般的に用いられる検索アルゴリズムはBLAST (Basic Local Alignment Search Tool)とFASTAの２種である。BLASTは局所的に高い類似性を有するものを高速に検索するときに使う。FASTAはW. Pearsonによって開発されたプログラムで、はじめに文字のよく一致する領域を高速に検索し、最終的にはギャップを入れた完全なアライメントを行なう方式をとる。FASTAは、低い全体的相同性を検出できるという特性を持っているため、長い範囲で配列の類似性を保っているものを検索するときに使われる。今回はBLASTを用いて未知配列の相同性検索を行い、その由来を明らかにする。いくつかのウェブサイトでBLAST検索用のページが公開されている。まず、次のサイトを見て、説明を読むこと。

BLASTの解説	https://www.ncbi.nlm.nih.gov/books/NBK153387/
BLASTの日本語概説	http://www.ddbj.nig.ac.jp/search/archives/blast_doc-j.html
BLAST質問集 (FAQ)	http://www.ddbj.nig.ac.jp/search/help/blasthelp-j.htmll

　今回は、下記の３種類のサイトから１つを選んで、BLASTプログラムを利用する。説明は下記のウェブサイトにあるので各自読むこと。

(1)	http://www.ncbi.nlm.nih.gov/blast	英語	米国National Center for Biotechnology Information “Nucleotide”の中の”Nucleotide-nucleotide BLAST (blastn)”を利用する。
(2)	http://blast.ddbj.nig.ac.jp/blastn?lang=ja	英語/日本語	日本DNAデータバンク
(3)	http://blast.genome.jp	英語	ゲノムネット（京都大学化学研究所バイオインフォマティクスセンター）

使用プログラムは、まず「blastn」(nucleotide blast)を使用する。検索結果を、新規テキスト文書として名前を付けて保存する。次に、使用プログラムを「blastx」に変更して検索する。結果をblastnの場合と同様に保存する。

注）「blastn」、「blastx」のどちらを用いるかで検索に用いるデータベース（塩基配列 or アミノ酸配列？）が異なる。また、生物種などで区分したサブデータベースもいくつかあるが、今回は「nr (non-redundant)」や「全DNA／アミノ酸」といった包括的なものを選択すること。

3.　BLAST検索結果の見方

サイトによって多少の違いはあるが、データベース検索の結果はほぼ次のようになる。

　
Description | Max score	Total score | Query cover | E value | Ident | Accession
Escherichia coli str. K-12 substr. MDS42 DNA, complete genome	771	771	90%	0.0	95%	AP012306.1
Escherichia coli DH1 (ME8569) DNA, complete genome		771	771	90%	0.0	95%	AP012030.1
Escherichia coli DH1, complete genome				771	771	90%	0.0	95%	CP001637.1
Escherichia coli BW2952, complete genome			771	771	90%	0.0	95%	CP001396.1
Escherichia coli str. K12 substr. DH10B, complete genome	771	771	90%	0.0	95%	CP000948.1
Escherichia coli str. K12 substr. W3110 DNA, complete genome	771	771	90%	0.0	95%	AP009048.1
Escherichia coli str. K-12 substr. MG1655, complete genome	771	771	90%	0.0	95%	U00096.2
Escherichia coli K-12 chromosomal region from 92.8 to 00.1 	771	771	90%	0.0	95%	U14003.1
E. coli genes rpsF, rpsR and rplI for ribosomal proteins 	734	734	86%	0.0	95%	X04022.1
Shigella sonnei 53G main chromosome, complete genome		732	732	90%	0.0	94%	HE616528.1
Escherichia coli O103:H2 str. 12009 DNA, complete genome	732	732	90%	0.0	94%	AP010958.1
Escherichia coli E24377A, complete genome			732	732	90%	0.0	94%	CP000800.1
 　・
 　・
 　・

スコアとは「２つの配列を並べて同じ位置に同じ残基があれば正の値、違えば負の値を与えて合計した点」で、高い値であれば、相同性が高い。期待値とは「現在のデータベースにおいて、全く偶然に同じスコアになる配列の数の期待値」である。E-Valueが小さいほど偶然には起こり得ないことを示す。

　従って、スコア値が大きく、期待値が小さい場合には、その配列間の相同性は高いと言える。有意な相同性を示した配列については、配列のアライメントを調べ、どの部分で相同性が高いのかを確認する。その部分のQueryとSubjectの配列について、各々の両端に表示された数値（塩基番号）を記録しておく。次に、最も高い相同性を示した配列（今回はDH10B株）について，accession番号をクリックすることで詳細な情報を得る。

4.　自分がクローン化した配列はどこから由来したのか？

　前述のBLAST検索サイトで得られた結果の中で、相同性を示した相手の配列の”accession | locus”の部分をクリックすれば，その配列に関する詳しい情報（生物種、遺伝子名、研究者、文献等）が得られる。また、スコアをクリックすると，２本の配列を比較した図（アラインメント）が表示される。アラインメントの中で，相同性を示した相手の配列（Subject）の初めと終わりの塩基番号をノートに控えておき，その塩基番号を頼りに登録済みのデータ内での相同領域の位置を推定することができる。　

配列解析アプリケーション

　EMBOSSアプリケーションを使うと、塩基配列の翻訳、制限酵素認識部位検索、相補鎖変換ツール、分子質量推定（それぞれ”transeq”、”remap”、”revseq”, “pepstat” ）をはじめ、様々な塩基配列、アミノ酸配列の解析を行うことができる。

5.　レポート課題

　１０月２4日＜課題１＞

１.	今回クローン化した大腸菌染色体の断片は、大腸菌のゲノム上のどこから由来したのでしょうか？　シーケンス結果をこのリンク先からコピーして下さい。（残念ながら配列を読めなかった班は、このページの最後に表示してある配列のどれかを用いて解析を行って下さい。）プラスミドの挿入断片の両末端は，制限酵素HindIII の認識部位（ＡＡＧＣＴＴ）だと考えられます。その２カ所の認識部位とタンパク質コード領域（Open Reading Frame: ORF）との位置関係を図示し、タンパク質コード領域の翻訳開始コドンと終止コドンを記入します。ATGでない翻訳開始コドンや，TAAでない翻訳終止コドンもありますから注意しましょう。
２.	その配列に既知の遺伝子は存在しましたか？　また、その遺伝子の両隣にはどのような遺伝子が存在していますか、オペロンを形成していますか．どのような遺伝子構成になっていますか、図示して，さらに文章で説明します。
３.	遺伝子が見つかれば、その遺伝子産物の機能について調べます。特に、遺伝子の機能について記載した文献を調べます。文献にたどりつくには、文献検索プログラムやオンラインジャーナル（下表参照）を利用すると良いです。

　１０月２4日＜課題２＞

今回は、改変GFPタンパク質をコードするBamHI断片をベクターSK+にクローン化してもらいました

１.	テキストp.21の配列(accession number: AB289768)を利用して、大腸菌で生成するsGFPタンパク質のアミノ酸配列をレポートにまとめて提出して下さい。BamHIサイトで連結したことで融合タンパク質が大腸菌で生成するが、元のGFPタンパク質には無かった部分が分かるように太字で示して下さい。核酸配列からアミノ酸配列への変換は，下記のサイトでできます。 ●　“http://www.bioinformatics.nl/emboss-explorer/　の「transeq」を利用します。 ●　http://bio.lundberg.gu.se/edu/translat.html ●　http://arbl.cvmbs.colostate.edu/molkit/translate/ 今回配付されたGFP遺伝子断片のコードするアミノ酸配列は、Accession番号AB289768に説明があります。CDS 7557..8276の行を見ると、/product=”synthetic green fluorescent protein”とあります。
２.	研究対象生物に適応させた様々な改変 GFP が使用されています。クラミドモナスの研究で使われる CrGFP (DQ000653) もその一つです。ClustalW を用いて（下記参照）、オワンクラゲ（Aequorea victoria）由来の野生型 GFP タンパク質 (L29345) の塩基配列と比較し，どのような配列変更がなされているか調べましょう。
３.	他にも蛍光特性等を変えた改変 GFP が数多く使われています。今回の sGFP 以外にも、蛍光強度と熱安定性を上げた EGFP (AAB02576)，蛍光特性を改変したEYFP (AAG34036)，Citrine (AAV97899)，CFP (ABU48526)，蛍光発色団形成（maturationという）の速度が格段に上昇した superfolder GFP (ADW83736)、およびサンゴ由来の DsRed (Q9U6Y8) のアミノ酸配列を、オワンクラゲ由来の野生型 GFP タンパク質 (AAA58246) と比較して、実際にどのアミノ酸残基が異なるのかを調べましょう。どのアミノ酸の置換が蛍光特性やmaturation速度に影響を与えているのか考察しましょう（この文献を参照）。さらにアミノ酸配列を用いて分子系統樹を書きましょう。複数の配列を比較するためのプログラムが「ClustalW」です。下記のアドレスから利用できます。対象の複数の配列を FASTA 形式で入力します。検索開始前に，アミノ酸配列か DNA 配列の選択を忘れずに行なって下さい。http://www.genome.jp/tools/clustalw/

＜補足学習＞　遺伝子工学に利用されるプラスミド等の基本的情報の取得

　本実習では、P1-B1系の規制に則り，大腸菌宿主ベクター系を用いて遺伝子のクローン化を行います。この際に利用するベクタープラスミドの性質や塩基配列情報を理解しておくことが重要です。

＜準備＞
今回使用するクローニングベクター「pBluescript SK+」（pBS-SK+と省略する）は，旧Stratagene（ストラタジーン）社が開発し，アジレント・テクノロジー社が「In vitro RNA 転写/高解像度制限酵素サイトマップの作成」用に販売していたプラスミドです。PhageとPlasmidの両方の性質を持つので，Phagemidとメーカーでは記載しています。その第二世代のpBluescript II SK+については、アジレント社のホームページから詳しい説明書が入手可能です。ただし，pBluescript SK+とは構造が少し異なるので注意して下さい。また，pBS−SK＋の全塩基配列はNCBI/DDBJ/EMBLデータベースにAccession 番号X52325で登録されていますから，検索して配列を取得して下さい。

＜課題１＞
SK+プラスミドDNA上には，抗生物質耐性遺伝子（アンピシリン耐性遺伝子＝βラクタマーゼ遺伝子），ラクトース分解酵素遺伝子の一部（αフラグメントをコードする遺伝子：lacZ’），大腸菌での複製に必要な複製開始点２種類（ColE1系Ori=pUC系Oriと，f1ファージOri），マルチクローニングサイト（Multi Cloning Site, KpnI-***-HindIII-***-BamHI-***-SacI），があります。タンパク質をコードする遺伝子については，その翻訳開始コドン，終止コドンの位置を答えなさい。また，それぞれについて説明しなさい。

＜課題２＞
ラクトースオペロンの発現制御，α相補（αコンプリメンテーション）を理解しておく必要があります。宿主として用いる大腸菌DH5αの遺伝子型は，F－ φ80lacZΔM15 Δ(lacZYA-argF)U169 deoR recA1 endA1 hsdR17(rK －,mK ＋) phoA supE44 λ－ thi -1 gyrA96 relA1　です。α相補に必要な性質はどの遺伝子型に依存しているのか説明しなさい。

＜課題３＞
実験で使用するGFP遺伝子断片は，制限酵素BamHIで切断されたDNAです。テキストの解説を読み，その正確なサイズが何ベースペア（bp）であるか，答えなさい。制限酵素に関しては，タカラバイオのURLから，「制限酵素の使用に際して」，「制限酵素の活性の定義，純度検定，保存，添付バッファーについて」，「Universal Bufferによる制限酵素活性表示システム」の３ヶ所は良く読んでおきましょう。（配布するカタログにも記載されています）。

＜課題４＞
T4 DNAリガーゼは，２段階の反応を触媒してDNA同士を連結する酵素ですが，反応効率を上げるために通常のバッファー（終濃度として，66mM Tris-HCl pH7.6, 6.6mMMgCl2, 10mM DTT, 0.1mM ATP）に，次の薬品を添加します。終濃度として，10% PEG 6000ならびに200 mM NaClとなるように添加します。何故，このような添加をすると反応効率が上昇するのか説明しなさい。なお，下記の論文「Hayashi et al. Nucleic Acids Res. 13(9):3261-3271 (1985)」で詳しく検討されているので，参考にして下さい。また，T4 DNAリガーゼが，大腸菌DNAリガーゼと違う点について説明しなさい。配布するカタログなどに説明があります。

＜課題５＞
配布されるGFP遺伝子断片が，ある方向でSK+と連結されると，融合タンパク質が大腸菌で発現されますが，そのアミノ酸配列を答えなさい。

（補足）大腸菌DH10Bの遺伝子型：F－ mcrA Δ(mrr-hsd RMS-mcr BC) φ80lacZΔM15 ΔlacX74 recA1 endA1 araD139 Δ(ara, leu)7697 galU galK λ－ rpsL nupG

6.　文献情報の利用

配列に直接関連した文献ならば、まず、NCBIの文献データベースで、著者、キーワード、アクセション番号について検索する。
生物学全般についての文献は、まず、京大農学部図書室のホームページにアクセスし、「WebSPIRS」を利用すると良い（ログインの方法は講義で解説）。

また、下記のオンラインジャーナルが利用できる。

京都大学図書館オンラインジャーナル	edb.kulib.kyoto-u.ac.jp/gakunaiej.html
京都大学医学部図書室	www.lib.med.kyoto-u.ac.jp

（その他参考になるURL）

NCBI	配列データベースの本家本元（アメリカ）。各種解析ツールも充実。
EMBL-EBI	ヨーロッパの配列データベース。各種ゲノム情報に対して独自の統合データベースサービスを提供。
日本DNAデータバンク	NCBI、EMBL-EBIに並ぶ日本の配列データベース。
かずさDNA研究所	千葉県が世界に誇るゲノム研究所。シロイヌナズナのゲノム解析などで多大なる貢献。
The Sanger Institute	Dideoxy法（Sanger法）の生みの親Sangerにちなむゲノム研究所（イギリス）。ヒトの他、マウスなどのモデル生物のゲノム解析の老舗。
J. Craig Ventor Institute	微生物ゲノム解析が顕著。その他動物・植物など幅広く手がけている。旧 The Institute for Genomic Research (TIGR)。
ゲノムネット	一般的な配列データベースの他、ゲノム解析によって得られた情報を細胞機能に関連づけた独自のデータベースKEGG (Kyoto Encyclopedia of Genes and Genomes) を提供。
大腸菌サイト	About PEC – PEC (Profiling of E.coli Chromosome)
分子生物学研究用ツール集	分子生物学関連データベース、配列解析ツールなどの網羅的コレクション。
Webラーニングプラザ	「ライフサイエンス」の解説アニメーションは一見の価値あり。

（参考書籍）

書　　名	著　　者	ISBN
バイオデータベースとウェブツールの手とり足とり活用法今日からできるバイオインフォマティクスはじめの一歩	中村保一、礒合　敦、石川　淳／編	4-89706-357-4
初心者でもわかる！バイオインフォマティクス入門－やさしいUNIX操作から遺伝子・タンパク質解析まで－	坊農秀雅／著	4-89706-290-X
実践　バイオインフォマティクス	Cynthia Gibas, Per Jambeck／著水島　洋／監訳	4-87311-068-8

＜予備配列＞

>26_1.seq
NNNNNNNANNNNNNCCTTCACTAAAGGGAACAAAAGCTGGAGCTCCACCGCGGTGGCGGCCGCTCTAGAACTAGTGGATC
CCCCGGGCTGCAGGAATTCGATATCAAGCTTTTGCTATCCTTGCGCCCCGATTAAACGGATAAGAGTCATTATGCAATCC
TGGTATTTACTGTACTGCAAGCGCGGGCAACTTCAACGTGCCCAGGAACACCTCGAAAGACAGGCTGTGAATTGCCTGGC
ACCGATGATCACCCTGGAAAAAATCGTGCGTGGAAAACGTACTGCAGTCAGTGAGCCATTGTTCCCCAACTACCTGTTTG
TGGAATTTGACCCAGAAGTGATTCATACCACGACTATCAACGCGACCCGCGGTGTCAGCCACTTCGTGCGCTTTGGCGCG
TCGCCAGCGATAGTCCCATCGGCGGTTATTCATCAGCTATCGGTATATAAACCGAAAGACATTGTCGATCCGGCAACCCC
TTATCCGGGTGATAAGGTGATTATTACCGAAGGCGCGTTCGAAGGCTTTCAGGCCATTTTCACCGAACCCGATGGTGAGG
CTCGCTCCATGCTATTGCTTAATCTTATTAATAAAGAGATTAAGCACAGTGTGAAGAATACCGAGTTCCGCAAACTCTAA
AACGCAATCCCAAACAGTGTTTTGACATTAGCATCCGTGGTGGCAGCCAGCCATGCGGCATCTTCTCCACGCCAGTGCGC
AATACGTTGCAAAATATGGGGCAGATGGGCTGGCTCGTTGCGCCGGGATGATGGCTTTGGCGTGAGATCGCGAGGGAGCA
GATACGGCGCATCAGTTTCGATCAGTAATTTTTCCGCCGGAATCAACGGCAAAAGTTCCCGCAGCTCCAGTCCGCGTCGT
TCATCGCAAACCCAANCCGGTAATGCCGATATAAATTNCCATGCGCCACGCACGCCTGCATCTCNTCNCGTGNGCNGGTA
AAGCANNNNNNNNANCAGGCANTTATNCANCNCNGCTCNNNNATGNCATAAANNNTCNNGGNNTCNCGNCAGNGCATNAN
TNCNGGCANNTTNAANNNTGNCNGGNNNNNGNNNNNNNNNNNNNNNNNNNTNCNNNNNNNTCNNNGNNNNNNAANNNN

>26_2.seq
NNNNNNNNNNNNNNCNCNTCACTNNNGGGAACAAAAGCTGGAGCTCCACCGCGGTGGCGGCCGCTCTAGAACTAGTGGAT
CCCCCGGGCTGCAGGAATTCGATATCAAGCTTTATGACGCCACCATTAACCACTATCCACCAACCGAAAGATGAACTGGG
GGAGCTGGCGATTGATGTACTCATCCATCGGATAACCCAGCCGACCCTTCAGCAACAACGATTACAACTTACTCCGATTC
TGATGGAACGCGGTTCGGCTTAGATTTACGCTGTCTTTTGATCAAATTATTACCATCGGTTGTTTTCAGAAGCATGAACA
TTGCTGCTGAAGCAACAGTAATAATGCCCATTGTGATAAACGTATAGTGGAATTGTTCGACAGTCGTTGTGCCTTCCATT
CCTTCATAAACGCGAAGGACGGCCGCACTTACAGCAACGCCTAAACTAATCGACAGTTGCTGCGTGACCGCCAGAACACT
GTTACCGCTGCTGGCATTGTCATCGGTCAGATCGGCAAGTGTGATGGTATTCATCGCGGTAAACTGCGTCGACATAGCCA
TCCCTAATATAAACAACGGCAAGATCAGCATCCATATAGCCATTGCTGGTGATTGCAAAGAGAACTGAGCGATCATTAGC
CCAATAATCACCGTGATCCCCACTAACGTATGGCGATAGCCCAGACGACGTAAGACTTGGGTAACCATCGATTTTGCAAT
AATGGAACCTAACGCTGTCGGTGCCATCATACAGCCAGCAATAAACGCCTGATAACCAAATCCTACCTGTAACATCAATG
GNATAAGGAACGGTACACAGCCGGTCCCCAGACGGGTTGCAATATTGCCTACGATACCGATCGAGAAAGTNGCGGGNTTT
AAATAATCTAATGAAATTNATGGGTTGGCGTGCGTCGTGCATGAGAANNATANAAGNAGCAGTANNNATGCTGGNGANAN
TACCGTCNNGNANTCNNNCTGNGANANCTTTTNCCCNANAGNTCTNNNNNNTNGNNANAGAANNNNNNTGNNGNNANNNG
CAAAANNCNGNGNNNNCNNNNNNNGNNNNNNNGNNNNNNNNNNNTNNNNNNNNNNNNNCNNNANNCNNNTGGNNNN

>26_3.seq
NNNNNNNNNNNACCCCTCACTAAAGGGAACAAAAGCTGGAGCTCCACCGCGGTGGCGGCCGCTCTAGAACTANGTGGATC
CCCCGGGCTGCAGGAATTCGATATCAAGCTTGTCGTGACGTGATCCGCAAAAACAATCTCACCAGCGCCTATATCCGTCC
GCTGATCTTCGTCGGTGATGTTGGCATGGGAGTAAACCCGCCAGCGGGATACTCAACCGACGTGATTATCGCTGCTTTCC
CGTGGGGAGCGTATCTGGGCGCAGAAGCGCTGGAGCAGGGGATCGATGCGATGGTTTCCTCCTGGAACCGCGCAGCACCA
AACACCATCCCGACGGCGGCAAAAGCCGGTGGTAACTACCTCTCTTCCCTGCTGGTGGGTAGCGAAGCGCGCCGCCACGG
TTATCAGGAAGGTATCGCGCTGGATGTGAACGGTTATATCTCTGAAGGCGCAGGCGAAAACCTGTTTGAAGTGAAAGATG
GTGTGCTGTTCACCCCACCGTTCACCTCCTCCGCGCTGCCGGGTATTACCCGTGATGCCATCATCAAACTGGCGAAAGAG
CTGGGAATTGAAGTACGTGAGCAGGTGCTGTCGCGCGAATCCCTGTACCTGGCGGATGAAGTGNTTATGTCCGGTACGGC
GGCAGAAATCACGCCAGTGCGCAGCGTAGACGGTATTCAGGTTGGCGAAGGCCGTTGTNGNCCGGTTACCAAACGCATTC
AGCAAGCTTCTTCGGCTCTTCACTGGCGAAANNANNANNATGGGGCTGGTTAGATCAGTTATCANAAATACAAAAAATGG
NNGGNNNNGCACCGTCCCATTACGAGANNNANNNNTGGNNAGNAATAAGNNTGCTANNACCGTNCCGCCNCCNNCCNNNN
NNNGNCGTANNTGGNNNNGNTNNNGNNNCTNNNGNNNNNCCNCNNNGACCGANNCCGATTTCNGNANCCGANNNNNCNNG
NNNNNANNNNGNTCNCCNNTTGNNCNGGNNNNNNCNATNNGNNNNGANNNCNGNAANNGNNNCNNANATNNNNNNNNGNN
NNNNNNNNNNNNNNANNCNTNNNNNGGNNNNGNNNTGNCNNGNNNNNGNNAGNNTTNTNNNNNNNNNNNNNNNNNANNNN
NNGGNNNNNNN

>26_5.seq
NNNNNNNNNNACCCTCACTAAAGGGANCAAAAGCTGGAGCTCCACCGCGGTGGCGGCCGCTCTAGAACTNGTGGATCCCC
CGGGCTGCAGGAATTCGATATCAAGCTTCTTTCATTCGCTGAAAGTGGAATGTATCCATGGAGAACACTTTATCAGCCGG
GAAATAATGCGGGCAACGGTGTTTAATTATATCGAATGTGATTACAATCGGTGGCGGCGGCACAGTTGGTGTGGCGGCCT
CAGTCCGGAACAATTTGAAAACAAGAACCTCGCTTAGGCCTGTGTCCATATTACGTGGGTAGGATCAGTCATCCCTTCGT
GGATCATTTTGACTGCCGCCTGCGCTATTCTGTTTTTTGGCGCGCTGGCGAGCTGAAATCGCTCTTTAAACCCGACTTCC
TGGGTCTCGGTTTCACTATTACCAGACATTATTTTCGCCGCACCGCCATGAAAGCGCGTAACCACGCCTTTTTGTTCGAG
AAAGCGCAAATCGGCACGGATTGTCGCTTCCGAGGCAGCAAATACTCCCGCCAGATCCTGAACAAGCACGGTTCCCTGTT
CATTCACTAATTGGATGATCTTATTCCTTCGCTCGAATGAATTCATCGTCATTTACCCATATTCAATTGTGGCTAGTGTA
AACGAAGGGGGACCATTGGTGAATGATCTGTTTTGCACAATACCGGGCCAGCATCACGCTGGCCCGCGGTTTCAGGGAAT
GAGCAACACTTTGCCCGGCATAGCATTACGAGCGATGTCACGCACCGCCTGGGCGAAGCTTATCGATACCGTCGACCTCG
AGGGGGGGGCCCGGTACCCAATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGGCCGTCGTTTTACAACGTCGTGAC
TGGGAAAACCCTGGNGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCNNCAGCTGGCGTANTAGCGAANAANG
NCCNCACCGATCGNCCNNNNNNNNTNGCGCANCCTGNATGNNGAATGNNNGCNNCCNNNNAGNNNNCNNNNNNNNNNNNN
NNNNNNNNACNNNCAGCNNNACNGNTNACNNNNNCNNNNNNNNNNNNNNNNNNNNNNNTNNTNCNNNNNNNNTTTNTN

>29.seq
GGCGAATTGGGTACCGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTTGCACATCGTCCATATTTCTGGCCTGGTG
GTTATTAATTTCAATGGCTGCCCATGTATTTGCACTTAGCAAAAGCACAGCCAGAAGGGCTAAAACACGACTGAACATAG
ATACCTCCTCGACGGCTGACTTTGTGTGCTCTCCTCTGTGATGATCTTCTGATTTAATTTTAATCAATGATAAAGAAGTT
GATGGTGACCATTTCTGATGCAGTTGTTCAAAAAAACACCATGATGAAGTGTGATGAACTTCAAATCAGCGTGTTAGAGG
TTAATTGCGAAAGGGGAGATTTATTTCGGCTCTGCCCTTGAGTTTAGCGAGGCATACAAGTACTATAACGCGTCATTTTT
CAGCCGACCTTTAACACGTTCCCTTGCCTCCCCCGGGAATTCCGGCTGACCCCAGAACAGGAGGGCCGAAATAAATCCGT
AAAGGAGCCAAATCGGATGGCCGTCATTACNGAANCCGTTTTAAGGGCCCAACCNGGACCAGANGNGANN

原文作製：福澤　秀哉（生命科学研究科　統合生命科学専攻　元遺伝子特性学分野准教授　　前　微生物細胞機構学分野　教授）

以上。

このページのトップに戻る

1.9.1 データベースを利用した塩基配列の解析

1. DNA塩基配列データの処理

2. データベースを利用した塩基配列の相同性検索

3. BLAST検索結果の見方

4. 自分がクローン化した配列はどこから由来したのか？

5. レポート課題

＜補足学習＞ 遺伝子工学に利用されるプラスミド等の基本的情報の取得