Blast本地化詳細(xì)作業(yè)流程.doc
《Blast本地化詳細(xì)作業(yè)流程.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《Blast本地化詳細(xì)作業(yè)流程.doc(9頁(yè)珍藏版)》請(qǐng)?jiān)趨R文網(wǎng)上搜索。
1、Blast 2.4.0+當(dāng)?shù)鼗唧w步驟(基于Windows系統(tǒng))1. 程序取得。從NCBI上下載Blast當(dāng)?shù)鼗绦?,下載地址: ftp:/ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/64安裝版64解壓(綠色)版最好安裝或解壓到X盤(pán)根目錄:如X:blast,盡可能簡(jiǎn)短,方便后邊命令輸入。2. 原始序列取得。方法1:找到轉(zhuǎn)錄組測(cè)序數(shù)據(jù)unigene數(shù)據(jù)庫(kù)文件:unigene.fasta或unigene.fa,若為unigene.fa則直接改后綴為.fasta即可。找到或修改后將數(shù)據(jù)庫(kù)文件移動(dòng)至Blast當(dāng)?shù)鼗绦蚰夸洝癤:blastb
2、in”。方法2:從NCBI中 ftp 庫(kù)下載所需要庫(kù),鏈ftp:/ftp.ncbi.nlm.nih.gov/blast/db/FASTA/,其中nr.gz為非冗余數(shù)據(jù)庫(kù),nt.gz為核酸數(shù)據(jù)庫(kù),month.nt.gz為最近30天核酸序列數(shù)據(jù)。下載month.nt.gz先用WINRAR解壓縮,然后用makeblastdb.exe格式化。方法3:利用新版blast自帶update_blastdb.pl進(jìn)行下載,這需要安裝perl程序。注釋?zhuān)荷鲜鋈N方法各有優(yōu)缺點(diǎn),前兩種下載速度較快,不過(guò)每次進(jìn)行檢索全部需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行格式化(轉(zhuǎn)化成二進(jìn)制數(shù)據(jù)),第三種方法下載速度較慢,不過(guò)NCBI 中已經(jīng)格式化好
3、,在進(jìn)行當(dāng)?shù)貦z索時(shí)不需再進(jìn)行格式化,直接用即可。3. 用文本編輯器(txt文件更名字及后綴)創(chuàng)建一個(gè)ncbi.ini文件,文件包含下面內(nèi)容:NCBIData=C:blastdata 先新建TXT文件,然后改屬性,將ncbi.ini文件存放到C:Windows 4. 將Blast當(dāng)?shù)鼗绦蚰夸浱砑勇窂街校ㄔ摬襟E非必需,但會(huì)給以后操作帶來(lái)方便),方法:a) 右擊我電腦選擇屬性,選擇高級(jí),點(diǎn)擊環(huán)境變量,設(shè)置環(huán)境變量b) 系統(tǒng)變量中,選擇Path,點(diǎn)擊“編輯”,在變量值后面添加Blast當(dāng)?shù)鼗绦蛩诼窂?,E:blast 點(diǎn)擊確定,將安裝路徑添加到path。5. 運(yùn)行MS-DOC。打開(kāi)DOC窗口(點(diǎn)擊
4、開(kāi)始,選擇運(yùn)行,打開(kāi)輸入框中輸入“CMD”,確定),訪問(wèn)Blast當(dāng)?shù)鼗绦蛩谖募A,依次輸入:(1)X: 回車(chē);(2)cd blastbin,回車(chē)。6. 數(shù)據(jù)初始化。下載得到數(shù)據(jù)庫(kù)為fasta格式,需要經(jīng)過(guò)格式轉(zhuǎn)化才能建立當(dāng)?shù)財(cái)?shù)據(jù)庫(kù)。上接第5(2)步,回車(chē)后,輸入格式化數(shù)據(jù)庫(kù)命令:(右鍵可粘貼)makeblastdb.exe in xxx.fasta -parse_seqids -hash_index -dbtype prot,回車(chē),在原數(shù)據(jù)庫(kù)文件所在文件夾生成一系列文件,Blast當(dāng)?shù)鼗w系構(gòu)建完成。blast當(dāng)?shù)鼗頱last當(dāng)?shù)鼗笊晌募?shù)注釋?zhuān)?in參數(shù)后面接將要格式化數(shù)據(jù)庫(kù)
5、;-parse_seqids,-hash_index兩個(gè)參數(shù)通常全部帶上,關(guān)鍵是為blastdbcmd取子序列時(shí)使用,-dbtype后接所格式化序列類(lèi)型,核酸用 nucl,蛋白質(zhì)用prot。7. 待比對(duì)文件建立。在blastbin文件夾創(chuàng)建test.txt文件,將需要blast序列以fasta格式存于該文件中,文件名自己命名即可,這里以test為例。建立fasta文件注意事項(xiàng)請(qǐng)查看附件1。若有NCBI上下載好.fasta文件,直接放到blastbin文件夾即可。test.fasta格式文件制作8. 當(dāng)?shù)谺last比對(duì)。上接第6步,在MS-DOS窗口輸入比對(duì)命令:blastn.exe -task
6、 blastn -query test.fasta -db xxx.fasta -out text.txt,稍等片刻,Blast結(jié)果即存于系統(tǒng)自動(dòng)生成out.txt文件中。blastn.exe -task blastn -query RefGene.txt -db Stellera.Unigene.fasta -out RefGene(test).txt -evalue 1e-5 -num_threads 8參數(shù)注釋?zhuān)篵lastn.exe為程序?qū)嵤┟?,程序依?jù)自己需要而blastn,blatp,tblastx;-task后面選擇你所要用程序blastn,blatp,tblastx等;-que
7、ry后接查詢序列文件名稱(chēng);-db后接格式化好數(shù)據(jù)庫(kù)名稱(chēng);-out后接輸出文件名稱(chēng)及格式。by malapidan.08.24附件1 FASTA格式說(shuō)明1. 構(gòu)建FASTA格式文件全部TEST序列輸入必需是FASTA格式,所謂FASTA是指DNA 序列第一行開(kāi)始于一個(gè)標(biāo)識(shí)符:,緊接著(沒(méi)有空格)是對(duì)該序列唯一描述(即ID),然后一個(gè)空格,接著是對(duì)該序列描述(也能夠沒(méi)有),從第二行開(kāi)始就是一行行序列,中間空格,換行沒(méi)有影響。為了方便閱讀,每一行序列最好不要超出80個(gè)字母。 下面是FASTA格式示例:Mus_AQP11 mRNA for aquaporin 11, complete cdsGCGGT
- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
8 積分
下載 | 加入VIP,下載共享資源 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- Blast 本地化 詳細(xì) 作業(yè) 流程