亚洲精品乱码久久久久久蜜桃动漫_毛片aaaaaaa_色中色av_日本午夜免A费看大片中文4_中国精品18videosex性中国_亚洲欧美日韩中文字幕二

Welcome!

This community is for professionals and enthusiasts of our products and services. Share and discuss the best content and new marketing ideas, build your professional profile and become a better marketer together.

0

Geneious中使用NGS數(shù)據(jù)執(zhí)行映射Mapping和SNP調(diào)用

提供于
Johnson
18-5-20 下午1:17 ? 7,953 瀏覽次數(shù)
  • Flag
這個(gè)問題已經(jīng)包含在 官方文檔.

0

Johnson

--Johnson--
北京沫之東生物技術(shù)有限公司
http://www.coreab.cn
2582
| 3 1 2
中國
--Johnson--
Johnson
18-5-20 下午1:18

基于機(jī)器學(xué)習(xí)翻譯,僅供參考

在本教程中,您將學(xué)習(xí)如何使用新一代測序(NGS)數(shù)據(jù)執(zhí)行參考裝配,并在組裝的重疊群上調(diào)用SNP。您將了解NGS工作流程的典型步驟,如質(zhì)量修整,讀取配對和生成共識序列。

練習(xí)1:準(zhǔn)備數(shù)據(jù)

練習(xí)2:映射到參考

練習(xí)3:探索重疊群組文件

練習(xí)4:調(diào)用SNP

練習(xí)5:比較SNP

練習(xí)1:準(zhǔn)備數(shù)據(jù)

在本教程中,我們將使用Illumina序列讀數(shù)的數(shù)據(jù)集來映射到大腸桿菌基因組中的單個(gè)基因在這個(gè)練習(xí)中,我們將通過修剪質(zhì)量差的基地來準(zhǔn)備繪圖數(shù)據(jù)。

閱讀配對

大多數(shù)新一代測序平臺,如Illumina,Solid,Ion Torrent和454都提供了雙端測序的選項(xiàng)。這會從相同的DNA片段產(chǎn)生兩個(gè)序列讀數(shù),這些片段被已知的插入片段長度分開,這有助于數(shù)據(jù)的組裝。配對的最終數(shù)據(jù)集通常包含兩個(gè)序列文件,一個(gè)包含正向讀取,另一個(gè)包含反向讀取。通過選擇兩個(gè)文件并轉(zhuǎn)到序列→設(shè)置配對讀數(shù),然后選擇庫類型和插入大?。ㄓ赡男蛄刑峁┱咛峁?,可以在Geneious中配對讀數(shù)。在本教程中,此步驟已完成,并且您提供了一對配對讀取文件,插入大小為500 bp。選擇yghJ配對的Illumina讀取文件,你會看到每個(gè)序列都標(biāo)有正向或反向標(biāo)簽。

修剪

在組裝之前,質(zhì)量差的數(shù)據(jù)應(yīng)該從讀取的末尾進(jìn)行修剪。選擇配對讀取文件后,轉(zhuǎn)到注釋和預(yù)測→修剪結(jié)束我們將使用默認(rèn)設(shè)置進(jìn)行修剪,因此單擊窗口左下角的Settings cog下面的Reset to Defaults?重置為默認(rèn)設(shè)置)(如果顯示為灰色,則默認(rèn)設(shè)置已經(jīng)加載)。

當(dāng)設(shè)置錯(cuò)誤概率限制時(shí),Geneious將使用修改后的Mott算法根據(jù)其質(zhì)量得分修剪從5`和3`末端的讀取。我們將使用默認(rèn)設(shè)置0.05。

點(diǎn)擊確定,你會看到粉紅色的“修剪”注釋已被添加到一些讀取。這表示已被修剪的質(zhì)量差的序列。雖然序列在修剪后的注釋上仍然可見,但它不會在裝配過程中使用,也不會用于任何下游分析,如SNP調(diào)用。

在繼續(xù)練習(xí)2之前單擊保存

練習(xí)2:映射到參考

按住Shift鍵,選擇修剪讀數(shù)文件和參考序列(yghJ CDS?)。點(diǎn)擊對齊/組裝→映射到參考,然后重置為默認(rèn)設(shè)置(如果尚未設(shè)置)。

在頂部數(shù)據(jù)面板中設(shè)置裝配的參考序列。Geneious將猜測您選擇的哪個(gè)序列是參考,但您可以使用下拉菜單更改此參數(shù)。在這種情況下,它已經(jīng)正確選擇,并且“yghJ CDS(發(fā)散參考)”應(yīng)該被顯示為參考序列。

請注意,在Geneious 8.1及更高版本中,在打開Map to Reference窗口之前,不需要預(yù)先選擇參考序列。相反,可以通過單擊安裝選項(xiàng)中選擇按鈕從數(shù)據(jù)庫中的任何文件夾中選擇它。

在“?方法”?面板中,確保選擇“Geneious”作為映射器這里提供了許多不同的映射算法,這些算法根據(jù)所組裝的數(shù)據(jù)類型具有不同的優(yōu)缺點(diǎn)。這里給出了可用的不同算法的簡要概述。

敏感性應(yīng)在中等靈敏度/快速設(shè)置。Geneious會根據(jù)數(shù)據(jù)集的大小自動選擇適當(dāng)?shù)拿舾卸取?/font>對于下一代測序,推薦使用中等或中低敏感度,因?yàn)槭褂酶哽`敏度需要很長時(shí)間,并且如果您有足夠的覆蓋率,則不太可能改善結(jié)果。微調(diào)選項(xiàng)可以提高的結(jié)果通過調(diào)心,除了參考序列讀取對方-設(shè)置此的“迭代5次”。

確保選中使用現(xiàn)有修剪區(qū)域,然后在結(jié)果面板選擇保存裝配報(bào)告保存重疊群。如果已選中,請取消選中“保存在子文件夾中”。您的Map to Reference選項(xiàng)現(xiàn)在應(yīng)該如下所示:

單擊確定運(yùn)行程序集 - 可能需要幾分鐘才能完成。

現(xiàn)在應(yīng)該在您的文檔表中創(chuàng)建兩個(gè)新文檔 - 重疊映射到引用的重疊文本和匯編報(bào)告。打開匯編報(bào)告,您將看到匯編了多少個(gè)讀段,花了多長時(shí)間,以及產(chǎn)生了多少contig。我們將在下一個(gè)練習(xí)中進(jìn)一步探討contig文件。

練習(xí)3:探索重疊群組文件

打開重疊群文檔(應(yīng)將其稱為“讀取裝配到y(tǒng)ghJ CDS”),以查看讀取如何映射到參考序列。序列查看器右側(cè)的“?高級設(shè)置”?選項(xiàng)卡下,確保選中“Vertically compress contig”。這將在水平行中顯示讀數(shù)。現(xiàn)在回到常規(guī)選項(xiàng)卡,并確保顏色設(shè)置為“成對距離”。通過此設(shè)置,您可以根據(jù)您在設(shè)置配對讀取時(shí)指定的插入大小,一目了然地查看您的配對讀取是否以預(yù)期距離分開映射。在這個(gè)重疊群中,您可以看到大部分讀數(shù)都是綠色的,這意味著它們大致與預(yù)期的插入大小一致。點(diǎn)擊插入尺寸查看序列查看器上方的標(biāo)簽,查看插入大小的實(shí)際分布。您可以看到大多數(shù)對映射的插入片段為450-500bp,接近預(yù)期的500bp大小。

切換回Contig視圖。在contig的頂部,您將看到一個(gè)共識序列。放大以便您可以看到序列基礎(chǔ)。這是只讀的共識,不包括參考序列。用于調(diào)用共識的設(shè)置在序列查看器右側(cè)的“顯示”選項(xiàng)卡下設(shè)置。由于這些讀數(shù)附有質(zhì)量分?jǐn)?shù),應(yīng)選擇最高質(zhì)量作為調(diào)用共有序列閾值。該設(shè)置計(jì)算了大多數(shù)人的共識,其中考慮了該位置每個(gè)基地的相對質(zhì)量分?jǐn)?shù)(有關(guān)更多信息,請參見Geneious用戶手冊)。

現(xiàn)在將閾值更改為“100% - 完全相同”。您應(yīng)該會看到許多不明確的基地出現(xiàn)在序列中。在這種設(shè)置下,即使讀數(shù)只有一個(gè)讀數(shù)包含不同的堿基,也會在讀數(shù)中有堿基混合的地方插入模糊的堿基。此設(shè)置應(yīng)用于繪制NGS數(shù)據(jù),因?yàn)樗鼤诠沧R序列中引入讀取錯(cuò)誤導(dǎo)致的模糊性,而不是真正的多態(tài)性。如果讀數(shù)沒有質(zhì)量得分,那么90-99%的閾值最適合確保只有真正的多態(tài)性在您的共有序列中顯示為含糊不清的堿基。將設(shè)置更改為95%以查看它如何影響歧義,然后將其更改回本教程其余部分的“最高質(zhì)量”。

在共識序列下方,您應(yīng)該能夠看到藍(lán)色覆蓋圖,如下面的屏幕截圖所示。如果看不到這一點(diǎn),請點(diǎn)擊序列查看器右側(cè)的圖表選項(xiàng)卡并啟用“顯示圖形”和“覆蓋率”。覆蓋圖顯示每個(gè)基地有多少個(gè)閱讀地圖,可用于評估地圖質(zhì)量。

Geneious有兩種工具可以讓您快速識別覆蓋率高或低的地區(qū):

  1. 圖表選項(xiàng)卡下,您可以突出顯示某個(gè)覆蓋范圍之上或之下的區(qū)域。選中“突出顯示上方”并將其設(shè)置為50.現(xiàn)在您應(yīng)該在涵蓋覆蓋范圍大于50的區(qū)域覆蓋圖中看到一個(gè)黃色條。
  2. 您可以通過轉(zhuǎn)到注釋和預(yù)測→查找低/高覆蓋率注釋覆蓋率較高或較低的區(qū)域

我們將使用第二個(gè)選項(xiàng)來注釋低覆蓋區(qū)域,以便在下一個(gè)練習(xí)中調(diào)用SNP時(shí)排除這些區(qū)域。選中查找覆蓋范圍下方的區(qū)域,然后從平均值= 2中選擇標(biāo)準(zhǔn)偏差選中兩個(gè)合并區(qū)域選項(xiàng)并取消選中高覆蓋率選項(xiàng)。點(diǎn)擊確定。您現(xiàn)在應(yīng)該可以在參考序列上看到覆蓋率注釋軌跡,該覆蓋率覆蓋率較低的區(qū)域中有注釋。單擊保存并在詢問您是否要將更改應(yīng)用于原始序列時(shí)選擇“是”。

練習(xí)4:調(diào)用SNP

We will now use the Geneious variant finder to find SNPs in our mapped data. Select the contig document and go to?Annotate and Predict → Find Variations/SNPs. Reset to the default settings using the Settings cog at the bottom left.

The options in the top (“Find Polymorphisms”) panel allow you to set the parameters for when SNPs are called, so that disagreements that result from sequencing errors are filtered out. We will use the default settings as they are normally appropriate for identifying real SNPs – if you want more information on these settings click the “?” button or mouse over the option.

確保檢查翻譯中多態(tài)性分析效果的選項(xiàng),并將默認(rèn)遺傳密碼更改為“細(xì)菌”。這使用我們的參考序列上的CDS注釋來確定我們的映射讀取的編碼序列,并計(jì)算觀察到的SNP是否會導(dǎo)致氨基酸序列發(fā)生變化。

保持其他選項(xiàng)不變,然后單擊確定

您現(xiàn)在應(yīng)該可以看到添加到參考序列中的名為“Variants:yghJ paired Illumina reads”的注釋軌道。單擊保存并在詢問您是否要將更改應(yīng)用于原始序列時(shí)選擇“是”。這會將您的SNP曲目加載到原始參考文檔上。

沿contig文檔滾動到包含SNP注釋的位置(用垂直的黃色條表示)。將鼠標(biāo)懸停在注釋上,您將看到一個(gè)彈出窗口,其中包含有關(guān)該SNP的信息。這包括基礎(chǔ)變更,變異頻率,SNP類型以及有關(guān)蛋白質(zhì)和CDS變化的信息。

要在表格中顯示此信息,請單擊序列查看器上方的注釋選項(xiàng)卡。這將調(diào)出序列中所有注釋的表格。點(diǎn)擊Type?并選擇“Polymorphism”以僅顯示多態(tài)性注釋。該表應(yīng)自動顯示相關(guān)列,如多態(tài)性類型,變異頻率,氨基酸/密碼子/堿基改變等。要顯示更多列或刪除現(xiàn)有列,請單擊按鈕并添加/刪除所需的列。

一旦你的表格看起來像你想要的那樣,你可以通過點(diǎn)擊導(dǎo)出表格將它導(dǎo)出到電子表格。這將以逗號分隔(.csv)格式導(dǎo)出您的表格。

練習(xí)5:比較SNP

Geneious有一個(gè)比較批注功能,可以根據(jù)它們與另一個(gè)注釋軌道或注釋類型的重疊來過濾SNP。我們將使用此功能篩選出覆蓋率較低地區(qū)*的SNP。

在練習(xí)3中,我們創(chuàng)建了一個(gè)名為“覆蓋率”的注釋軌跡,以確定覆蓋范圍低于平均覆蓋率兩個(gè)標(biāo)準(zhǔn)偏差的區(qū)域。比較注釋將允許我們從屬于低覆蓋率注釋的Variants軌道中排除注釋。

選擇您的參考序列“yghJ CDS(發(fā)散參考)”?。這現(xiàn)在應(yīng)該有你在早期練習(xí)中創(chuàng)建的曲目。轉(zhuǎn)到注釋和預(yù)測→比較注釋。您可以在“注釋類型”面板中指定希望比較的注釋。對于Set A,選擇“Polymorphism”“在軌道變體:yghJ配對Illumina讀取”,并且對于集合B?在軌道上選擇“Low”覆蓋:yghJ配對Illumina讀取“。在比較下,取消選中名稱必須匹配,因?yàn)槎鄳B(tài)性和覆蓋率注釋具有不同的名稱。選中允許間隔與...部分匹配,因?yàn)檫@將返回多態(tài)性,例如部分位于低覆蓋率注釋中的indels。

根據(jù)結(jié)果??檢查AB?。這將返回與覆蓋注釋不重疊的多態(tài)注釋 - 右邊的維恩圖,“示例”面板以圖形方式顯示。窗口現(xiàn)在應(yīng)該如下圖所示。

點(diǎn)擊OK?,你現(xiàn)在應(yīng)該會在你的參考序列上看到第三條注釋軌跡,名為“Variants:yghJ配對的Illumina讀取 - 覆蓋率:yghJ配對Illumina讀取”。該軌道比原始變體軌道具有更少的多態(tài)性注釋。滾動到序列末尾有一個(gè)名為“1→44”的低覆蓋率注釋。您會看到,在低覆蓋率注釋下的原始變體軌道中存在大量多態(tài)性注釋,并且這些注釋已從新軌道中排除。

單擊保存將新軌道錄制到您的參考序列中。

*注意:為了在本教程中進(jìn)行演示,我們使用比較批注過濾了低覆蓋率的SNP。但是,您可以設(shè)置SNP查找程序來自動篩選出低覆蓋率的SNP,而無需執(zhí)行此步驟。為此,請檢查查找變體/ SNP?最小覆蓋率框,然后輸入要調(diào)用的SNP所需的最小覆蓋率。

恭喜,您現(xiàn)在已經(jīng)完成了Mapping和SNP調(diào)用教程。


隨時(shí)了解最新的技術(shù)快訊

關(guān)于這個(gè)技術(shù)問答社區(qū)

Geneious最新版生物信息學(xué)軟件相關(guān)的技術(shù)文檔、技術(shù)手冊、技術(shù)教程、技術(shù)資料分享和問答 閱讀指南

問題工具

1 關(guān)注者

統(tǒng)計(jì)數(shù)據(jù)

問: 18-5-20 下午1:17
看到: 7953 時(shí)間
最后更新: 18-5-20 下午1:19
主站蜘蛛池模板: 女神校花乳环调教 | 国产亚洲欧洲网友拍 | 欧美成人午夜免费全部完 | 嫩草影院黄 | 激情欧美网站 | 国内精品九九久久久精品 | 亚洲av产在线精品亚洲第一站 | 四虎国产精品永久免费网址 | 最新国产拍偷乱偷精品 | jizz老师喷水 | 一二三四在线观看免费高清中文在线观看 | 岛国在线无码免费观 | 人人综合亚洲无线码另类 | 亚洲精品AAA揭晓 | 最新黄色片 | 综合久久99| 欧美丰满熟妇乱XXXXX视频 | 四虎影视在线免费观看 | 人人看片人人看特色大片 | 特黄男女交性A片激情视频 免费SM羞辱调教视频在线观看 | 免费a级毛片无码a∨男男 | 中文字幕肉感巨大的乳专区 | 国产偷抇久久精品a片蜜臀a | 欧美精品乱码视频一二专区 | 国产精品久久午夜夜伦鲁鲁简爱 | 亚洲涩涩 | 极品嫩模高潮叫床 | 麻豆精品免费视频 | 日韩欧美精品在线 | 少妇高潮毛片免费看A片 | 人禽无码视频在线观看 | 一区二区三区国产精品保安 | 亚洲AV无码一区二区三区系列 | 日本中文不卡视频 | 免费国精产品—品二品 | 蜜芽国产尤物AV尤物在线看 | 少妇人妻偷人精品视频1出轨 | 欧美成人精精品一区二区三区 | 苍井空毛片精品久久久 | 麻豆传媒在线视频 | 99久久99久久免费精品 |