banner
ホームページ / ニュース / ViralCC は完全なウイルスゲノムとウイルスを取得します
ニュース

ViralCC は完全なウイルスゲノムとウイルスを取得します

Jun 04, 2024Jun 04, 2024

Nature Communications volume 14、記事番号: 502 (2023) この記事を引用

3725 アクセス

20 オルトメトリック

メトリクスの詳細

ハイスループットの染色体立体構造捕捉 (Hi-C) をメタゲノミクスに導入すると、微生物群集から高品質のメタゲノム構築ゲノム (MAG) を再構築できるようになります。 Hi-C コンタクト マップを使用した真核生物、細菌、および古細菌のゲノムの回収は最近進歩していますが、Hi-C ベースの方法のうちウイルス ゲノムを回収するように設計されたものはほとんどありません。 ここでは、完全なウイルスゲノムを回復し、Hi-C データを使用してウイルスと宿主のペアを検出するための公開ツールである ViralCC を紹介します。 他の Hi-C ベースの手法と比較して、ViralCC はウイルスと宿主の近接構造を Hi-C 相互作用の補完的な情報源として利用します。 人間の腸、牛の糞便、廃水など、いくつかの異なる微生物生態系からの模擬および実際のメタゲノム Hi-C データセットを使用して、ViralCC が既存の Hi-C ベースのビニング手法や最先端の​​ツールよりも優れていることを実証します。特にメタゲノムウイルスビニングに特化しています。 ViralCC は、微生物群集におけるウイルスおよびウイルスと宿主のペアの分類構造を明らかにすることもできます。 実際の廃水メタゲノム Hi-C データセットに適用すると、ViralCC はファージ - ホスト ネットワークを構築します。これは、CRISPR スペーサー分析を使用してさらに検証されます。 ViralCC は、https://github.com/dyxstat/ViralCC で入手できるオープンソース パイプラインです。

ウイルスは、地球上で最も多様で遍在する生物体であり、地球上の存在量は 1,031 1 と推定されています。ウイルスは、細菌や古細菌に感染する溶原性または溶解サイクルを通じて、微生物群集内の捕食者および/または寄生虫として生態系に多大な影響を与えます 2,3。 例えば、ウイルスは水生生息地における炭素と窒素の生物地球化学的循環に大きく寄与しており 4,5、人間の体内における炎症性腸疾患や重度の急性栄養失調などの特定の疾患に関与しているとされています 6,7。 したがって、ウイルスロミクスへの関心は過去 20 年間で劇的に高まっています。

実験室で伝統的に培養できるウイルスの数はウイルスの多様性を評価するにはあまりにも限られている8ため、培養に依存しないサンプリング戦略としてのメタゲノミクスは、ウイルスゲノムを回収し、これらの新しく発見されたウイルスの宿主を特定するために広く利用されてきました。これは、微生物群集におけるウイルスを研究する際の最も困難な側面の 1 つです9,10,11。 メタゲノム全ゲノムショットガンシークエンシング(WGS)は、さまざまな環境サンプルからゲノム断片を直接抽出し、多数のショートリードを生成し、その後コンティグに組み立てられます12、13、14。 次に、配列組成、配列類似性、および/またはウイルスタンパク質の検出に基づいて、大規模なアセンブリからメタゲノムウイルスコンティグが同定されます15、16、17。 しかし、ショットガンリードからウイルスゲノムを組み立てるのは困難であり 18、短いウイルスコンティグはウイルスゲノム全体のセグメントのみを表す可能性があります 19。 不完全なウイルス断片は、根底にあるウイルスの多様性と存在量の特徴付け、宿主と機能的能力の予測など、下流の分析に重大な悪影響を及ぼします20,21。 したがって、同じ種のウイルス コンティグをウイルスのメタゲノム構築ゲノム (vMAG) にグループ化するプロセスとして定義されるメタゲノム ウイルス ビニングは、特に巨大ウイルスの場合に価値があります 22。

従来のショットガンベースのビニングツールのほとんどは、真核生物、細菌、古細菌のゲノムを回収するために開発されており、普遍的なシングルコピー遺伝子の欠如や比較的小さいサイズのウイルスゲノムなど、ウイルスに関連する課題を無視しています。 。 さらに、微生物マーカー遺伝子分析を利用するこれらのビニング ツールはウイルスには適用できません 24、27、28。 CoCoNet29 と vRhyme30 は、メタゲノム ウイルス ビニングに特化した 2 つの既存の手法です。 CoCoNet は、サンプル間のウイルス コンティグの構成と共起の両方の特徴を使用してニューラル ネットワークをトレーニングし、2 つのウイルス コンティグが同じゲノムに由来する確率を予測します。 vRhyme は、単一または複数サンプルのカバレッジ効果サイズの比較を利用して、ウイルス コンティグ間のカバレッジの違いを計算します。 配列構成情報を処理するために、vRhyme はまず、ゲノム断片を使用して教師あり機械学習ベースの分類モデルを事前トレーニングします。 次に、2 つのウイルス コンティグ間のヌクレオチド特徴類似性ベクトルが分類モデルに入力され、ウイルス コンティグが同じゲノムに由来する確率値が予測されます。 最後に、vRhyme は重み付けされたネットワークを構築します。各ノードはウイルス コンティグであり、エッジの重みはカバレッジの差を確率値で割ることによって計算されます。 ネットワークはさらに vMAG に洗練されます。 ただし、CoCoNet と vRhyme は両方とも、ウイルス コンティグの信頼できる共存在量プロファイル、つまり、どのコンティグが複数のサンプルにわたって一貫した存在量値を共有し、したがって同じゲノムに由来する可能性が高いかを示すプロファイルを構築するのに十分なサンプルがない場合、重大な障害が発生する可能性があります。 。