sasava

Mikrobiální metaproteomika: od zpracování vzorků, sběr dat až po analýzu dat

Wu Enhui, Qiao Liang*

Katedra chemie, Univerzita Fudan, Šanghaj 200433, Čína

 

 

 

Mikroorganismy úzce souvisí s lidskými nemocemi a zdravím. Jak porozumět složení mikrobiálních společenstev a jejich funkcím je hlavní problém, který je třeba naléhavě prostudovat. V posledních letech se metaproteomika stala důležitým technickým prostředkem pro studium složení a funkce mikroorganismů. Vzhledem ke složitosti a vysoké heterogenitě vzorků mikrobiální komunity se však zpracování vzorků, sběr dat z hmotnostní spektrometrie a analýza dat staly třemi hlavními výzvami, kterým v současnosti metaproteomika čelí. V metaproteomické analýze je často nutné optimalizovat předúpravu různých typů vzorků a přijmout různá schémata mikrobiální separace, obohacení, extrakce a lýzy. Podobně jako u proteomu jednoho druhu, režimy získávání dat hmotnostní spektrometrií v metaproteomice zahrnují režim získávání dat závislých na datech (DDA) a režim získávání nezávislých dat (DIA). Režim získávání dat DIA dokáže kompletně shromáždit peptidové informace ze vzorku a má velký vývojový potenciál. Vzhledem ke složitosti vzorků metaproteomů se však analýza dat DIA stala hlavním problémem, který brání hlubokému pokrytí metaproteomiky. Z hlediska analýzy dat je nejdůležitějším krokem vytvoření databáze proteinových sekvencí. Velikost a úplnost databáze má nejen velký vliv na počet identifikací, ale ovlivňuje i analýzu na druhové a funkční úrovni. V současnosti je zlatým standardem pro konstrukci databáze metaproteomů databáze proteinových sekvencí založená na metagenomu. Zároveň se také ukázalo, že metoda filtrování veřejné databáze založená na iterativním vyhledávání má velkou praktickou hodnotu. Z hlediska specifických strategií analýzy dat zaujímaly metody analýzy dat DIA zaměřené na peptidy absolutní hlavní proud. S rozvojem hlubokého učení a umělé inteligence výrazně podpoří přesnost, pokrytí a rychlost analýzy makroproteomické analýzy dat. Z hlediska následné bioinformatické analýzy byla v posledních letech vyvinuta řada anotačních nástrojů, které mohou provádět druhovou anotaci na úrovni proteinů, peptidů a genů za účelem získání složení mikrobiálních společenstev. Funkční analýza mikrobiálních společenstev je ve srovnání s jinými metodami omiky jedinečným rysem makroproteomiky. Makroproteomika se stala důležitou součástí multi-omické analýzy mikrobiálních společenstev a stále má velký rozvojový potenciál, pokud jde o hloubku pokrytí, citlivost detekce a úplnost analýzy dat.

 

01 Předúprava vzorku

V současné době je technologie metaproteomiky široce používána ve výzkumu lidského mikrobiomu, půdy, potravin, oceánů, aktivních kalů a dalších oblastech. Ve srovnání s analýzou proteomu jednoho druhu čelí předúprava metaproteomu komplexních vzorků větším problémům. Mikrobiální složení ve skutečných vzorcích je složité, dynamický rozsah abundance je velký, struktura buněčné stěny různých typů mikroorganismů je velmi odlišná a vzorky často obsahují velké množství hostitelských proteinů a jiných nečistot. Proto je při analýze metaproteomu často nutné optimalizovat různé typy vzorků a přijmout různá schémata mikrobiální separace, obohacování, extrakce a lýzy.

Extrakce mikrobiálních metaproteomů z různých vzorků má určité podobnosti a také určité rozdíly, ale v současné době chybí jednotný proces předběžného zpracování pro různé typy vzorků metaproteomů.

 

02Sběr dat z hmotnostní spektrometrie

Při brokovnicové proteomové analýze je směs peptidů po předběžné úpravě nejprve separována v chromatografické koloně a poté po ionizaci vstupuje do hmotnostního spektrometru pro získávání dat. Podobně jako u jednodruhové proteomové analýzy zahrnují režimy získávání dat hmotnostní spektrometrií v makroproteomové analýze režim DDA a režim DIA.

 

S kontinuální iterací a aktualizací přístrojů hmotnostní spektrometrie jsou na metaproteom aplikovány přístroje hmotnostní spektrometrie s vyšší citlivostí a rozlišením a hloubka pokrytí metaproteomové analýzy se také neustále zlepšuje. Po dlouhou dobu byla v metaproteomu široce používána řada přístrojů hmotnostní spektrometrie s vysokým rozlišením v čele s Orbitrapem.

 

Tabulka 1 původního textu ukazuje některé reprezentativní studie o metaproteomice od roku 2011 do současnosti, pokud jde o typ vzorku, strategii analýzy, přístroj pro hmotnostní spektrometrii, metodu akvizice, software pro analýzu a počet identifikací.

 

03Analýza dat hmotnostní spektrometrie

3.1 Strategie analýzy dat DDA

3.1.1 Vyhledávání v databázi

3.1.2de novosekvenační strategie

3.2 Strategie analýzy dat DIA

 

04Druhová klasifikace a funkční anotace

Složení mikrobiálních společenstev na různých taxonomických úrovních je jednou z klíčových oblastí výzkumu ve výzkumu mikrobiomu. V posledních letech byla vyvinuta řada anotačních nástrojů pro anotaci druhů na úrovni proteinů, peptidů a genů za účelem získání složení mikrobiálních společenstev.

 

Podstatou funkční anotace je porovnání cílové proteinové sekvence s databází funkčních proteinových sekvencí. Pomocí databází genových funkcí, jako je GO, COG, KEGG, eggNOG atd., lze provádět různé analýzy funkčních anotací na proteinech identifikovaných makroproteomy. Nástroje pro anotaci zahrnují Blast2GO, DAVID, KOBAS atd.

 

05 Shrnutí a výhled

Mikroorganismy hrají důležitou roli v lidském zdraví a nemocech. V posledních letech se metaproteomika stala důležitým technickým prostředkem pro studium funkce mikrobiálních komunit. Analytický proces metaproteomiky je podobný jako u jednodruhové proteomiky, ale vzhledem ke složitosti výzkumného objektu metaproteomiky je třeba v každém kroku analýzy přijmout specifické výzkumné strategie, od předúpravy vzorků, získávání dat až po analýzu dat. V současné době, díky zdokonalování metod předúpravy, neustálé inovaci technologie hmotnostní spektrometrie a rychlému rozvoji bioinformatiky, udělala metaproteomika velký pokrok v hloubce identifikace a aplikačním rozsahu.

 

V procesu předúpravy makroproteomových vzorků je třeba nejprve zvážit povahu vzorku. Jak oddělit mikroorganismy od environmentálních buněk a proteinů je jedním z klíčových problémů, kterým čelí makroproteomy, a rovnováha mezi účinností separace a mikrobiální ztrátou je naléhavým problémem, který je třeba vyřešit. Za druhé, proteinová extrakce mikroorganismů musí brát v úvahu rozdíly způsobené strukturní heterogenitou různých bakterií. Vzorky makroproteomu ve stopovém rozsahu také vyžadují specifické metody předběžné úpravy.

 

Pokud jde o přístroje hmotnostní spektrometrie, hlavní přístroje pro hmotnostní spektrometrii prošly přechodem od hmotnostních spektrometrů založených na hmotnostních analyzátorech Orbitrap, jako jsou LTQ-Orbitrap a Q Exactive, k hmotnostním spektrometrům založeným na hmotnostních analyzátorech s iontovou mobilitou, jako je timsTOF Pro . Řada přístrojů timsTOF s informacemi o rozměrech mobility iontů má vysokou přesnost detekce, nízký detekční limit a dobrou opakovatelnost. Postupně se staly důležitými nástroji v různých oblastech výzkumu, které vyžadují detekci hmotnostní spektrometrií, jako je proteom, metaproteom a metabolom jednoho druhu. Stojí za zmínku, že po dlouhou dobu dynamický rozsah přístrojů hmotnostní spektrometrie omezoval hloubku pokrytí proteiny ve výzkumu metaproteomů. V budoucnu mohou přístroje hmotnostní spektrometrie s větším dynamickým rozsahem zlepšit citlivost a přesnost identifikace proteinů v metaproteomech.

 

Pro sběr dat z hmotnostní spektrometrie, ačkoliv režim získávání dat DIA byl široce přijat v proteomu jednoho druhu, většina současných analýz makroproteomů stále používá režim získávání dat DDA. Režim získávání dat DIA může plně získat informace o fragmentech iontů vzorku a ve srovnání s režimem získávání dat DDA má potenciál plně získat informace o peptidu vzorku makroproteomu. Vzhledem k vysoké složitosti DIA dat však analýza DIA makroproteomových dat stále čelí velkým potížím. Očekává se, že vývoj umělé inteligence a hlubokého učení zlepší přesnost a úplnost analýzy dat DIA.

 

Při analýze dat metaproteomiky je jedním z klíčových kroků konstrukce databáze proteinových sekvencí. Pro populární výzkumné oblasti, jako je střevní flóra, lze použít střevní mikrobiální databáze, jako je IGC a HMP, a bylo dosaženo dobrých výsledků identifikace. Pro většinu ostatních metaproteomických analýz je stále nejúčinnější strategií budování databáze vytvoření databáze proteinových sekvencí specifických pro vzorek na základě dat metagenomického sekvenování. U vzorků mikrobiálních společenstev s vysokou složitostí a velkým dynamickým rozsahem je nutné zvýšit hloubku sekvenování, aby se zvýšila identifikace druhů s nízkou četností, čímž se zlepší pokrytí databáze proteinových sekvencí. Pokud chybí sekvenační data, lze k optimalizaci veřejné databáze použít metodu iterativního vyhledávání. Iterativní vyhledávání však může ovlivnit kontrolu kvality FDR, takže výsledky vyhledávání je třeba pečlivě zkontrolovat. Kromě toho stále stojí za prozkoumání použitelnost tradičních modelů kontroly kvality FDR v metaproteomické analýze. Pokud jde o strategii vyhledávání, strategie hybridní spektrální knihovny může zlepšit hloubku pokrytí metaproteomiky DIA. V posledních letech předpovídaná spektrální knihovna vytvořená na základě hlubokého učení prokázala vynikající výkon v DIA proteomice. Databáze metaproteomů však často obsahují miliony záznamů o proteinech, což vede k velkému rozsahu předpovídaných spektrálních knihoven, spotřebovává mnoho výpočetních zdrojů a výsledkem je velký prostor pro vyhledávání. Kromě toho se podobnost mezi proteinovými sekvencemi v metaproteomech velmi liší, což ztěžuje zajištění přesnosti modelu predikce spektrální knihovny, takže předpovězené spektrální knihovny nebyly v metaproteomice široce používány. Kromě toho je třeba vyvinout nové strategie pro odvození proteinů a klasifikační anotační strategie, které by se daly aplikovat na metaproteomickou analýzu vysoce sekvenčně podobných proteinů.

 

Stručně řečeno, metaproteomická technologie jako nastupující technologie výzkumu mikrobiomů dosáhla významných výzkumných výsledků a má také obrovský rozvojový potenciál.


Čas odeslání: 30. srpna 2024