Információ

Nature Scientific Reports kontra BMC Genomics

Nature Scientific Reports kontra BMC Genomics


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Nem tudom, hogy ez a kérdés ide illik-e vagy sem. Azért tettem közzé, mert úgy gondolom, hogy a biológusok segíthetnek ebben a kérdésben. Ha nem ide való, akkor sajnálom.

Írtam egy dolgozatot, amelyen körülbelül 3 évet dolgoztam, és szép leletekkel és eredeti szekvenált adatokkal rendelkezik (az NCBI-ban letétbe helyezve). Beadtam a dolgozatot a "Genome Biology"-hoz, és szerkesztői elutasítást kaptam, de felajánlották, hogy áthelyezik a "BMC Genomics"-hoz. A témavezetőm azonban ezt megtagadta, és azt javasolta, hogy nyújtsuk be a „Természettudományi Jelentést”. Megpróbáltam meggyőzni, hogy menjen a BMC Genomics-hoz, mert az egy fókuszáltabb folyóirat és jobb az önéletrajzomnak, de azt mondta, hogy a második jobb, mert jobb az impakt faktora, és ez a Nature! (Impact factor: 5 a Scientific Reports esetében, vs. 4,04 a BMC Genomics esetében).

Mit gondolsz, mert nagyon tanácstalan vagyok, hogy melyiket válasszam?


Ez túl hosszú egy megjegyzéshez, ezért ide teszem fel. És ezek az én személyes véleményem, lehet, hogy valaki másként kezeli ezt. Néhány okból benyújtanám a dolgozatot a BMC Genomicsnak:

  • A szerkesztő felajánlotta a lap átadását, így túl lesz a szerkesztőségi áttekintésen. Ez nem garantált a Nature Scientific Report (NSR) esetében. Még mindig át kell mennie a szakértői értékelésen, de ez nem különbözik a két folyóirat között.
  • Őszintén: Felejtsd el az Impact Factor különbségét. Mindkettő közepes hatótávolságú impakt faktoros napló, amely szorosan egymás mellett helyezkedik el. A legtöbbet idézett írásom egy ilyen közepes hatású folyóiratban jelenik meg, ma Medline kereséssel találsz újságokat, szóval ez már nem számít (a presztízsen kívül). Emellett a sok idézet növeli a folyóiratok impakt faktorát a jövőben. Megérteném ezt az érvelést, amikor a Nature és a BMC Genomics között kellene választani, elég nagy a különbség.
  • Ha a munkád jobban illeszkedik a BMC Genomicshoz, akkor nagyobb az esély az elfogadásra, úgyhogy én oda mennék. Ezt természetesen mindig figyelembe kell venni. Ugyanez igaz az önéletrajzodra is.

Ha lehetősége van arra, hogy maga hozza meg a döntést anélkül, hogy túlzottan feldühítené a felettesét, én megtenném. Még jobb lenne meggyőzni őt.


Kicsit nem értek egyet a többi hozzászólással. A tudományos jelentések szélesebb közönséggel, nagyobb impakt faktorral rendelkeznek, és a Nature folyóiratcsaládhoz kapcsolódnak.

A BMC folyóiratcsalád hírneve nem azonos, a plosONE pedig biztosan nem, és egyesek körében szinte bármit kiadó hírneve van. Bárki, aki kívül esik az adott szakterületén, jobb kiadványnak fogja tekinteni az SR-ben való közzétételt. Ez nem azt jelenti, hogy az SR tudományos értelemben jobb folyóirat, de ha presztízst keresel, az SR biztosan jobb folyóirat.


Szerkesztői profilok

Clare 2019-ben csatlakozott a BMC sorozathoz kéziratszerkesztőként, mielőtt szerkesztője lett volna BMC Genomics, BMC Genetika és BMC Orvosi Genomika 2020 szeptemberében kezdett el humángenetikát tanulni a Dublini Trinity College-ban, majd az Edinburghi Egyetemen szív- és érrendszeri tudományból mesterfokozatot, majd PhD fokozatot szerzett egy gén gyulladás és oxidatív stressz szabályozásában betöltött szerepének kutatásában. a zsírszövetben. Egy évig dolgozott egy kis tudományos kiadónál, mielőtt csatlakozott a BMC-hez. Érdekelt a kutatás integritása és a nyílt hozzáférés, hogy mindenki számára elérhető legyen a megbízható, reprodukálható kutatás.


Az értékes adatokat gyakran nem teszik közzé, amikor segíthetik a tudomány fejlődését. Ezért a BMC Bemutatták a sorozatot Adatjegyzetek, egy rövid cikktípus, amely lehetővé teszi adatai leírását és közzétételét, hogy adatai könnyebben megtalálhatók, idézhetők és megoszthatók.

Adatait itt teheti közzé BMC genomikai adatok (genomikus, transzkriptomikus és nagy áteresztőképességű genotípus adatok) vagy in BMC kutatási jegyzetek (adatok az összes természet- és klinikai tudományból).

Egyedülálló cikktípusunkról további információk találhatók a BMC genomikai adatok és BMC kutatási jegyzetek folyóirat weboldalai.


Esetbemutató

Az alábbi eset egy orosz nőnél diagnosztizált többszörös paragangliomát ír le, amelyek a nyak mindkét oldalán két CPGL-ként és egy VPGL-ként jelentkeznek. A tanulmány célja a többszörös paragangliómák kialakulásának hátterében álló molekuláris mechanizmusok vizsgálata volt a három daganat klinikai és patológiai jellemzőinek, valamint genetikai variációinak vizsgálatával.

Egy 50 éves nőnél a nyaki artériák extravaszkuláris kompresszióját és a nyak mindkét oldalán lévő CPGL-eket diagnosztizálták. A klinikai tünetek közé tartozik az artériás magas vérnyomás és a fájdalommentes lekerekített tömegek. A számítógépes tomográfiás (CT) és ultrahangos (US) vizsgálat daganatok jelenlétét tárta fel a carotis bifurcatio területein, a nyak bal oldalán 32 × 25 mm-es szolid neopláziát és a jobb oldalon 46 × 24 mm-es kétcsomós daganatot. a nyak, ill. Ezek a nyaktömegek heterogén szerkezetűek voltak, és túlnyomórészt hypoechoiások és hipervaszkulárisak voltak. A kontrasztos CT vizsgálat azt is kimutatta, hogy a jobb és a bal carotis bifurkációinál hipointenzív, erősen vaszkularizált tömegek vannak (1. ábra).

A beteg fejének és nyakának számítógépes tomográfiája műtét előtt. CT-vizsgálat (balra) 3D rekonstrukció (jobbra)

A beteget műtétnek vetették alá a bal oldali daganat reszekciója miatt. A műtét idején a hipervaszkularizált daganat alsó pólusa a külső nyaki artéria (OCA) bifurkációja alatt helyezkedett el, a nyaki artériák mentén proximális irányban, és a hátsó, elülső és laterális felületek köré tekeredve. A carotis artériák elágazása szerepet játszott a tumor tömegében. A daganat felső pólusa a vagus ideghez kapcsolódott. A daganatot (25 × 2 × 17 mm) teljesen eltávolítottuk, és patológiai értékelésnek vetették alá. A beteget tervezett újrahospitalizálással hazaengedték a jobb oldali daganat eltávolítására. A reszekált daganat szövettani vizsgálata carotis paragangliomát igazolt (2. ábra). A hematoxilin-eozin (H&E) festés a paragangliomákra jellemző Zellballen-struktúrát mutatott. A fő daganatsejtek pozitív festődést mutattak a kromogranin A, szinaptofizin és CD56 antitestekre, ami neuroendokrin daganatra utal. Az S100 fehérje sustentacularis sejtekben expresszálódott. A tumorsejtek negatívak voltak a citokeratin AE1/AE3-ra.

Hematoxilin-eozin (H&E) festés carotis és vagus paragangliomákban. a bal CPGL, b jobb CPGL, és c jobb VPGL. A paragangliómák sajátos „Zellballen” növekedési mintája (a fősejtek kis fészkei halvány eozinofil festéssel, támasztó sustentacularis sejtekkel körülvéve) láthatók.

A nyak jobb oldalán egy év múlva műtétet végeztek. Az egyesült államokbeli vizsgálati jelentések szerint elsősorban a VPGL-t és a megnagyobbodott nyirokcsomókat észlelték. A műtét során a nyaki artéria bifurkációja feletti nyirokcsomót (15 × 5 mm) eltávolítottuk, és további szövettani vizsgálatnak vetették alá a metasztázisokat. Ezenkívül közvetlenül a nyaki artéria elágazásánál tumorszerű tömeget (35 × 20 mm) figyeltek meg, amely oldalirányban elnyomja a belső nyaki artériát (ICA), és reszekáltuk. A tumor reszekciót követően a vagus idegből származó újabb daganatszerű képződményt (60 × 20 mm) vizualizáltuk és eltávolítottuk. A vagus ideget kivágtuk és lekötöttük. Mindkét daganatot szövettanilag megvizsgáltuk, és nyirokcsomó-metasztázis nélküli paragangliomákat mutattak ki (2. ábra).

A páciensből származó összes tumormintánál (bal és jobb CPGL, VPGL) elvégeztük a szukcinát-dehidrogenáz (SDH) alegység expressziójának immunhisztokémiai (IHC) elemzését (1. további fájl). Az SDH komplex négy alegységből (SDHA, SDHB, SDHC és SDHD) áll, amelyeket a megfelelő gének kódolnak [5, 6]. Csíravonal és szomatikus mutációk a SDHx A gének általában paragangliómákkal/feochromocytomákkal társulnak [7, 8]. Az SDH alegységek immunhisztokémiája értékes kiegészítő eszköz a paragangliómák kórszövettani vizsgálatában, amelyet a klinikán használnak az SDH elvesztésének értékelésére, amely összefüggésbe hozható bármely patogén mutációval. SDHx gének.

Az SDH alegységekre vonatkozó immunreakciókat az Abcam (USA) primer antitesteinek felhasználásával végeztük minden egyes SDH alegységre: SDHA, monoklonális, 2E3GC12FB2AE2 klón SDHB, monoklonális, klón 21A11AE7 SDHC, monoklonális, E(clonal)SD35 klón. Gyenge diffúz gyenge SDHB festődést találtunk a VPGL-ben és mind a bal, mind a jobb oldali CPGL-ben. Az irodalom szerint az SDHB alegység gyenge diffúz festődése bármely SDHx génben patogén mutációkat tükrözhet. Gyenge diffúz SDHB festődést észleltünk minden vizsgált daganatban, ami csíravonal patogén mutáció jelenlétére utal az egyikben. SDHx gének a betegben.

Ezenkívül három daganat, nyirokcsomó és vér exome-szekvenálását végeztük el a páciensből. A daganatokból és a nyirokcsomókból származó DNS-t High Pure FFPET DNS Isolation Kit-tel (Roche, Svájc) extraháltuk. A DNS-t a vérsejtekből MagNA Pure Compact Nucleic Acid Isolation Kit I (Roche) segítségével izoláltuk egy MagNA Pure Compact Instrument (Roche) készüléken. Az Exome könyvtárakat az Illumina (USA) Rapid Capture Exome Kit-tel (bal oldali CPGL) és TruSeq Exome Library Prep Kit-tel (jobbra CPGL és VPGL) készítettük. A nagy áteresztőképességű exome szekvenálást NextSeq 500 Systemen (Illumina) végeztük, 76 × 2 bp-os páros vég módban daganatok és nyirokcsomók esetén, és 156 × 2 bp vér esetén, 300-szoros minimális lefedettséggel. A paragangliómák exome szekvenálási adatai az NCBI SRA-ban PRJNA411769 (bal oldali CPGL, Pat01), PRJNA476932 (jobbra CPGL, Pat104) és PRJNA561073 (VPGL, Pat6) számon érhetők el. A bioinformatikai elemzést korábbi tanulmányunkban ismertettük [9]. A missense variánsokat valószínűleg patogénnek tekintették, ha legalább három előrejelző eszközzel előre jelezték, és ≥ 0,5 megőrzési pontszámmal jellemezték.

Az Exome elemzése valószínűsíthetően patogén csíravonal missense variánst mutatott ki a SDHD gén, NM_003002.3: c.305A > G, p.H102R (chr11: 111959726, rs104894302). Más génekben nem találtak patogén/valószínű patogén csíravonal-variánsokat, amelyeknél kimutatták a paragangliómákkal/feokromocitómákkal való összefüggést.

Az azonosított valószínű patogén szomatikus variánsok mindegyik tumor esetében eltérőek voltak (2. további fájl). A bal oldali CPGL-ben két génben találtunk missense valószínű patogén szomatikus variánsokat, TENM3 [NM_001080477: c.C5082A, p.N1694K (chr4: 183696084)] és EPHA5 [NM_004439: c.G682A, p.V228I (chr4: 66467587)].

A jobb oldali CPGL-ben számos valószínű patogén változatot (stop-gain, frameshift és missense) észleltek. Stop-gain változatokat találtak NRXN3 [NM_004796: c.C1387T, p.Q463X (chr14: 79432478)] és RELN [NM_005045: c.C9052T, p.R3018X (chr7: 103137114)], missense variánsokat tártak fel TRIP12, JAG1, ASXL1, LMBRD1, DHX9, AASS, és TP53. A TP53 génben két mutációt találtunk: egy patogén/valószínű patogén variánst, az NM_001126115: c.A446T, p.D149V (chr17: 7577096, rs587781525), amelyről a ClinVar-ban számoltak be, és egy korábban nem leírt NM valószínű patogén c60 variánst0,54M. A170G, p.D57G (chr17: 7579517).

A VPGL esetében találtunk patogén variánst az mtDNS-ben (MT: 3243, rs199474657), valamint valószínű patogén missense, frameshift és stop-gain variánsokat számos génben (LRP1, SPEN, PPP4R1, XPO6, FBN1, C1QB, és mások) (2. további fájl).


Háttér

Szinte mindenütt megfigyelték a negatív antropogén és éghajlati hatások következtében kialakuló hatalmas erdőpusztulást, amelyet gyakran súlyosbítanak a kártevők, gombák és más fitopatogének. A környezeti változások, mint például a megnövekedett éves átlaghőmérséklet, a csapadék csökkenése, a gyakoribb aszályok meggyengíthetik a fákat, és sokkal pusztítóbbá tehetik a gombákat. Az erdővédelem komoly kérdéssé vált, mivel a fitopatogén gombák által okozott növénypusztulás mértéke óriási. Például a fabetegségek körülbelül 100 millió szilfa elvesztését okozták az Egyesült Királyságban és az Egyesült Államokban, és a lista folytatható. Az összes fitopatogén közül a gombák okozzák a fertőzéssel összefüggő fajok 64%-át és a regionális kiirtási eseményeket [1].

A basidiomycete nemzetség Armillaria világszerte nagyon fontos szerepet játszik az erdei ökoszisztémákban, és jelenleg több mint 40 hivatalosan leírt fajt foglal magában [2, 3]. Armillaria fajok virulenciájában jelentősen különböznek, például egyes fajok, mint pl A. ostoyae, a fák pusztulásának fő oka, míg más fajok a különböző tényezők (szárazság, kártevők stb.) által már károsodott növényeket kolonizálják [4, 5]. A patogenitásban is különbséget figyeltek meg A. ostoyae, azonban virulencia variációja A. borealis még nem vizsgálták [6].

Armillaria borealis (Marxm. & Korhonen) egy gomba a Physalacriaceae család (Basidiomycota) széles körben elterjedt Eurázsiában, beleértve Szibériát és a Távol-Keleten [1]. Az ebbe a nemzetségbe tartozó fajok a gyökérfehér rothadás betegséget okozzák, amely legyengíti és gyakran elpusztítja a fás szárú növényeket [7]. Számos filogenetikai és genomikai tanulmány a A. ostoyae magas patogén potenciálja és gyakori előfordulása miatt végezték el [4, 8, 9], miközben keveset tudunk az ökológiai viselkedésről. A. borealis. A terepkutatási adatok szerint A. borealis kevésbé patogén, mint A. ostoyae, és agresszív viselkedése ritka. Főként A. borealis másodlagos kórokozóként viselkedik, és elpusztítja a biotikus és abiotikus tényezők által már legyengített fákat [10,11,12,13]. A változó környezet azonban előre nem látható hatásokat okozhat a gombák viselkedésében.

Armillaria spp. az erdőpopulációkra gyakorolt ​​hatásnak mind gazdasági, mind ökológiai jelentősége van. Több száz különböző fafajt támadnak meg (pl. Abies, Picea, Pinus, Betula, Sorbus, Juglans, Malus, stb.) mindkét féltekén, eltérő éghajlati viszonyok között, és a legpusztítóbb erdőkórokozók közé tartoznak [2, 14, 15].

A fajok azonosítása és patogenitási szintjei Armillaria kulcsfontosságú az erdők védelmében. A genomikai adatok szükségesek a kórokozó fajok patogenitásának tanulmányozásához, valamint a fákra gyakorolt ​​hatásuk és a gazda-kórokozó kölcsönhatások jobb megértéséhez. Ezen túlmenően, az összehasonlító genomika segíthet feloldani a komplex filogenezisét Armillaria faj. Érdemes megjegyezni, hogy a gombák genomikai adatai az ipari alkalmazásokhoz is fontosak. Például fehér rothadás Armillaria A gombák képesek a lignin és a cellulóz lebontására, és felhasználhatók a fa- és papírgyártási hulladék hasznosítására [16].

A. borealis nagyon fontos a hatalmas boreális erdei ökoszisztémák számára. A hatalmas befolyás ellenére azonban Armillaria Az erdészetben, kertészetben és mezőgazdaságban előforduló fajok, e nemzetség gombái és patogenitása még mindig nem kellően tanulmányozott ezen a kiterjedt területen, ami miatt a bemutatott genomikai vizsgálat nagyon szükséges.

Vannak már publikált genomikai és proteomikai adatok A. mellea, A. solidipes, és A. ostoyae növényi sejtfalat lebontó enzimek (PCWDE) és néhány szekretált fehérje jelenlétét tárja fel [17,18,19]. Más patogén bazidiomicéták genomiális elemzése, mint pl Moniliophthora [20, 21], Heterobasidion [22] és Rhizoctonia [23] feltételezett patogenitási faktorként PCWDE-t kódoló géneket, valamint szekretált enzimeket és másodlagos metabolizmus effektor fehérjéket is feltárt. Azonban az életciklus és az elosztási stratégia Armillaria A tagok azt mutatják, hogy más, további patogenitási mechanizmusokat fejlesztettek ki, amelyeket más lehetséges genomi mechanizmusokkal együtt még nem vizsgáltak [24]. Érdemes megjegyezni, hogy a mobil és erősen ismétlődő elemek (RE) szerepe és funkcionális jelentősége még mindig nem teljesen tisztázott. Fokozatosan felhalmozódó adatok arra utalnak, hogy az RE-k fontos szerepet játszhatnak az organizmusok evolúciós fejlődésében, a replikációban és a nukleoprotein komplexek kialakulásában, valamint befolyásolhatják a génexpressziót [17]. A gombák genomja effektorgéneket és transzponálható elemeket (TE-ket) tartalmazó sűrűn csomagolt [25,26,27]. Közölték, hogy a különböző gombakórokozók, mint pl Fusarium [28] és Verticillium [29] hasonló genom-architektúrával rendelkeznek. Tehát várhatóan a TE-k fontos szerepet játszhatnak a gazdaszervezetváltásban és az új ökológiai résekhez való alkalmazkodásban [30]. -ben találták meg Magnaporthe oryzae hogy a gazdaszervezet specializációjában részt vevő gének a TE-kkel társultak [31].


Növényi anyagok és növekedési feltételek

Dr. Thomas W. Okita a Washingtoni Állami Egyetemről biztosította a Kitaake magokat, amelyeket eredetileg Dr. Hiroyuki Ito-tól, az Akita National College of Technology-tól, Japántól szereztek be. Dr. Jan E. Leach a Colorado Állami Egyetemen magokat biztosított a Zhenshan 97, Minghui 63, IR64 és 93–11 számára. A Kasalath magjait az USDA Dale Bumpers National Rice Research Center, Stuttgart, Arkansas biztosította. A magvakat 1/2x MS (Murashige és Skoog) táptalajon csíráztattuk. A palántákat áthelyeztük egy üvegházba, és tavasszal (2017. március 2-án) 3 növényt ültettek el a kaliforniai Davisben. A fényintenzitást körülbelül 250 μmol m − 2 s − 1 értékre állítottuk be. A nappali/éjszakai periódust 14/10 órára, a hőmérsékletet 28 és 30 °C közé állítottuk [29]. A rizsnövényeket tápvízzel kiegészített homokos talajban nevelték. A növény első szálkájának megjelenésének napját jegyezték fel a növény fejlécének dátumaként. A Kasalath magvak később érkeztek, és a rovat dátumát is ugyanúgy rögzítették. A kísérletet télen megismételték.

Filogenetikai fa építése

178 496 egyenletes eloszlású SNP-t kaptunk úgy, hogy a genomot 3,8 kb-os binekre osztottuk, és binenként véletlenszerűen választottunk ki egy vagy két SNP-t a tároló SNP sűrűségének megfelelően. Az összes rizscsatlakozás genotípusát, beleértve a 3 K Rice Genomes Project 3010 csatlakozását és további jelentős csatlakozásokat, a RiceVarMap v2.0 [30] SNP adatbázisból és a kapcsolódó genomikai adatokból [31] kérték le, és az IBS távolságmátrix kiszámításához használták. amelyet azután egy filogenetikai fa megalkotására alkalmaztak a súlyozatlan szomszéd-joining módszerrel, amelyet az APE R csomagban implementáltak [32]. A filogenetikai fa ágait a 3010 rizsbetét osztályozása szerint színeztük [2].

Genom szekvenálás és összeállítás

A KitaakeX fiatal leveleiből származó nagy molekulatömegű DNS-t izoláltuk és használtuk a szekvenáláshoz. További részletekért lásd (1. kiegészítő fájl).

Fehérjekódoló gének annotációja

A jó minőségű annotációk elkészítése érdekében nagy áteresztőképességű RNS-seq elemzést végeztünk a különféle rizsszövetekből (levél, szár, panicle és gyökér) származó könyvtárakról. Körülbelül 683 millió pár 2 × 151 páros végű RNS-seq leolvasást sikerült elérni és összeállítani egy átfogó PERTRAN csővezeték segítségével (nem publikált). A génmodelleket az ab initio génpredikció, a fehérje alapú homológiakeresés, a kísérletileg klónozott cDNS/expressed-sequence tag (EST) és az RNS-seq adatokból összeállított átiratok kombinálásával jósolták meg. A génfunkciókat a SwissProt és a TrEMBL adatbázisból [33] a legjobban illeszkedő fehérjék alapján annotáltuk tovább BLASTP segítségével (E érték < 10 − 5 ) (11. kiegészítő fájl). A találatok nélküli géneket ezekben az adatbázisokban „hipotetikus fehérjéknek” jelölték. A Gene Ontology (GO) [34] kifejezések hozzárendeléseit, valamint a fehérjedoméneket és motívumokat InterPro-val [35] vontuk ki. Az útvonalelemzést a Kyoto encyclopedia of genes and genomes (KEGG) adatbázisban [36] található legjobban illeszkedő eukarióta fehérjéből származtattuk BLASTP segítségével (E érték < 1,0e − 10 ).

Genom Synteny

SynMap-et (CoGe, www.genomevolution.org) használtunk a kollinearitási blokkok azonosítására homológ CDS-párok segítségével, Daccord és munkatársai szerint. [37] és kollinearitási blokkokat ábrázolt Circos [38] segítségével.

Ismételje meg a megjegyzést

Az átültethető elemek és az ismétlődő szekvenciák töredékét az összeállításban a RepeatMasker (http://www.repeatmasker.org/, v. 3.3.0) és a Blaster (a REPET csomag egyik összetevője) kimenetének összevonásával kaptuk meg [39]. A két programot a RiTE-db [40] nukleotidkönyvtárai (PReDa és RepeatExplorer) és a transzponálható elem (TE) fehérjék házon belüli gyűjteményével futtattuk. A maszkolt ismétlődések egyeztetése egyedi Perl-szkriptekkel történt, és gff3-fájlokba formázva. Az Infernal [41]-et a nem kódoló RNS-ek (ncRNS-ek) azonosítására alkalmazták az Rfam.cm.12.2 Rfam könyvtár segítségével [42]. A családspecifikus gyülekezési küszöbnél alacsonyabb pontszámú eredményeket eltávolítottuk, amikor mindkét szálon lókuszokat jeleztek előre, csak a legmagasabb pontszámot elérő találat maradt meg. A transzfer RNS-ek előrejelzését a tRNAscan-SE [43] használatával is elvégezték az alapértelmezett paraméterek mellett. Az ismétlési sűrűséget az egyeztetett annotációt tartalmazó fájlból számítottuk ki (10. további fájl).

A genomi variációk elemzése

SNP-k és InDel-ek elemzése: MUMmer (3.23-as verzió) [26] segítségével a Nipponbare és Zhenshan97 genomokat a KitaakeX genomhoz igazítottuk a -maxmatch -c 90 -l 40 paraméterek segítségével. Az igazítási eredmények szűrésére a delta -szűrőt használtuk. − 1 paraméter az egy az egyhez igazítási blokk opcióval. Az SNP-k és az InDel-ek azonosításához show-snp opciót használtunk a (-Clr TH) paraméterrel. Az snpEff [44] segítségével annotáltuk az SNP-k és az InDel-ek hatását. Az SNP-k és InDel-ek megoszlását a KitaakeX genom mentén Circos segítségével vizualizáltuk [38].

PAV-ok és inverziók elemzése: A MUMmer (3.23-as verzió) show-coords opcióját használtuk -TrHcl paraméterekkel a résrégiók és a 86 bp feletti PAV-ok azonosítására az igazítási blokkokból. Az inverziók azonosítására a show-coords kimeneti fájlból ≥98%-os azonossággal rendelkező fordított igazítási blokkokat használtunk.

A Kitaake és KitaakeX közötti genomiális eltérések azonosítása érdekében szekvenáltuk és összehasonlítottuk a szekvenciákat a létrehozott pipeline segítségével [15].

BAC könyvtár építése

A tömbösített BAC-könyvtárakat a bevált protokollok segítségével hoztuk létre [45]. További részletekért lásd az 1. kiegészítő fájlt.

A genom méretének becslése

A KitaakeX genom méretének becsléséhez a következő módszert alkalmaztuk:

(1) Az Illumina fragmenskönyvtár segítségével elkészítettük a 24 tagú frekvenciák hisztogramját. Ezt úgy végeztük el, hogy először megszámoltuk mind a 24 tag frekvenciáját. Minden frekvencián összeszámolták a kmerek számát, és egy hisztogramot készítettek. (2) A kmer hisztogram általában egy csúcsértéket jelez egy adott frekvencián, amely megfelel a genom 24 tagjának átlagos lefedettségének. (3) Ezután vettük a genom lefedettségét reprezentáló csúcsértéket, és kiszámítottuk a teljes bázist az Illumina könyvtárban. A teljes bázist a lefedettséggel tovább osztva a genom méretére vonatkozó becslést kaptunk. Ennek az értéknek a pontossága általában +/− 10%.


Bycroft C, Freeman C, Petkova D, Band G, Elliott LT, Sharp K és mások. Az Egyesült Királyság Biobank erőforrása mély fenotipizálással és genomikai adatokkal. Természet. 2018562:203–9 Elérhető: http://www.nature.com/articles/s41586-018-0579-z. [idézve 2018. október 12.].

McArt DG, Bankhead P, Dunne PD, Salto-Tellez M, Hamilton P, Zhang S-D. cudaMap: GPU-gyorsított program génexpressziós kapcsolati térképezéshez. BMC Bioinformatika. 201314:305 Elérhető: http://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-14-305. [idézve 2018. október 18.].

Mejía-Roa E, Tabas-Madrid D, Setoain J, García C, Tirado F, Pascual-Montano A. NMF-mGPU: non-negative matrix factorization on multi-GPU systems. BMC Bioinformatika. 201516:43 Elérhető: http://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-015-0485-4. [idézve 2018. október 18.].

Schatz MC, Trapnell C, Delcher AL, Varshney A. Nagy áteresztőképességű szekvenciaillesztés grafikus feldolgozóegységekkel. BMC Bioinformatika. 20078:474 Elérhető: http://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-8-474. [idézve 2018. október 18.].

Nobile MS, Cazzaniga P, Tangherloni A, Besozzi D. Graphics processing units in bioinformatics, computational biology and systems biology. Rövid Bioinform. 201618:bbw058 Elérhető: https://academic.oup.com/bib/article-lookup/doi/10.1093/bib/bbw058. [idézve 2019. május 20.].

Angermueller C, Pärnamaa T, Parts L, Stegle O. Deep learning for computational biology. Mol Syst Biol. 201612:878 Elérhető: http://msb.embopress.org/content/12/7/878. [idézve 2019. május 20.].

Abadi M, Agarwal A, Barham P, Brevdo E, Chen Z, Citro C és munkatársai. TensorFlow: nagyléptékű gépi tanulás heterogén elosztott rendszereken 2016. Elérhető: http://arxiv.org/abs/1603.04467

Paszke A, Gross S, Chintala S, Chanan G, Yang E, DeVito Z, et al. Automatikus megkülönböztetés a PyTorch-ban. 2017


Siepel A, Bejerano G, Pedersen JS, Hinrichs AS, Hou M, Rosenbloom K, et al.Evolutionarily conserved elements in vertebrate, insect, worm, and yeast genoms. Genome Res. 2005, 15:1034–50.

Hindorff LA, Sethupathy P, Junkins HA, Ramos EM, Mehta JP, Collins FS, et al. Potential etiologic andfunctional implikations of genome-widessociation lókuszok az emberi betegségekre és tulajdonságokra. Proc Natl Acad Sci. 2009 106:9362–7.

Maurano MT, Humbert R, Rynes E, Thurman RE, Haugen E, Wang H és munkatársai. A szabályozó DNS gyakori betegséggel összefüggő variációinak szisztematikus lokalizációja. Tudomány. 2012, 337:1190–95.

Az ENCODE projekt, konzorcium. Az emberi genom DNS-elemeinek integrált enciklopédiája. Természet. 2012 489:57–74.

Yue F, Cheng Y, Breschi A, Vierstra J, Wu W, Ryba T et al.Egérgenom DNS-elemeinek összehasonlító enciklopédiája. Természet. 2014, 515:355–64.

Gerstein MB, Rozowsky J, Yan KK, Wang D, Cheng C, Brown JB és munkatársai. A transzkriptom összehasonlító elemzése távoli fajok között. Természet. 2014 512:445–8.

Vernot B, Stergachis AB, Maurano MT, Vierstra J, Neph S, Thurman RE, et al.Personal and population genomics of human regulatory variation. Genome Res. 2012 22:1689–97.

Kundaje A., Meuleman W., Ernst J., Bilenky M., Yen A., Heravi-Moussavi A. és munkatársai. 111 referencia humán epigenom integráló elemzése. Természet. 2015, 518:317–30.

Stergachis AB, Neph S, Sandstrom R, Haugen E, Reynolds AP, Zhang M, et al.Conservation of trans-acting circuitry during mammalian regulatory evolution. Természet. 2014, 515:365–70.

Cheng Y, Ma Z, Kim BH, Wu W, Cayting P, Boyle AP, et al.Principles of regulatory information conservation between mouse and human. Természet. 2014 515:371–5.

Schmidt D, Wilson MD, Ballester B, Schwalie PC, Brown GD, Marshall A és munkatársai. Az ötgerinces ChIP-seq feltárja a transzkripciós faktorok kötődésének evolúciós dinamikáját. Tudomány. 2010, 328:1036–40.

A FAANG Konzorcium. Az állatgenomok funkcionális annotációja (FAANG): összehangolt nemzetközi akció a genomnak a jelenséggé történő gyorsítására. http://www.faang.org. Hozzáférés dátuma: 2019. november 13.

Andersson L, Archibald AL, Bottema CD, Brauning R, Burgess SC, Burt DW et al.Koordinált nemzetközi fellépés a genom-jelenség felgyorsítására a FAANG, az Animal Genomes Functional Annotation Project segítségével. Genome Biol. 2015 16:57.

Tuggle CK, Giuffra E, White SN, Clarke L, Zhou H, Ross PJ és mtsai. GO-FAANG meeting: összejövetel az állati genomok funkcionális annotációjáról. Anim Genet. 2016 47:528–33.

Kern C, Wang Y, Chitwood J, Korf I, Delany M, Cheng H és mtsai.Szövetspecifikus hosszú nem kódoló RNS genomszintű azonosítása három haszonállatfajban. BMC Genomics. 2018 19:684.

Giuffra E, Tuggle CK, FAANG Konzorcium. Állatgenomok funkcionális annotációja (FAANG): jelenlegi eredmények és ütemterv. Ann Rev Anim Biosci. 2019 7:65–88.

Harrison P, Fan J, Richardson D, Clarke L, Zerbino D, Cochrane G és mtsai.FAANG, metaadat-szabványok, validálás és legjobb gyakorlatok megállapítása a tenyésztett és a kísérő állatok közössége számára. Anim Genet. 2018 49:520–6.

A FAANG Konzorcium. A FAANG Adatkoordinációs Központ. https://data.faang.org. Hozzáférés dátuma: 2019. november 11.

Az FR-AgENCODE csoport. FR-AgENCODE: FAANG kísérleti projekt az állatállomány genomjainak annotálására. http://www.fragencode.org. Hozzáférés dátuma: 2019. november 11.

Buenrostro JD, Giresi PG, Zaba LC, Chang HY, Greenleaf WJ. A natív kromatin transzpozíciója a nyitott kromatin, a DNS-kötő fehérjék és a nukleoszómapozíció gyors és érzékeny epigenomikus profilálásához. Nat Methods. 2013 10:1213–8.

Lieberman-Aiden E, Van Berkum NL, Williams L, Imakaev M, Ragoczy T, Telling A, et al.Comprehensive mapping of long-range interactions discovered folding Princips of the human genome. Tudomány. 2009, 326:289–93.

Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S et al.STAR: ultrafast universal RNA-seq aligner. Bioinformatika. 2013 29:15–21.

Dobin A, Gingeras TR. Az RNS-seq leolvasások leképezése STAR segítségével. Curr Protokoll Bioinform. 2015 51:11–4.

Li B, Dewey CN. RSEM: pontos transzkriptum mennyiségi meghatározása az RNA-Seq adatokból referencia genommal vagy anélkül. BMC Bioinformatika. 2011 12:323.

Mank JE. Nemi kromoszóma dóziskompenzáció: határozottan nem mindenkinek. Trends Genet. 2013 29:677–83.

Breschi A, Djebali S, Gillis J, Pervouchine DD, Dobin A, Davis CA, et al.Gene-specific patterns of expression variation among organs and species. Genome Biol. 2016 17:151.

Lin S, Lin Y, Nery JR, Urich MA, Breschi A, Davis CA, et al. Comparison of the transcriptional landscapes between human and egér szövetek. Proc Natl Acad Sci. 2014 111:17224–9.

Sudmant PH, Alexis MS, Burge CB. RNS-seq expressziós adatok metaanalízise fajok, szövetek és vizsgálatok között. Genome Biol. 287 16.

Robinson MD, McCarthy DJ, Smyth GK. edgeR: Bioconductor csomag digitális génexpressziós adatok differenciális expressziós elemzéséhez. Bioinformatika. 2010 26:139–40.

Melé M, Ferreira PG, Reverter F, DeLuca DS, Monlong J, Sammeth M, et al.The human transzkriptom a szöveteken és egyéneken át. Tudomány. 2015, 348:660–5.

Gerner W, Käser T, Saalmüller A. Sertés T-limfociták és NK-sejtek – frissítés. Dev Comp Immunol. 2009 33:310–20.

Guzman E, Hope J, Taylor G, Smith AL, Cubillos-Zapata C, Charleston B. Bovine γδ A T-sejtek a fő szabályozó T-sejtek alcsoportját alkotják. J Immunol. 2014 193:208–22.

Kapushesky M, Adamusiak T, Burdett T, Culhane A, Farne A, Filippov A et al.Gene Expression Atlas update – a microarray és szekvenálás alapú funkcionális genomikai kísérletek értéknövelt adatbázisa. Nucleic Acids Res. 2011, 40:D1077–81.

Petryszak R, Burdett T, Fiorelli B, Fonseca NA, Gonzalez-Porta M, Hastings E, et al.Expression Atlas update – a microarray- és szekvenáláson alapuló funkcionális genomikai kísérletekből származó gén- és transzkriptum-expressziós adatbázis. Nucleic Acids Res. 2014 42:D926–32.

Djebali S, Davis CA, Merkel A, Dobin A, Lassmann T, Mortazavi A, et al.Landscape of transcription in human cells. Természet. 2012, 489:101.

Wucher V, Legeai F, Hédan B, Rizk G, Lagoutte L, Leeb T, et al.FEELnc: a tool for long non-coding RNA annotation and its application to the dog transscriptome. Nucleic Acids Res. 2017 45:e57.

Derrien T, Johnson R, Bussotti G, Tanzer A, Djebali S, Tilgner H et al.The GENCODE v7 catalog of human long noncoding RNAs: analysis of their gene structure, evolution and expression. Genome Res. 2012 22:1775–89.

Muret K, Klopp C, Wucher V, Esquerré D, Legeai F, Lecerf F és mtsai. Hosszú nem kódoló RNS repertoár csirkemájban és zsírszövetben. Genet Sel Evol. 2017 49:6.

Lagarde J, Uszczynska-Ratajczak B, Santoyo-Lopez J, Gonzalez JM, Tapanari E, Mudge JM et al.Extension of human lncRNA transcripts by RACE coupled with long-read high-throughput Sequencing (RACE-Seq). Nat Commun. 2016 7:12339.

Hezroni H, Koppstein D, Schwartz MG, Avrutin A, Bartel DP, Ulitsky I. A hosszú, nem kódoló RNS evolúció alapelvei, amelyek 17 faj transzkriptumainak közvetlen összehasonlításából származnak. Cell Rep. 2015 11:1110–22.

Letunic I, Bork P. Interaktív életfa (iTOL) v3: online eszköz filogenetikai és egyéb fák megjelenítésére és megjegyzéseire. Nucleic Acids Res. 2016, 44:W242–5.

Villar D, Berthelot C, Aldridge S, Rayner TF, Lukk M, Pignatelli M, et al.Enhancer evolution into 20 emlősfaj. Sejt. 2015, 160:554–66. https://doi.org/10.1016/j.cell.2015.01.006.

Degner JF, Pai AA, Pique-Regi R, Veyrieras JB, Gaffney DJ, Pickrell JK és munkatársai. A DNS-I érzékenység A QTL-ek az emberi expressziós eltérések fő meghatározói. Természet. 2012, 482:390.

Qu K, Zaba LC, Giresi PG, Li R, Longmire M, Kim YH, et al.Individuality and variation of personal regulomes in primary human T cells. Cell System. 2015 1:51–61. https://doi.org/10.1016/j.cels.2015.06.003.

Scott-Browne JP, López-Moyado IF, Trifari S, Wong V, Chavez L, Rao A, et al.Dynamic changes in chromatin accessibility occur in CD8+ T cells responding to viral infection. Immunity. 2016 45:1327–40.

Thurman RE, Rynes E, Humbert R, Vierstra J, Maurano MT, Haugen E, et al.The accessible chromatin landscape of the human genome. Természet. 2012 489:75.

Rao S, Huntley M, Durand N, Stamenova E, Bochkov I, Robinson J, et al.A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Sejt. 2014 159:1665–80.

Servant N, Lajoie BR, Nora EP, Giorgetti L, Chen CJ, Heard E, et al.HiTC: exploration of high-throughput ‘C’ experiments. Bioinformatika. 2012 28:2843–4.

Durand NC, Shamim MS, Machol I, Rao SS, Huntley MH, Lander ES, et al.Juicer provides a one-click system for analyzing loop-resolution Hi-C experiments. Cell System. 2016 3:95–8.

Dixon JR, Selvaraj S, Yue F, Kim A, Li Y, Shen Y, et al.Topological domains in mammalian genomes identified by analysis of chromatin interactions. Természet. 2012 485:376–80.

Gong Y, Lazaris C, Sakellaropoulos T, Lozano A, Kambadur P, Ntziachristos P, et al.Stratification of TAD boundaries reveals preferential insulation of super-enhancers by strong boundaries. Nat Commun. 2018 9:542.

Crane E, Bian Q, McCord RP, Lajoie BR, Wheeler BS, Ralston EJ, et al.Condensin-driven remodelling of X chromosome topology during dosage compensation. Természet. 2015 523:240.

Sofueva S, Yaffe E, Chan WC, Georgopoulou D, Rudan MV, Mira-Bontenbal H, et al.Cohesin-mediated interactions organize chromosomal domain architecture. EMBO J. 2013 32:3119–29.

Rudan MV, Barrington C, Henderson S, Ernst C, Odom DT, Tanay A, et al.Comparative Hi-C reveals that CTCF underlies evolution of chromosomal domain architecture. Cell Rep. 2015 10:1297–309.

Filippova D, Patro R, Duggal G, Kingsford C. Identification of alternative topological domains in chromatin. Algoritm Mol Bio. 2014 9:14.

Dixon JR, Gorkin DU, Ren B. Chromatin domains: the unit of chromosome organization. Mol Cell. 2016 62:668–80.

Lupiáñez DG, Kraft K, Heinrich V, Krawitz P, Brancati F, Klopocki E, et al.Disruptions of topological chromatin domains cause pathogenic rewiring of gene-enhancer interactions. Sejt. 2015 161:1012–25.

Yang Y, Zhang Y, Ren B, Dixon JR, Ma J. Comparing 3D genome organization in multiple species using Phylo-HMRF. Cell System. 2019. https://doi.org/10.1101/552505.

Fishman V, Battulin N, Nuriddinov M, Maslova A, Zlotina A, Strunov A, et al.3D organization of chicken genome demonstrates evolutionary conservation of topologically associated domains and highlights unique architecture of erythrocytes’ chromatin. Nucleic Acids Res. 2018 47:648–65.

Harmston N, Ing-Simmons E, Tan G, Perry M, Merkenschlager M, Lenhard B. Topologically associating domains are ancient features that coincide with Metazoan clusters of extreme noncoding conservation. Nat Commun. 2017 8:441.

Dixon JR, Jung I, Selvaraj S, Shen Y, Antosiewicz-Bourget JE, Lee AY, et al.Chromatin architecture reorganization during stem cell differentiation. Természet. 2015 518:331.

Doynova MD, Markworth JF, Cameron-Smith D, Vickers MH, O’Sullivan JM. Linkages between changes in the 3D organization of the genome and transcription during myotube differentiation in vitro. Skelet Muscle. 2017 7:5.

Schmitt AD, Hu M, Jung I, Xu Z, Qiu Y, Tan CL, et al.A compendium of chromatin contact maps reveals spatially active regions in the human genome. Cell Rep. 2016 17:2042–59.

Djebali S, Wucher V, Foissac S, Hitte C, Corre E, Derrien T. Bioinformatics pipeline for transcriptome sequencing analysis. In: U Ørom, Enhancer RNAs, volume 1468. New York: Humana Press: 2017. p. 201–219.

Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, Van Baren MJ, et al.Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat Biotechnol. 2010 28:511–5.

Roberts A, Pimentel H, Trapnell C, Pachter L. Identification of novel transcripts in annotated genomes using RNA-Seq. Bioinformatika. 2011 27:2325–9.

Rohart F, Gautier B, Singh A, Lê Cao KA. mixOmics: an R package for omics feature selection and multiple data integration. PLoS Comput Biol. 2017 13:005752.

Kinsella RJ, Kähäri A, Haider S, Zamora J, Proctor G, Spudich G, et al.Ensembl BioMarts: a hub for data retrieval across taxonomic space. Adatbázis. 2011 2011:bar030.

Robinson MD, Oshlack A. A scaling normalization method for differential expression analysis of RNA-seq data. Genome Biol. 2010 11:R25.

McCarthy DJ, Chen Y, Smyth GK. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Res. 2012 40:4288–97.

Benjamini Y, Hochberg Y. Controlling the false discovery rate: a practical and powerful approach to multiple testing. J R Stat Soc Ser B (Methodol) 57:289–300.

Falcon S, Gentleman R. Using GOstats to test gene lists for GO term association. Bioinformatika. 2006 23:257–8.

Breiman L. Random forests. Mach Learn. 2001 45:5–32.

Langmead B, Salzberg SL. Gyors hézagmentes olvasási igazítás a Bowtie 2. Nat Methods segítségével. 2012 9:357–9.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, et al.The sequence alignment/map format and SAMtools. Bioinformatika. 2009 25:2078–9.

Feng J, Liu T, Qin B, Zhang Y, Liu XS. Identifying ChIP-seq enrichment using MACS. Nat Protocol. 2012 7:1728–40.

Quinlan AR. BEDTools: the Swiss-army tool for genome feature analysis. Curr Protocol Bioinform. 2014 47:11–2.

Ballman KV, Grill DE, Oberg AL, Therneau TM. Faster cyclic loess: normalizing RNA arrays via linear models. Bioinformatika. 2004 20:2778–86.

Lun AT, Smyth GK. csaw: a Bioconductor package for differential binding analysis of ChIP-seq data using sliding windows. Nucleic Acids Res. 2015 44:e45.

Grant CE, Bailey TL, Noble WS. FIMO: scanning for occurrences of a given motif. Bioinformatika. 2011 27:1017–8.

Mathelier A, Fornes O, Arenillas DJ, Chen Cy, Denay G, Lee J, et al.JASPAR 2016: a major expansion and update of the open-access database of transcription factor binding profiles. Nucleic Acids Res. 2015 44:D110–5.

Servant N, Varoquaux N, Lajoie BR, Viara E, Chen CJ, Vert JP, et al.HiC-Pro: an optimized and flexible pipeline for Hi-C data processing. Genome Biol. 2015 16:259.

Imakaev M, Fudenberg G, McCord RP, Naumova N, Goloborodko A, Lajoie BR, et al.Iterative correction of Hi-C data reveals hallmarks of chromosome organization. Nat Methods. 2012 9:999–1003.

Durand NC, Robinson JT, Shamim MS, Machol I, Mesirov JP, Lander ES, et al.Juicebox provides a visualization system for Hi-C contact maps with unlimited zoom. Cell System. 2016 3:99–101.

Barrett T, Clark K, Gevorgyan R, Gorelenkov V, Gribov E, Karsch-Mizrachi I, et al.BioProject and BioSample databases at NCBI: facilitating capture and organization of metadata. Nucleic Acids Res. 2012 40(Database issue):D57–63. https://doi.org/10.1093/nar/gkr1163.

EMBL-EBI. BioSamples. https://www.ebi.ac.uk/biosamples. Accessed 13 Nov 2019.


Mód

Three types of data were required for this research: species abundance within angiosperm (and conifer) taxa at various levels, total annual value worldwide of plant products, by species, and a list of species whose genome sequence has been published. Our initial data on plants that have been sequenced was collected from the National Centre for Biotechnology Information (NCBI). This list was not comprehensive, since plants whose genomes had been sequenced recently at the time of the data collection (spring of 2015), such as Ananas comosus (pineapple) [8], Coffea canephora (Robusta coffee) [9], Musa balbisiana (wild banana) [10], and Utricularia gibba (humped bladderwort) [11] were not present in the NCBI list. We added as many of these we could find to our list and included them in the analysis. We have continued updating to May 2016.

In all, we found 202 distinct species whose genome had been sequenced however, only 172 were useful to the present study. All algae and mosses were dropped, due to the lack of any economic data. The remaining species, confined to the flowering plants (angiosperms) and the conifer order of gymnosperms, were classified by taxonomic class or subclass, order, family and genus, based on the APG III system of flowering plant classification [12]. The APG system was chosen rather than the Cronquist or other system [13], since it is continually updated to reflect recent plant DNA evidence and other data.

This dataset is available at: http://216.48.92.133/Softwares/PlantGenomes/index.htm . As more plant genomes are sequenced, more families and orders will be included. A fragment of this dataset is depicted in Table 1.

Next, economic data relating to agricultural and forestry products was collected. For agricultural products, this data was compiled from the Food and Agriculture Organization of the United Nations [14]. For agricultural production, the most recent data on economic value is dated from 2013. This data is presented in current US dollars.

Data on forestry products was compiled from a United Nations Economic Commission for Europe Timber Division report on the forestry industry published in 2006 [15]. The data included information on roundwood and sawnwood, for both conifers and non-conifer trees. The conifer section included data on pine, fir, and spruce, and information on birch, beech, poplar, and oak was found in the non-conifer section. Unfortunately, the data dated back to 2004 and only included select countries, notably European and North American. More recent world data for total roundwood and sawnwood production did not provide a breakdown by tree type. The UNECE/FAO Timber Division report provided exports for each country and from this data we aggregated across all countries the total value by each type of tree. This was done for both the sawnwood and roundwood data, and then summed for a grand total for each tree type. This number was then used as the economic value for each type of tree.

After having collected the economic value for all agricultural (including horticultural and other uses) and forestry products, we classified all sequenced species taxonomically according to APG III. For analytical purposes, we retained only order and family, as class/subclass was not of high enough resolution for meaningful analysis, while genus was too high a resolution, since for almost all the species we studied no economic data distinguished between species in the same genus. Once all products were classified, we calculated an aggregate value of for each family and order. Note that some species of economic value belong to a family and even to an order containing no genome-sequenced species when these data were collected.

The data on the total number of species in all of the families and orders was collected from The Plant List [16] and the Encyclopaedia Britannica [17], respectively.

From these data, we constructed Table 2, reflecting all the families found from both the agricultural and forestry products data, as well as from the list of plants sequenced. Only families containing species that have been sequenced, or have economic value, are included. Similarly, Table 3 was constructed for taxonomic orders. Almost a half of all angiosperm and gymnosperm plant orders, but less than a sixth of all families are present in these tables.

An overall summary of the data is presented in Table 4. Of note is the order Poales with 32 genomes sequenced, 31 in the family Poaceae (grasses) plus pineapple. For 15 families with species of economic value, we found no genome sequences have as yet been published, most of them in the six orders containing species of economic value but with no published sequences.


Sharing research data is as important as publishing in a journal or book. Find out about our research data products and services

We are a global publisher dedicated to providing the best possible service to the whole research community. We help authors to share their discoveries enable researchers to find, access and understand the work of others and support librarians and institutions with innovations in technology and data.

We use our position and our influence to champion the issues that matter to the research community – standing up for science taking a leading role in open research and being powerful advocates for the highest quality and ethical standards in research.


Nézd meg a videót: Introduction to Good Scientific Practice with Daniel Strech. Good Scientific Practice Symposium (Lehet 2022).