Információ

Hogyan kell értelmezni az L-Alanine PubChem rekordját

Hogyan kell értelmezni az L-Alanine PubChem rekordját


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Az NCBI PUG szolgáltatását használva 3d szerkezeti adatokat kérek le egy molekulához.

Nyers adatok itt.

Megpróbálom megérteni ezt a rekordot, kifejezetten abból a célból, hogy 3D-s koordinátarendszerben jelenítsem meg a threejs használatával.

Valaki tudna segíteni ennek az információnak a megértésében. A json válasz nagy mérete és a javascript használata miatt létrehoztam néhány Typescript típust, amelyek leírják az adatok alakját, hogy segítsék a vitát. Konkrét kérdéseim vannak, amelyeket az alábbiakban közölünk.

//// Root Object interfész JSON_Response { PC_Compounds: PC_Compound[]; } //// Összetett objektum // a PubChem Compound interfész PC_Compound { id: ID; atomok: { segédeszköz: szám[]; elem: szám[]; }; kötvények: { segély1: szám[]; segély2: szám[]; Rendelésszám[]; }; sztereó: Sztereó[]; koordináták: Coords[]; kellékek: Adatok[]; count: Count; } //////// Az alábbiakban ismertetett altípusok

Atomok

Az atomok objektumnak két tömbje van; 'segéd' és 'elem'. A fenti JSON-válaszban ezek a tömbök egyaránt 13 hosszúak. Az L-alanin adatai azt mutatják, hogy 13 atomja van. Jól mondom, hogy az „elem” tömbben lévő számok az atomszámoknak felelnek meg? És ezek az atomszámok az 'id' tömb megfelelő indexeiből vannak hozzárendelve az azonosítókhoz?

Kötvények

Mi az aid1, aid2 és order? Ezek a tömbök mindegyike 12 bejegyzésből áll, így mindegyiknek 1 kötést kell képviselnie két atom között. De minek felelnek meg a számértékek? Hogyan kell értelmezni őket?

Koordináták

A koordináta objektumban

interface Coords { type: number[]; segédeszköz: szám[]; konformerek: [ { x: szám[]; y: szám[]; z: szám[]; adatok: Adatok[]; } ]; adatok: Adatok[]; }

Az x, y és z tömbök 13 hosszúságúak. Jól gondolom, hogy ezek az atomok x, y és z koordinátáit jelentik a fenti elemtömb megfelelő indexében?

Adat

Úgy tűnik, hogy a Data Object egy ezoterikus rendszer része, amely tetszőleges adatokat csatol az objektumhoz. Ha valakinek van erre tippje, azt nagyon megköszönném.

interface Data { urn: { label: string; név: string; adattípus: szám; kiadás: string; verzió?: string; szoftver?: string; forrás?: string; paraméterek?: string; }; érték: { sval?: string; fval?: szám; slist?: string[]; fvec?: szám[]; ivec?: szám[]; }; }

Sztereó

úgy tűnik, hogy a forgási síkokat írja le

//// Összetett altípusok interfész Sztereó { tetraéder: { center: szám; fent: szám; felső: szám; alsó: szám; alul: szám; paritás: szám; típus: szám; }; } interfész azonosító { id: { cid: szám; }; }

különféle kémiai információk

interfész Szám { heavy_atom: szám; atom_királis: szám; atom_chiral_def: szám; atom_chiral_undef: szám; bond_királis: szám; bond_chiral_def: szám; bond_chiral_undef: szám; izotóp_atom: szám; kovalens_egység: szám; tautomerek: szám; }

Ezen kívül, ha valakinek van valamilyen technikája vagy tanácsa arra vonatkozóan, hogyan lehet jelentést kinyerni a PubChem válaszadataiból, ha tudna, az alább posztolni jól jöhet nekem vagy más, ezen a területen dolgozó személynek.


A PubChem formátum leírását nem olyan könnyű megtalálni: https://www.ncbi.nlm.nih.gov/IEB/ToolBox/CPP_DOC/asn_spec/pcsubstance.asn.html

És az itt linkelt ASN-fájl: https://pubchemdocs.ncbi.nlm.nih.gov/data-specification

Jól mondom, hogy az „elem” tömbben lévő számok az atomszámoknak felelnek meg?

Igen, az 1 a hidrogén, a 6 a szén, a 8 az oxigén stb.

És ezek az atomszámok az 'id' tömb megfelelő indexeiből vannak hozzárendelve az azonosítókhoz?

a te példádban"atomok": {"segítség": [1, 2, 3,… , 13], "elem": [8, 8, 7,… , 1]},, az első atom azonosítója a következő lenne1és elem8(oxigén), a harmadik atom: ID3és elem7(nitrogén).

Jól gondolom, hogy ezek az atomok x, y és z koordinátáit jelentik a fenti elemtömb megfelelő indexében?

Igen

Mi az aid1, aid2 és order?

segély1éssegély2vannak aatomidösztönzők.rendelésa kötvény típusa.

Ezek a tömbök mindegyike 12 bejegyzésből áll, így mindegyiknek 1 kötést kell képviselnie két atom között. De minek felelnek meg a számértékek? Hogyan kell értelmezni őket?

Példáulaid1 = [1, 2], aid2 = [3, 4], sorrend = [1, 2]az 1. és 3. atom között egyes kötést, a 2. és 4. atom között pedig kettős kötést jelent.

Jó példák a megvalósításra:


PubChemRDF: a PubChem vegyület- és anyagadatbázisok szemantikai annotációja felé

A PubChem a kémiai szerkezetek, a biológiai tevékenységek és az orvosbiológiai megjegyzések nyílt tárháza. A szemantikus webes technológiák a tudományos adatok terjesztésének és integrálásának egyre fontosabb megközelítéseként jelennek meg. A PubChem adatok szemantikus webszolgáltatásoknak való kitétele elősegítheti az automatikus adatintegrációt és -kezelést, valamint megkönnyítheti az interoperábilis webalkalmazásokat.

Leírás

Ez a munka, amely a PubChemRDF projektet lefedő sorozat egyike, egy megközelítést ír le a PubChem anyag- és vegyületinformációinak Resource Description Framework (RDF) formátumba történő fordítására. Használatának bemutatására alapvető példák szolgálnak. Ennek az erőfeszítésnek az a célja, hogy költséghatékony módon két új elsődleges előnyt biztosítson a kutatóknak. Először is arra törekszünk, hogy megszüntessük a PubChem webalapú erőforrás használatának korlátait azáltal, hogy lehetővé tesszük a kutatók számára, hogy könnyen elérhető szemantikai technológiákat (nevezetesen az RDF hármas tárolókat és a hozzájuk tartozó SPARQL lekérdező motorokat) használhassanak PubChem adatok lekérdezésére és elemzésére a helyi számítási erőforrásokon. . Másodszor, ennek a munkának az a célja, hogy elősegítse a PubChem adatok adatmegosztását, elemzését és integrációját az NCBI-n kívüli erőforrásokba és a tudományos területeken keresztül, a PubChem adatok meglévő ontológiai keretrendszerekhez való társítása révén, beleértve a KÉMIAI INFORMÁCIÓ ontológiát, a Semanticscience Integrated Ontologyt, és mások.

Következtetések

A PubChem archívumában elérhető információk szemantikai leírása érdekében a már meglévő ontológiai keretrendszereket használták fel, nem pedig újakat. Leírják a vegyületek és anyagok közötti szemantikai kapcsolatokat, a vegyületekhez és anyagokhoz kapcsolódó kémiai leírókat, a vegyi anyagok közötti összefüggéseket, valamint az anyagok származási és attribútum-metaadatait.

A PubChem vegyületek és anyagok szemantikai kapcsolatainak sematikus ábrázolása.


Hogyan kell értelmezni az L-alanin PubChem rekordját - Biológia

Átfogó kézikönyv az NCBI C++ eszközkészletről, beleértve a tervezési és fejlesztési keretrendszert, egy C++ könyvtári hivatkozást, szoftverpéldákat és demókat, GYIK-et és kiadási megjegyzéseket. A kézikönyv online kereshető, és PDF-dokumentumsorozatként letölthető.

Letöltések

A helyi használatra szánt BLAST végrehajtható fájlok Solaris, LINUX, Windows és MacOSX rendszerekhez biztosítottak. További információért lásd a README fájlt az ftp könyvtárban. A BLAST nukleotid-, fehérje- és lefordított keresésekhez előre formázott adatbázisok is letölthetők a db alkönyvtárban.

Sorozat-adatbázisok az önálló BLAST programokkal való használatra. Az ebben a könyvtárban található fájlok előre formázott adatbázisok, amelyek készen állnak a BLAST használatára.

Ez a webhely teljes adatrekordot biztosít a CDD-hez, valamint az egyedi pozícióspecifikus pontozási mátrixokat (PSSM), mFASTA szekvenciákat és megjegyzésadatokat minden egyes konzervált tartományhoz. A részletekért lásd a README fájlt.

Ez a webhely teljes adatkivonatot biztosít XML-ben és összefoglaló adatokat VCF formátumban. Fájlokat tartalmaz, amelyek a ClinVarban, a MedGenben és a GTR-ben használt szabványos kifejezésekkel kapcsolatos információkat tartalmaznak.

Sorozat-adatbázisok FASTA formátumban az önálló BLAST programokkal való használatra. Ezeket az adatbázisokat a formatdb használatával kell formázni, mielőtt a BLAST-tal használhatók.

Ez a webhely a GenBank összes szekvenciarekordjához tartozó fájlokat tartalmazza az alapértelmezett sima fájlformátumban. A fájlokat a GenBank részleg rendezi, a teljes tartalom leírása a README.genbank fájlban található.

A GenBank kódoló szekvenciák (CDS) fordításainak megfelelő fehérjeszekvenciákat minden GenBank kiadáshoz összegyűjtjük. További információkért tekintse meg a README fájlt a könyvtárban.

Ez a webhely három könyvtárat tartalmaz: DATA, GeneRIF és eszközök. A DATA könyvtár olyan fájlokat tartalmaz, amelyek felsorolják a GeneID-ekhez kapcsolódó összes adatot, valamint a Gene rekordokhoz tartozó ASN.1 adatokat tartalmazó alkönyvtárakat. A GeneRIF (Gene References into Function) könyvtár PubMed-azonosítókat tartalmaz azon cikkekhez, amelyek egyetlen gén funkcióját vagy két gén termékei közötti kölcsönhatásokat írják le. A génadatok manipulálására szolgáló mintaprogramok az eszközök könyvtárban találhatók. Kérjük, nézze meg a README fájlt a részletekért.

Ez az oldal két formátumban tartalmaz GEO adatokat: SOFT (Simple Omnibus in Text Format) és MINiML (MIAME Notation in Markup Language). Összefoglaló szöveges fájlok és kiegészítő adatok is rendelkezésre állnak. További információkért tekintse meg a README.TXT fájlt.

Ez az oldal genomszekvenciát és feltérképezési adatokat tartalmaz az Entrez Genome szervezeteihez. Az adatok az egyes fajokhoz vagy fajcsoportokhoz tartozó könyvtárakba vannak rendezve. A térképadatokat a MapView könyvtárban gyűjtjük, és fajok szerint rendezzük. Részletes információkért lásd a README fájlt a gyökérkönyvtárban és a README fájlokat a fajok alkönyvtárában.

Minden genomhoz könyvtárakat tartalmaz, amelyek az adott genom jelenlegi és korábbi buildjéhez elérhető leképezési adatokat tartalmaznak.

Ez az oldal tartalmazza a teljes taxonómiai adatbázist, valamint a nukleotid- és fehérjeszekvencia rekordokat a taxonómiai azonosítóikkal társító fájlokat. További információért tekintse meg a taxdump_readme.txt és gi_taxid.readme fájlokat.

Ez az oldal a PubChem Substance, Compound és Bioassay adatbázisból szolgáltat adatokat az ftp-n keresztüli letöltéshez. Az adatbázisok teljes letöltése elérhető a Substance and Compound napi, heti és havi frissítésével együtt. Az anyagok és vegyületek adatai ASN.1, SDF és XML formátumban állnak rendelkezésre. További információért lásd a README fájlokat.

Ez az oldal tartalmazza a Referenciaszekvencia (RefSeq) gyűjteményben található összes nukleotid- és fehérjeszekvencia rekordot. A ""release"" könyvtár tartalmazza a teljes gyűjtemény legfrissebb kiadását, míg a kiválasztott organizmusok (például ember, egér és patkány) adatai külön könyvtárakban érhetők el. Az adatok FASTA és flat fájlformátumban állnak rendelkezésre. A részletekért lásd a README fájlt.

Ez az oldal SKY-CGH adatokat tartalmaz ASN.1, XML és EasySKYCGH formátumban. További információért tekintse meg a skycghreadme.txt fájlt.

Letölthető adatok az SNP-hez.

Ez az oldal a benyújtott szekvenálási projekt által szervezett következő generációs szekvenálási adatokat tartalmaz.

FTP-letöltő oldal NCBI adatbázisokhoz, eszközökhöz és segédprogramokhoz.

Ez a webhely ASN.1-adatokat tartalmaz az MMDB-ben lévő összes rekordhoz, valamint a VAST-igazítási adatokat és a nem redundáns PDB (nr-PDB) adatkészleteket. További információért lásd a README fájlt.

Ez az oldal tartalmazza a kromatogram nyomkövetési adatait fajok szerint rendezve. Az adatok közé tartozik a kromatogram, a minőségi pontszámok, az automatikus alaphívásokból származó FASTA-szekvenciák és egyéb kiegészítő információk tabulátorral tagolt szövegben, valamint XML-formátumban. A részletekért lásd a README fájlt.

Ez az oldal tartalmazza az UniVec és UniVec_Core adatbázisokat FASTA formátumban. A részletekért lásd a README.uv fájlt.

Ez az oldal a teljes genom shotgun szekvencia adatokat tartalmazza a 4 számjegyű projektkód szerint. Az adatok közé tartoznak a GenBank és GenPept lapos fájlok, minőségi pontszámok és összefoglaló statisztikák. További információkért tekintse meg a README.genbank.wgs fájlt.

A nyílt hozzáférésű adatok általában tartalmazzák a genotípus/fenotípus asszociációs vizsgálatok összefoglalóit, a mért változók leírását és a vizsgálati dokumentumokat, például a protokollt és a kérdőíveket. Az egyéni szintű adatokhoz való hozzáférés, beleértve a fenotípusos adattáblázatokat és a genotípusokat, különböző szintű jogosultságokat igényel.

Az ASN.1 vagy DTD formátumú NCBI adatok specifikációi a data_specs mutatója oldalon érhetők el. Az "NCBI_data_conversion.html" hivatkozás a konverziós eszközre mutat.

Címkekészletek folyóiratcikkek készítéséhez és archiválásához, valamint folyóiratcikkek átviteléhez a kiadóktól az archívumokba és az archívumok között. Négy címkekészlet létezik: Archiválási és cserecímkekészlet – Azért hozták létre, hogy az archívum a lehető legkényelmesebben rögzítse a meglévő nyomtatott és címkézett folyóirat-anyag szerkezeti és szemantikai összetevőit. és ellenőrizni a tartalmukat, hogy ne fogadják el az adott kiadó által bemutatott sorrendet és elrendezést Cikkszerkesztő címkekészlet - Új folyóiratcikkek készítésére tervezték NCBI Book Tag Set - Kifejezetten az NCBI online könyvtárai köteteinek leírására készült.

Ez a szolgáltatás lehetővé teszi a felhasználók számára, hogy letöltsék a PubChem azonosítókészletnek megfelelő vegyület- vagy anyagrekordokat, amelyeket manuálisan vagy szöveges fájlon keresztül lehet megadni. Számos letöltési formátum érhető el, köztük az SDF, az XML és a SMILES.

Iratkozzon fel a web/RSS-hírcsatornákra az NCBI-forrásokkal kapcsolatos frissítésekért.

Beadványok

Egy online űrlap, amely felületet biztosít kutatók, konzorciumok és szervezetek számára bioprojektjeik regisztrálásához. Ez szolgál kiindulópontul a genomikai és genetikai adatok vizsgálathoz történő benyújtásához. Az adatokat a BioProject regisztrációkor nem kell megadni.

Egy webalapú sorozatbeküldő eszköz egy vagy néhány beküldéshez a GenBank adatbázisba, amelyet a benyújtási folyamat gyors és egyszerű elvégzésére terveztek.

Eszköz a vonalkód rövid nukleotidszekvenciák GenBank adatbázisába történő benyújtásához egy szabványos genetikai lókuszról fajok azonosítására.

Az NCBI által kifejlesztett önálló szoftvereszköz nyilvános szekvencia-adatbázisok (GenBank, EMBL vagy DDBJ) bejegyzéseinek benyújtására és frissítésére. Képes kezelni az egyszerű beadványokat, amelyek egyetlen rövid mRNS-szekvenciát tartalmaznak, összetett beadványokat, amelyek hosszú szekvenciákat tartalmaznak, több megjegyzést, szegmentált DNS-készleteket, valamint filogenetikai és populációs vizsgálatokból származó szekvenciákat, illesztésekkel. Az egyszerű benyújtáshoz használja inkább a BankIt online benyújtó eszközt.

Parancssori program, amely automatizálja a sorozatrekordok létrehozását a GenBanknak történő benyújtáshoz, a Sequin-hez hasonló funkciók használatával. Elsősorban teljes genomok és nagy szekvencia-kötegek benyújtására használják.

Küldjön el kifejezési adatokat, például microarray, SAGE vagy tömegspektrometriás adatkészleteket az NCBI Gene Expression Omnibus (GEO) adatbázisába.

Ez az oldal lehetővé teszi a felhasználók számára, hogy adatokat küldjenek be a PubChem Substance és BioAssay adatbázisába, beleértve a kémiai szerkezeteket, a kísérleti biológiai aktivitás eredményeit, a megjegyzéseket, az siRNS-adatokat és egyebeket. Használható a korábban benyújtott rekordok frissítésére is.

Az SNP-adatbázis eszközök oldala hivatkozásokat tartalmaz az általános benyújtási irányelvekre és a benyújtási kezelési kérésre. Az oldalon két konkrét hivatkozás is található az emberi variációs adatok egyszeri vagy kötegelt benyújtásához a Human Genome Variation Society nómenklatúráján.

Egyetlen belépési pont a beküldők számára, ahol az NCBI összes adatszolgáltatási folyamatára hivatkozhatnak, és információkat találhatnak azokról. Jelenleg ez szolgál interfészként a BioProjects és BioSamples regisztrációhoz, valamint a WGS és GTR adatok benyújtásához. Tervezzük az oldal jövőbeli kiegészítését.

Ez a hivatkozás leírja, hogy a nyomkövetési adatok beküldői hogyan szerezhetnek biztonságos NCBI FTP-helyet adataikhoz, valamint leírja a megengedett adatformátumokat és címtárstruktúrákat.

Eszközök

BLAST keresést végez hasonló szekvenciák után kiválasztott teljes eukarióta és prokarióta genomokból.

BLAST keresést végez a RefSeqGene/LRG készletben található genomi szekvenciák között. Az alapértelmezett kijelző készenléti navigációt biztosít az igazítások áttekintéséhez a Grafikus képernyőn.

Megkeresi a lokális hasonlóság régióit a biológiai szekvenciák között. A program összehasonlítja a nukleotid- vagy fehérjeszekvenciákat szekvencia-adatbázisokkal, és kiszámítja az egyezések statisztikai szignifikanciáját. A BLAST felhasználható a szekvenciák közötti funkcionális és evolúciós kapcsolatokra, valamint a géncsaládok tagjainak azonosítására.

Lehetővé teszi rekordok lekérését számos Entrez-adatbázisból, ha feltölt egy GI-t vagy hozzáférési számokat a Nukleotid- vagy Protein-adatbázisból, vagy egy egyedi azonosítót tartalmazó fájlt más Entrez-adatbázisokból. A keresési eredmények különféle formátumokban közvetlenül a számítógépen lévő helyi fájlba menthetők.

Egy önálló alkalmazás fehérjeszekvenciák osztályozására és evolúciós kapcsolataik vizsgálatára. A CDTree képes importálni, elemezni és frissíteni a meglévő Conserved Domain (CDD) rekordokat és hierarchiákat, és lehetővé teszi a felhasználók számára, hogy létrehozzák sajátjukat. A CDTree szorosan integrálva van az Entrez CDD-vel és a Cn3D-vel, és lehetővé teszi a felhasználók számára, hogy fehérjedomén-illesztéseket hozzanak létre és frissítsenek.

A COBALT egy fehérje többszörös szekvencia illesztési eszköz, amely a konzervált domén adatbázisból, a fehérje motívum adatbázisból és a szekvencia hasonlóságból származó páronkénti megszorítások gyűjteményét találja meg RPS-BLAST, BLASTP és PHI-BLAST használatával.

Egy önálló alkalmazás az NCBI Entrez visszakereső szolgáltatásának háromdimenziós struktúráinak megtekintésére. A Cn3D Windows, Macintosh és UNIX rendszeren fut, és beállítható úgy, hogy adatokat fogadjon a legtöbb népszerű webböngészőből. A Cn3D egyszerre jeleníti meg a struktúrát, a sorrendet és az igazítást, valamint hatékony megjegyzés- és igazításszerkesztő funkciókkal rendelkezik.

Azonosítja a fehérjeszekvenciában jelen lévő konzervált doméneket. A CD-Search az RPS-BLAST (Reverse Position-Specific BLAST) segítségével hasonlítja össze a lekérdezési szekvenciát a Conserved Domain Database (CDD) konzervált tartomány-illesztéseiből előállított pozíció-specifikus pontszámmátrixokkal.

Eszközök, amelyek hozzáférést biztosítanak az NCBI Entrez rendszerén belüli adatokhoz a normál webes lekérdezési felületen kívül. Módszert biztosítanak az Entrez-feladatok automatizálására szoftveralkalmazásokon belül. Mindegyik segédprogram speciális visszakeresési feladatot hajt végre, és egyszerűen használható egy speciálisan formázott URL megírásával.

Eszköz egy lekérdezési szekvencia (nukleotid vagy fehérje) és a GEO adatbázisban található microarray vagy SAGE platformokon található GenBank szekvenciákhoz való igazítására.

Ez az eszköz összehasonlítja a nukleotid- vagy fehérjeszekvenciákat genomiális szekvencia-adatbázisokkal, és a Basic Local Alignment Search Tool (BLAST) algoritmus segítségével kiszámítja az egyezések statisztikai szignifikanciáját.

Az NCBI Remap eszköze lehetővé teszi a felhasználók számára, hogy annotációs adatokat vetítsenek ki, és egy bázisonkénti elemzéssel konvertálják a jellemzők helyét az egyik genomi összeállításból a másikba vagy RefSeqGene szekvenciákká. Lehetőségek állnak rendelkezésre az újraleképezés szigorúságának beállítására, és az összefoglaló eredmények megjelennek a weboldalon. A teljes eredmények letölthetők megtekintéshez az NCBI Genome Workbench grafikus megjelenítőjében, és letölthetők az újratérképezett funkciók annotációs adatai, valamint az összefoglaló adatok is.

Integrált alkalmazás sorozatadatok megtekintésére és elemzésére. A Genome Workbench segítségével megtekintheti az NCBI nyilvánosan elérhető szekvencia-adatbázisainak adatait, és ezeket az adatokat keverheti saját adataival.

Interaktív webalkalmazás, amely lehetővé teszi a felhasználók számára, hogy több, adatbázis-keresési eredmények vagy más szoftveralkalmazások által létrehozott igazítást is megjelenítsenek. Az MSA Viewer lehetővé teszi a felhasználók számára, hogy feltöltsenek egy igazítást és állítsanak be egy fő szekvenciát, valamint felfedezzék az adatokat olyan funkciók segítségével, mint a nagyítás és a színezés megváltoztatása.

Szoftver- és adatcsere-specifikációk készlete, amelyet az NCBI használ hordozható, moduláris szoftverek előállításához a molekuláris biológiához. Az Eszköztár szoftverét elsősorban az Abstract Syntax Notation 1 (ASN.1) formátumú rekordok olvasására tervezték, amely a Nemzetközi Szabványügyi Szervezet (ISO) adatábrázolási formátuma.

Nyilvános minőségbiztosítási szoftvercsomag, amely lehetővé teszi a multiplex rövid tandem ismétlődő (STR) DNS-profilok laboratórium-specifikus protokollok alapján történő értékelését. Az OSIRIS a nyers elektroforézisadatokat egy független, matematikai alapú méretezési algoritmus segítségével értékeli ki. Két új csúcsminőségi mérőszámot kínál – illeszkedési szintet és maradék méretezést. Testreszabható a laboratórium-specifikus aláírásokhoz, például a háttérzaj beállításokhoz, a testreszabott elnevezési konvenciókhoz és a további belső laboratóriumi vezérlőkhöz.

Grafikus elemző eszköz, amely megtalálja az összes nyitott olvasási keretet a felhasználó sorozatában vagy egy már az adatbázisban lévő sorozatban. Tizenhat különböző genetikai kód használható. A kikövetkeztetett aminosavszekvencia különféle formátumokban menthető, és a BLAST segítségével fehérje adatbázisokban kereshető.

A Primer-BLAST eszköz a Primer3-at használja a PCR primerek szekvencia-sablonhoz való tervezésére. A potenciális termékeket ezután automatikusan elemzik egy BLAST kereséssel a felhasználó által megadott adatbázisok alapján, hogy ellenőrizzék a kívánt cél specifikusságát.

Segédprogram a fehérjék genomi nukleotidszekvenciához való igazításának kiszámításához. A Needleman Wunsch globális igazítási algoritmus egy változatán alapul, és kifejezetten az intronokat és a splice jeleket veszi figyelembe. Ennek az algoritmusnak köszönhetően a ProSplign pontosan meghatározza az illesztési helyeket, és toleráns a szekvenálási hibákkal szemben.

A PUG programozott felületen keresztül hozzáférést biztosít a PubChem szolgáltatásokhoz. A PUG lehetővé teszi a felhasználók számára az adatok letöltését, a kémiai szerkezetek keresését, a kémiai szerkezetek szabványosítását és az E-közművekkel való interakciót. A PUG szabványos URL-címekkel vagy SOAP-on keresztül érhető el.

A PubChem terminológiájában a szabványosítás a kémiai struktúrák feldolgozása, ugyanúgy, mint a PubChem Compound rekordok létrehozásához a közreműködők eredeti struktúráiból. Ez a szolgáltatás lehetővé teszi a felhasználók számára, hogy a PubChem hogyan kezelje az általuk benyújtani kívánt struktúrákat.

A PubChem Structure Search lehetővé teszi a PubChem Compound Database kémiai szerkezet vagy kémiai szerkezeti minta alapján történő lekérdezését. A PubChem Sketcher lehetővé teszi a lekérdezések manuális elkészítését. A felhasználók megadhatják a strukturális lekérdezés bevitelét PubChem Compound Identifier (CID), SMILES, SMARTS, InChI, Molecular Formula vagy egy támogatott szerkezeti fájlformátum feltöltésével is.

Számos eszköz áll rendelkezésre az SNP adatbázisban való kereséshez, lehetővé téve a keresést genotípus, módszer, populáció, beküldő, markerek és szekvencia-hasonlóság alapján a BLAST segítségével. Ezek a dbSNP főoldalának bal oldali sávjában található "Keresés" alatt találhatók.

Konfigurálható grafikus megjelenítést biztosít egy nukleotid- vagy fehérjeszekvenciáról és a szekvencián megjegyzésekkel ellátott jellemzőkről. Az NCBI sorozatadatbázis-oldalakon való használat mellett ez a megjelenítő beágyazható weboldal-összetevőként is elérhető. Részletes dokumentáció, beleértve az API-referencia útmutatót, elérhető azon fejlesztők számára, akik be szeretnék ágyazni a megjelenítőt saját oldalaikra.

Egy segédprogram cDNS-Genomikus szekvencia-illesztések kiszámításához. A Needleman-Wunsch globális igazítási algoritmus egy változatán alapul, és kifejezetten az intronokat és a splice jeleket veszi figyelembe. Ennek az algoritmusnak köszönhetően a Splign pontosan meghatározza az illesztési helyeket, és toleráns a szekvenálási hibákkal szemben.

Eszköz filogenetikai faadatok létrehozására és megjelenítésére. A Tree Viewer lehetővé teszi saját sorozatadatainak elemzését, nyomtatható vektorképeket PDF-formátumban készít, és beágyazható egy weboldalba.

Rendszer egy nukleinsavszekvencia azon szegmenseinek gyors azonosítására, amelyek vektor eredetűek lehetnek. A VecScreen egy speciális, nem redundáns vektoradatbázis (UniVec) bármely szekvenciájának megfelelő szegmenseket keres egy lekérdezési szekvenciában.

Számítógépes algoritmus, amely hasonló fehérje 3-dimenziós struktúrákat azonosít. Az MMDB minden struktúrájához tartozó struktúraszomszédok előre ki vannak számítva, és az MMDB szerkezeti összefoglaló oldalain található hivatkozásokon keresztül érhetők el. Ezek a szomszédok felhasználhatók olyan távoli homológok azonosítására, amelyek nem ismerhetők fel pusztán szekvencia-összehasonlítással.


WEBES INTERFÉSZEK

PubChem célnézeti oldal

A PubChem 237 millió bioaktivitást tartalmaz hárommillió vegyületre vonatkozóan, amelyet több mint 1,2 millió biológiai vizsgálati kísérletben határoztak meg. Ezen vizsgálatok közül sokat célfehérjék vagy gének ellen hajtanak végre. Egy adott célpont összes bioaktivitási adatának megtalálása azonban nem triviális feladat. A PubChem Target oldal „célpont-központú” nézetet biztosít az adott génre vagy fehérje célpontra vonatkozó PubChem adatokról, beleértve a célponttal szemben tesztelt vegyi anyagokat és a célponttal szemben végzett biológiai vizsgálati kísérleteket. A Target View oldal a ChEMBL-től (9), a DrugBank-tól (10) és az IUPHAR/BPS Guide to PHARMACOLOGY-tól (11) gyűjtött ismert gyógyszereket és ligandumokat is bemutatja. Ezenkívül tartalmaz megjegyzésekkel ellátott információkat a célpontról, például szinonimákat, biológiai funkciókat, betegséggel kapcsolatos relevanciát, gén/fehérje osztályozást, fehérjestruktúrákat, gén-gén kölcsönhatásokat, ortológusokat, útvonalakat stb. Ezeket a megjegyzéseket a főbb molekuláris biológiai adatbázisokból gyűjtöttük össze. , beleértve az NCBI gént ( 12), a génontológiát ( 13, 14), a humán genom szervezet (HUGO) génnómenklatúra bizottságát (HGNC) ( 15), az UniProtot ( 16), a protein adatbankot (PDB) ( 17), a konzervált tartományok adatbázisát. (CDD) (18), Pfam (19), MedGen (20), Kyoto Encyclopedia of Genes and Genomes (KEGG) (21), BioSystems (22), Molecular Modeling Database (MMDB) (23).

Ezenkívül a Target View oldal elérhető a PubChem rekordok Összegzés vagy Rekord oldaláról (2. ábra). Például az emberi HRH1 gén célnézeti oldala a CID 2678 (Zyrtec) Összefoglaló oldalának „BioAssay Results” vagy „Biomolecular Interactions and Pathways” (Biomolekuláris kölcsönhatások és útvonalak) szakaszában említett célgén nevére kattintva érhető el. Elérhető az AID 238823 BioAssay Record oldaláról is.

PubChem Target Megtekintési oldal a humán hisztaminreceptor H1 (HRH1) génjéhez (https://pubchem.ncbi.nlm.nih.gov/target/gene/3269) (jobbra lent), valamint példabelépési pontjai az Összefoglalóból oldal a CID 2678-hoz (https://pubchem.ncbi.nlm.nih.gov/compound/2678) és a BioAssay Record oldala az AID 238823-hoz (https://pubchem.ncbi.nlm.nih.gov/bioassay/238823) .

PubChem Target A humán hisztaminreceptor H1 (HRH1) génjének megtekintési oldala (https://pubchem.ncbi.nlm.nih.gov/target/gene/3269) (jobbra lent), valamint példabelépési pontjai az Összefoglalóból oldal a CID 2678-hoz (https://pubchem.ncbi.nlm.nih.gov/compound/2678) és a BioAssay Record oldala az AID 238823-hoz (https://pubchem.ncbi.nlm.nih.gov/bioassay/238823) .

PubChem Bioactivity diád oldal

A diád oldal a dózis-válasz görbét is bemutatja (ha elérhető). Megmutatja továbbá az ugyanabban a vizsgálatban vizsgált, szerkezetileg hasonló anyagok bioaktivitási adatait, valamint a különböző vizsgálatokban tesztelt ugyanazon molekula bioaktivitási adatait. Az AID-SID diád oldal a biológiai vizsgálati eredmények táblázatának „Tevékenység” oszlopában (az Összefoglaló vagy az Anyagrekord oldalon) vagy az adattáblázatra kattintva érhető el. (a BioAssay Record oldalán), a 3. ábrán látható módon.

PubChem Bioactivity diád oldal a SID 4247730-hoz (megfelel a 3241895-ös CID-nek) és az AID 820-hoz (https://pubchem.ncbi.nlm.nih.gov/bioassay/820#sid=4247730) (jobbra). Ez az oldal elérhető a SID 4247730 anyagrekord oldaláról (https://pubchem.ncbi.nlm.nih.gov/substance/4247730), a 3241895 számú CID Összefoglaló oldaláról (https://pubchem.ncbi.nlm). .nih.gov/compound/3241895), vagy az AID 820 BioAssay Record oldalát (https://pubchem.ncbi.nlm.nih.gov/bioassay/238823).

PubChem Bioactivity diád oldal a SID 4247730-hoz (megfelel a 3241895-ös CID-nek) és az AID 820-hoz (https://pubchem.ncbi.nlm.nih.gov/bioassay/820#sid=4247730) (jobbra). Ez az oldal elérhető a SID 4247730 anyagrekord oldaláról (https://pubchem.ncbi.nlm.nih.gov/substance/4247730), a 3241895 számú CID Összefoglaló oldaláról (https://pubchem.ncbi.nlm). .nih.gov/compound/3241895), vagy az AID 820 BioAssay Record oldalát (https://pubchem.ncbi.nlm.nih.gov/bioassay/238823).

Az adott CID gén-CID és fehérje-CID diád oldalai ugyanannak a vegyületnek más célpontokkal szembeni bioaktivitási adatait, valamint a CID-hez szerkezetileg hasonló vegyületek ugyanazon célgén vagy fehérje elleni bioaktivitási adatait is bemutatják. Ezek a diád oldalak a megfelelő gén- és fehérjecél Target View oldalairól érhetők el.

Szabadalmi nézet

Az adott szabadalom Szabadalmi nézet oldala tartalmazza az abban említett vegyületeket és anyagokat, valamint egyéb információkat, beleértve a szabadalom címét, kivonatát, a bejelentés/közzététel dátumát, a bejelentőt és a feltalálót. Tartalmaz továbbá a Szellemi Tulajdon Világszervezetének (WIPO) Nemzetközi Szabadalmi Osztályozásán (IPC) alapuló szabadalmi besorolási információkat.

A Szabadalmi nézet oldalt az Összefoglaló oldal „Betétes által biztosított szabadalmi azonosítók” szakaszában felsorolt ​​szabadalmi azonosítók egyikére kattintva érheti el (4. ábra). Meg kell jegyezni, hogy a cikk írásakor a Patent View oldal nem ad kontextust arról, hogy egy adott vegyi anyagot miért említettek a szabadalomban. Más szóval, előfordulhat, hogy nem lehet megmondani, hogy a vegyi anyag valóban a szabadalom megadásának tárgya, vagy csak a technika állása részeként említik a háttérben.

PubChem Patent View page: US8501698 (https://pubchem.ncbi.nlm.nih.gov/patent/US8501698) (jobbra). Ez az oldal a 4247730 számú CID Összefoglaló oldalon (https://pubchem.ncbi.nlm.nih.gov/compound/2162) (balra) érhető el a „Betétes által biztosított szabadalmi azonosítók” részből.

PubChem Patent View oldal: US8501698 (https://pubchem.ncbi.nlm.nih.gov/patent/US8501698) (jobbra). Ez az oldal a 4247730 számú CID Összefoglaló oldalon (https://pubchem.ncbi.nlm.nih.gov/compound/2162) a „Betétes által biztosított szabadalmi azonosítók” részből érhető el (balra).

PubChem adatforrások oldal

A PubChem adatforrások oldala (https://pubchem.ncbi.nlm.nih.gov/sources) egy olyan felület, amely rugalmas áttekintést nyújt a PubChemhez adatokat szolgáltató szervezetekről. A PubChem adatforrásai oldalon könnyen megtudhatja, hogy ki milyen információkat adott a PubChemnek: anyagokat, teszteket és megjegyzéseket (elsősorban a különböző típusú PubChem rekordokhoz kapcsolódó szöveges információkat). Ez az interfész lehetővé teszi az adatforrások szűrését adattípus, forráskategória, forrásállapot és ország szerint, illetve a rekordok száma vagy az utolsó módosítás dátuma szerint rendezését. Az adatforrásban kulcsszó alapján is lehet keresni. Az Adatforrások oldalon felsorolt ​​adatforrás nevére kattintva a felhasználók az adott forráshoz tartozó oldalra irányítják a felhasználókat, amely tartalmazza a forrás URL-címét, kapcsolatfelvételi adatait, a PubChemnek elküldött rekordok aktuális számát és a tartalom utolsó frissítésének dátumát.

Widget

A PubChem kiadta a PubChem Widgets 2.0f-et (https://pubchemdocs.ncbi.nlm.nih.gov/widgets). A PubChem Widgetek kényelmes módot biztosítanak a tudományos webfejlesztők számára, hogy megjelenítsék a PubChem tartalmat az általuk tervezett weboldalakon. Mivel a widgetekben szereplő összes adatot közvetlenül a PubChem szolgáltatja, a widgetek garantáltan megjelenítik a PubChem legfrissebb tartalmát. A widgetek használhatók a PubChem rekordokhoz (például szabadalmak, bioaktivitások, PubMed-cikkek stb.) kapcsolódó elemek táblázatos összefoglalásának megjelenítésére, a kapcsolódó kémiai struktúrák körhintaára vagy az érdeklődésre számot tartó PubChem rekordok osztályozására.

A PubChem Widgets 2.0f lehetővé teszi a PubChem összefoglaló bármely szakaszának vagy alszakaszának megjelenítését vagy oldalak rögzítését egy widgetben (kivéve a felső részt). Compared to the previous version, the new Widgets provides many more data views and makes them easier to embed into any web page. In addition, the new widgets are easier to resize, which makes them more appropriate for displays with assorted sizes.


STRUCTURE–ACTIVITY ANALYSIS TOOL

The Structure–Activity Analysis tool ( Figure 4) allows one to perform exploratory analysis by simultaneously clustering compound and assay information using a single linkage clustering methodology ( 14). The Structure–Activity Analysis Tool is designed to help rapidly identify interesting subsets of compounds and bioassays using various similarity concepts. It enables users to compare and contrast screening results by bioactivity profile or assay target similarity, or analyze the activity of compound analog series in a panel of assays to identify SAR if any, and to suggest structure features critical for improving biological activity potency.

Screen shot of PubChem structure-activity analysis for the 10 active compounds in AID 523 and several confirmatory assays against a few protein targets. Assay clusters, based on assay target sequence similarity, are shown in the horizontal dimension, while compound clusters, based on 2D structure similarity, are shown in the vertical dimension. Each cell in the heatmap is colored based on the reported active concentration value (e.g. IC50) according to the legend contained within the figure. The PubChem Compound accession, e.g. CID, is shown to the right of each leaf of the compound cluster dendrogram. A chemical structure display can be invoked upon mouse-over the respective CID. PubChem BioAssay accession, e.g. AID, is shown beneath each leaf of the assay cluster dendrogram, while GI numbers for the respective assay targets are provided below the heatmap and hyperlinked to the corresponding Entrez protein records.

Screen shot of PubChem structure-activity analysis for the 10 active compounds in AID 523 and several confirmatory assays against a few protein targets. Assay clusters, based on assay target sequence similarity, are shown in the horizontal dimension, while compound clusters, based on 2D structure similarity, are shown in the vertical dimension. Each cell in the heatmap is colored based on the reported active concentration value (e.g. IC50) according to the legend contained within the figure. The PubChem Compound accession, e.g. CID, is shown to the right of each leaf of the compound cluster dendrogram. A chemical structure display can be invoked upon mouse-over the respective CID. PubChem BioAssay accession, e.g. AID, is shown beneath each leaf of the assay cluster dendrogram, while GI numbers for the respective assay targets are provided below the heatmap and hyperlinked to the corresponding Entrez protein records.

The results are presented through the use of an interactive heatmap display. With this web-based service, a group of compounds and assays may be clustered using various means. Chemical structures may be clustered based on 2D structure similarity (as measured by Tanimoto score using the PubChem dictionary-based fingerprint [ftp://ftp.ncbi.nlm.nih.gov/pubchem/specifications/pubchem_fingerprints.txt]) or biological response, as measured by reported bioactivity outcome, bioactivity score, or active concentration (e.g. IC50, EC50, AC50, etc.). Assays can be clustered based on similarity in biological response of the compound set, similarity in sequence of assay targets, or similarity provided by depositors. Some of the similarity data (e.g. protein target similarity) are pre-computed to obtain optimal analysis performance.

‘Revise Selection’ features, similarly to those in the BioActivity Summary tool, are provided to define and modify the focus of the analysis. These features can be accessed by clicking on the ‘+’ sign shown on the left of the Revise Selection section ( Figure 4). Furthermore, facilities for further analyzing the clustering results and navigating between various PubChem tools, including the Entrez search system, are provided and may be accessed throughout the heatmap display. For example, as shown in Figure 4, in the dendrogram display, one may click on a blue circle attached to a node of a compound cluster to invoke a feature menu, and to display the sub-tree, prune the sub-tree, or add compounds similar to those contained in a sub-tree. Users can also retrieve chemical structure similarity score matrix used in the clustering and send the selected compounds to one of PubChem tools or to Entrez system. Using similar functionalities associated with assay cluster, one may retrieve assay target similarity score matrix, or revise assay selection to include the various types of related bioassays. Users can also perform a number of operations on a combined group of assays and compounds. To define such a subset, one can zoom in the heatmap display by clicking on two cells in the heatmap. The operations available include sending the compounds in the sub-cluster to the ‘Structure Clustering’ service to visualize the chemical structure classes, sending assays, or compounds to the Entrez system to, for example, check the availability of protein 3D structure complex or look for information on biological mechanism using linked PubMed articles, etc. Using this feature, one can further compare multiple test results in details by retrieving all readouts using the Data Table tool (to be described).

A common entry point for the Structure–Activity Analysis service is from the previously described BioActivity Summary service, which can be used to narrow down the compound and assay set, thus to prepare an appropriate input for the SAR study. This tool can also be accessed from the BioAssay Summary service for a given bioassay record to analyze the set of active compounds in a single assay through identification of chemical structure clusters that exhibit similar biological response. In this particular application, one may want to take advantage of the integrated tools to further expand the assay scope, for example, to combine the screening results for related targets using the ‘Add Related BioAssays’ functionality provided in the Revise Selection section, and attempt to search compounds demonstrating high selectivity towards a particular target. This service can be also accessed through the common gateway of the PubChem BioActivity Analysis Service at http://pubchem.ncbi.nlm.nih.gov/assay/assay.cgi?p=heat, where assays, substances or compounds can be flexibly specified based on one's research need.

Results from such structure–activity analysis, including image, data table and similarity matrix can be exported in respective formats including the Graph Modelling Language format for the dendrograms. Similarly to the BioActivity Summary service, the results of this analysis are saved temporarily, and can be accessed for only a limited period of time, usually 48 hours. Users can use the ‘Save View’ button to save the analysis in a status file and use this file to communicate the results with collaborators, who can open the status file at http://pubchem.ncbi.nlm.nih.gov/assay/assay.cgi?p=qfile to see the exact same analysis page at a later time.

An example to illustrate the usage for this Structure–Activity Analysis Tool is shown in Figure 4, which demonstrates how this tool allows chemists and biologists to easily access and combine related screening data for identification of potential chemical probes with desired SAR property and target selectivity. To start the analysis, compounds active in AID 523 and a few confirmatory assays are selected from the BioActivity Summary table as shown in Figure 3. Each of the selected assays has a specified protein target. In this particular analysis, compounds are clustered based on 2D structure similarity and assays are clustered based on target sequence similarity. Each cell is colored according to the reported potency of the compound in the corresponding assay. The heatmap presentation allows one to identify instantly a cluster of compounds that demonstrate interesting SAR. Meanwhile, this analysis allows one to examine the selectivity and target specificity of the compounds by comparing the biological responses against a series of related targets.


Tartalom

Alanine was first synthesized in 1850 when Adolph Strecker combined acetaldehyde and ammonia with hydrogen cyanide. [9] [10] [11] The amino acid was named Alanin in German, in reference to aldehyde, with the infix -an- for ease of pronunciation, [12] the German ending -ban ben used in chemical compounds being analogous to English -ine.

Alanine is an aliphatic amino acid, because the side-chain connected to the α-carbon atom is a methyl group (-CH3) alanine is the simplest α-amino acid after glycine. The methyl side-chain of alanine is non-reactive and is therefore hardly ever directly involved in protein function. [13] Alanine is a nonessential amino acid, meaning it can be manufactured by the human body, and does not need to be obtained through the diet. Alanine is found in a wide variety of foods, but is particularly concentrated in meats.

Biosynthesis Edit

Alanine is produced by reductive amination of pyruvate, a two-step process. In the first step, α-ketoglutarate, ammonia and NADH are converted by glutamate dehydrogenase to glutamate, NAD + and water. In the second step, the amino group of the newly-formed glutamate is transferred to pyruvate by an aminotransferase enzyme, regenerating the α-ketoglutarate, and converting the pyruvate to alanine. The net result is that pyruvate and ammonia are converted to alanine, consuming one reducing equivalent. [6] : 721 Because transamination reactions are readily reversible and pyruvate is present in all cells, alanine can be easily formed and thus has close links to metabolic pathways such as glycolysis, gluconeogenesis, and the citric acid cycle.

Chemical synthesis Edit

L-Alanine is produced industrially by decarboxylation of L-aspartate by the action of aspartate 4-decarboxylase. Fermentation routes to L-alanine are complicated by alanine racemase. [14]

Racemic alanine can be prepared by the condensation of acetaldehyde with ammonium chloride in the presence of sodium cyanide by the Strecker reaction, [15] or by the ammonolysis of 2-bromopropanoic acid. [16]

Degradation Edit

Alanine is broken down by oxidative deamination, the inverse reaction of the reductive amination reaction described above, catalyzed by the same enzymes. The direction of the process is largely controlled by the relative concentration of the substrates and products of the reactions involved. [6] : 721

Alanine is one of the twenty canonical α-amino acids used as building blocks (monomers) for the ribosome-mediated biosynthesis of proteins. Alanine is believed to be one of the earliest amino acids to be included in the genetic code standard repertoire. [17] [18] [19] [8] On the basis of this fact the "Alanine World" hypothesis was proposed. [20] This hypothesis explains the evolutionary choice of amino acids in the repertoire of the genetic code from a chemical point of view. In this model the selection of monomers (i.e. amino acids) for ribosomal protein synthesis is rather limited to those Alanine derivatives that are suitable for building α-helix or β-sheet secondary structural elements. Dominant secondary structures in life as we know it are α-helices and β-sheets and most canonical amino acids can be regarded as chemical derivatives of Alanine. Therefore, most canonical amino acids in proteins can be exchanged with Ala by point mutations while the secondary structure remains intact. The fact that Ala mimics the secondary structure preferences of the majority of the encoded amino acids is practically exploited in alanine scanning mutagenesis. In addition, classical X-ray crystallography often employs the polyalanine-backbone model [21] to determine three-dimensional structures of proteins using molecular replacement - a model-based phasing method.

Glucose–alanine cycle Edit

In mammals, alanine plays a key role in glucose–alanine cycle between tissues and liver. In muscle and other tissues that degrade amino acids for fuel, amino groups are collected in the form of glutamate by transamination. Glutamate can then transfer its amino group to pyruvate, a product of muscle glycolysis, through the action of alanine aminotransferase, forming alanine and α-ketoglutarate. The alanine enters the bloodstream, and is transported to the liver. The alanine aminotransferase reaction takes place in reverse in the liver, where the regenerated pyruvate is used in gluconeogenesis, forming glucose which returns to the muscles through the circulation system. Glutamate in the liver enters mitochondria and is broken down by glutamate dehydrogenase into α-ketoglutarate and ammonium, which in turn participates in the urea cycle to form urea which is excreted through the kidneys. [22]

The glucose–alanine cycle enables pyruvate and glutamate to be removed from muscle and safely transported to the liver. Once there, pyruvate is used to regenerate glucose, after which the glucose returns to muscle to be metabolized for energy: this moves the energetic burden of gluconeogenesis to the liver instead of the muscle, and all available ATP in the muscle can be devoted to muscle contraction. [22] It is a catabolic pathway, and relies upon protein breakdown in the muscle tissue. Whether and to what extent it occurs in non-mammals is unclear. [23] [24]

Link to diabetes Edit

Alterations in the alanine cycle that increase the levels of serum alanine aminotransferase (ALT) are linked to the development of type II diabetes. [25]

Alanine is useful in loss of function experiments with respect to phosphorylation. Some techniques involve creating a library of genes, each of which has a point mutation at a different position in the area of interest, sometimes even every position in the whole gene: this is called "scanning mutagenesis". The simplest method, and the first to have been used, is so-called alanine scanning, where every position in turn is mutated to alanine. [26]

Hydrogenation of alanine give the amino alcohol alaninol, which is a useful chiral building block.

Free radical Edit

The deamination of an alanine molecule produces the free radical CH3C • HCO2 − . Deamination can be induced in solid or aqueous alanine by radiation that causes homolytic cleavage of the carbon–nitrogen bond. [27]

This property of alanine is used in dosimetric measurements in radiotherapy. When normal alanine is irradiated, the radiation causes certain alanine molecules to become free radicals, and, as these radicals are stable, the free radical content can later be measured by electron paramagnetic resonance in order to find out how much radiation the alanine was exposed to. [28] This is considered to be a biologically relevant measure of the amount of radiation damage that living tissue would suffer under the same radiation exposure. [28] Radiotherapy treatment plans can be delivered in test mode to alanine pellets, which can then be measured to check that the intended pattern of radiation dose is correctly delivered by the treatment system.


Következtetések

Literature information available in PubChem for substances, compounds and assays, as well as how this information can be accessed, was described. Individual data contributors provide PubChem with cross-references between chemical substances and PubMed articles that contain information on that substance. From these SID-PMID cross-references, PubChem generates cross-references between the corresponding compound and the PubMed articles (i.e., CID-PMID cross-references). Data contributors can also supply a list of PMIDs for scientific articles that have information relevant to a given assay record. These articles may contain various kinds of information related to the assay, including experimental protocols, assay targets, diseases associated with the targets, and known ligands that bind the targets. Of particular interest, some data contributors provide bioactivity data extracted from literature through manual curation or data mining and are an important source of bioactivity information in PubChem that complement HTS data from the now-concluded NIH Molecular Libraries Program and other HTS projects. In addition to community-provided literature information, PubChem generates Entrez links between PubChem records and PubMed articles that share the same MeSH annotation. This automated process allows PubChem users to leverage the biomedical literature and its MeSH indexing for search and analysis purposes.

Some journals, such as Természet kémiai biológia, provide PubChem with information on chemicals that appear in their newly published articles. This enables PubChem to direct users to the new articles on the journal web site, even before their abstracts become available in PubMed. In turn, the publisher can provide their readers with access to comprehensive information available in PubChem about the chemicals mentioned in a given article. This exemplifies the mutual benefit of concurrent publication of scientific articles in journals and associated data in public databases.

Literature information, both provided by depositors and derived via MeSH, can be accessed from the DocSum page of an Entrez search result, or from the Compound Summary, Substance Record, or BioAssay Record page. Users can also retrieve PubChem records associated with scientific articles, using appropriate Entrez filters. These tools allow PubChem users to more readily explore information available in literature related to PubChem records.


Public Chemical Databases

PubChem

PubChem ( Kim, 2016 Kim et al., 2016a Wang et al., 2017 ) is a public chemical information resource, developed and maintained by the National Center for Biotechnology Information (NCBI) at the National Library of Medicine (NLM), an institute within the U.S. National institutes of Health (NIH). It collects chemical substance descriptions and their biological activities from more than 500 data sources and disseminates these data to the public free of charge. Since the launch in 2004 as a component of the NIH Molecular Libraries Roadmap Initiatives, PubChem has been a key information resource for biomedical research communities in many areas such as cheminformatics, chemical biology, medicinal chemistry, and drug discovery.

PubChem contains various types of chemical information, including 2-D and 3-D structures, chemical and physical properties, bioactivity data, pharmacology, toxicology, drug target, metabolism, safety and handling, relevant patents and scientific papers, etc. While the majority of PubChem’s records are about small molecules, it also contains information on a broad range of chemical entities, including siRNAs, miRNAs, carbohydrates, lipids, peptides, chemically modified macromolecules, and many others. These data are provided by various contributors, including government agencies, university labs, pharmaceutical companies, chemical vendors, publishers and a number of chemical biology resources. Most of the chemical databases discussed in this paper also contribute their data to PubChem.

As shown in Fig. 3 , PubChem organizes its data into three inter-linked databases: Substance, Compound, and BioAssay ( Kim et al., 2016a ) (see the Relevant Websites section). The Substance database contains chemical substance descriptions submitted by individual data depositors. Unique chemical structures are extracted from the Substance database and stored in the Compound database. The BioAssay database contains descriptions and results of biological assay experiments performed on chemical substances. The records in the Substance, Compound, and BioAssay databases are called substances, compounds, and bioassays, respectively. Similarly, the record accessions used for the respective PubChem databases are the Substance ID (SID), Compound ID (CID), and Assay ID (AID). Currently, PubChem contains more than 234 million depositor-provided substances, 93 million unique compounds, and 233 million bioactivity test results from 1.25 million bioassays, covering more than 10,000 protein target sequences.

Fig. 3 . Data organization in PubChem. PubChem organizes its data into three inter-linked databases called Substance, Compound, and BioAssay. SID, CID, and AID are record identifiers used in the Substance, Compound, and BioAssay databases, respectively.

Although this article describes PubChem under Section Large-Scale Data Aggregators , it should be emphasized that PubChem contains the largest amount of bioactivity data available in the public domain. These data are primarily generated from high-throughput screening (HTS) experiments, because PubChem served as a central repository for the now-concluded NIH’s Molecular Libraries Program (MLP). However, it also contains a substantial amount of high-quality bioactivity data extracted from research articles and patent documents, thanks to data contributions by many bioactivity databases, including ChEMBL, BindingDB, and PDBbind (to be discussed later in the present paper) ( Kim et al., 2016b ). In Fig. 4 , the PubChem BioAssay database is compared with other bioactivity databases discussed in the present article.

Fig. 4 . Comparison of PubChem and other databases that provide bioactivity data of small molecules.


What is new in PubChemRDF 1.5β?

The 1.5β release contains a number of new features and technological improvements including:

  • Faster Speed
    PubChemRDF data is now served from a triple-store and provides a noticeable speed improvement, especially for records with lots of data. Previously, RDF was generated on the fly from data stored in disparate data systems.
  • Addition of MeSH
    Major improvements were made to the reference subdomain. Most notable is the addition of Medical Subject Heading (MeSH) annotation of PubMed records. This includes MeSH topical descriptors (with optional qualifier) that indicate the subject of an article and MeSH (supplementary) concepts that indicate things like chemicals and diseases discussed in an article.
  • Direct links to authoritative RDF resources
    PubChemRDF now enhances cross-integration by providing direct links to available authoritative RDF resources within applicable subdomains, including: reference, synonym, and inchikey to MeSH RDF protein to UniProt RDF protein and substance to PDB RDF biosystem to Reactome RDF substance to ChEMBL RDF and compound to WikiData RDF. For example, the links to PDB RDF help to distinguish proteins and associated chemical substances found in a Protein Data Bank (PDB) crystal structure.
  • Addition of ‘concept’ subdomain
    A new ‘concept’ subdomain provides the means to annotate PubChemRDF subdomains. For example, annotation between nodes within the concept subdomain allows a hierarchy of concepts to be created, such as those in the WHO ATC classification. These can then be applied, such as in the case of adding links from chemical substance synonyms to a WHO ATC classification to indicate its therapeutic and pharmacological properties.
  • New links added between the compound and biosystem subdomains
    Previously, the biosystem subdomain linked only to the protein subdomain. The added links between the compound and biosystem subdomains help to indicate the chemical structure involved in a given pathway.
  • Support for protein complexes
    Protein complex targets are now distinguished within the bioassay subdomain and are linked to the component protein units.
  • Linked Data using JSON
    JSON-LD (or JavaScript Object Notation for Linked Data) is a method of transporting Linked Data using JSON. This addition helps those wanting to use JSON formatted data, for example, with JavaScript.
  • Substring searches
    PubChemRDF REST interface now provides a substring search. For example, this returns chemical substance synonyms that contain the string “aspirin”:
    https://pubchem.ncbi.nlm.nih.gov/rest/rdf/query?graph=synonym&name=aspirin&contain=true
  • Simple SPARQL-like query functions
    PubChemRDF REST interface provides simple SPARQL-like query capabilities for grouping and filtering relevant resources. For instance, the following query can retrieve the ChEBI class assignments for PubChem substances:
    https://pubchem.ncbi.nlm.nih.gov/rest/rdf/query?graph=substance&predicate=rdf:type

PUBLIC ACCESS AND SEARCH

An individual record in the PubChem BioAssay database can be accessed directly through the BioAssay Summary service at http://pubchem.ncbi.nlm.nih.gov/assay/assay.cgi?aid=myAID, where ‘myAID’ is a valid numeric PubChem BioAssay accession (AID). This service provides access to all versions of deposited assay information, such as assay protocol, test result descriptions and data ( Figure 1). It allows one to retrieve, view, and download test results through the ‘Show Data’ links. The service also lists information about the assay target, including depositor-provided molecular information and annotations derived by PubChem about protein family classification, the corresponding gene, pathway and homologous 3D structures. Furthermore, the BioAssay Summary service provides a central entry point to a set of data analysis tools for the bioactive compounds identified in the assay. These analysis tools can be accessed through the ‘BioActivity Summary’, ‘Structure–Activity Analysis’ and ‘Structure Clustering’ links, and allow one to cluster the scaffolds of the tested compounds, examine and visualize SAR relationships, and evaluate target specificity or promiscuity properties of the compounds. In addition, the ‘Related BioAssays’ section lists assays that may be related to the one under review and links to further detailed summary over the bioassay relationship. Cross-references to other NCBI databases, such as PubMed, are listed under the ‘Links’ section.

The summary view of a PubChem bioassay record. Assay results can be retrieved through the Show Data | Active and Show Data | All links.


Nézd meg a videót: VASCULARITY u0026 PUMP- Simple and Easy Tips HINDI (Június 2022).


Hozzászólások:

  1. Mikabei

    Egyetértek, ez a vicces kifejezés

  2. Dietrich

    And could it be reformulated?

  3. Durane

    Congratulations, your idea will come in handy



Írj egy üzenetet