An important message taken from human genome sequencing projects is that the human population exhibits approximately 99.9% genetic similarity. Variations in the remaining parts of the genome determine our identity, trace our history and reveal our heritage. The precise delineation of phenotypically causal variants plays a key role in providing accurate personalized diagnosis, prognosis, and treatment of inherited diseases. Several computational methods for achieving such delineation have been reported recently. However, their ability to pinpoint potentially deleterious variants is limited by the fact that their mechanisms of prediction do not account for the existence of different categories of variants. Consequently, their output is biased towards the variant categories that are most strongly represented in the variant databases. Moreover, most such methods provide numeric scores but not binary predictions of the deleteriousness of variants or confidence scores that would be more easily understood by users. We have constructed three datasets covering different types of disease-related variants, which were divided across five categories: (i) regulatory, (ii) splicing, (iii) missense, (iv) synonymous, and (v) nonsense variants. These datasets were used to develop category-optimal decision thresholds and to evaluate six tools for variant prioritization: CADD, DANN, FATHMM, FitCons, FunSeq2 and GWAVA. This evaluation revealed some important advantages of the category-based approach. The results obtained with the five best-performing tools were then combined into a consensus score. Additional comparative analyses showed that in the case of missense variations, protein-based predictors perform better than DNA sequence-based predictors. A user-friendly web interface was developed that provides easy access to the five tools' predictions, and their consensus scores, in a user-understandable format tailored to the specific features of different categories of variations. To enable comprehensive evaluation of variants, the predictions are complemented with annotations from eight databases. The web server is freely available to the community at http://loschmidt.chemi.muni.cz/predictsnp2.
- MeSH
- databáze nukleových kyselin MeSH
- databáze proteinů MeSH
- genetická variace MeSH
- genom lidský MeSH
- genomika statistika a číselné údaje MeSH
- jednonukleotidový polymorfismus * MeSH
- lidé MeSH
- software * MeSH
- výpočetní biologie MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- časopisecké články MeSH
- práce podpořená grantem MeSH
- MeSH
- diagnostické techniky molekulární metody využití MeSH
- genetika normy statistika a číselné údaje trendy MeSH
- genomika normy statistika a číselné údaje trendy MeSH
- lidé MeSH
- molekulární biologie metody statistika a číselné údaje trendy MeSH
- řízení kvality MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- směrnice pro lékařskou praxi MeSH
- MeSH
- diagnostické techniky molekulární metody využití MeSH
- genetika normy statistika a číselné údaje trendy MeSH
- genomika metody normy statistika a číselné údaje MeSH
- lidé MeSH
- molekulární biologie metody statistika a číselné údaje trendy MeSH
- řízení kvality MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- směrnice pro lékařskou praxi MeSH
CGH arrays se v dnešní době staly významnou technikou v analýze genomu. Využívají se pro detekci změn v počtu kopií genů nebo chromozomů, popřípadě jiných chromosomových přestaveb. Základní metodou je porovnávání DNA vzorku a zdravé kontroly pomocí komparativní genomové hybridizace (CGH). Analýza genetické nestability u nádoru a s ní spojené hledání nádorových markerů se dá využít jak v diagnostice nádorů (klasifikace nádorů do již existujících skupin, hledání nových podskupin), tak i v predikci jejich odpovědi na léčbu. Výhodou technologie CGH arrays je možnost analýzy celého genomu v jediném experimentu. To ovšem znamená, že metoda produkuje velké množství dat, které musí být správně matematicky vyhodnoceny a základním cílem článku je tak představení těchto matematických metod a jejich softwarové implementace.
Nowadays, array CGH experiments became a powerful technique for analysing changes in DNA by comparing control DNA and DNA of interest. This is widely used for example in genome cancer studies. Analysis of the tumour genome instabilities and the search for tumour markers can be used for the tumour diagnostics (tumour classification, detection of the new clinical groups of tumours) or for the prediction of the response to therapy. The method produce huge amount of data and special statistic techniques for detecting of genomic changes are necessary. The purpose of this paper is to provide brief summary of existing statistical methods used in CGH array analysis and their software implementation.
- MeSH
- DNA nádorová diagnostické užití genetika izolace a purifikace MeSH
- financování organizované MeSH
- genomika metody statistika a číselné údaje trendy MeSH
- hybridizace genetická MeSH
- internet trendy využití MeSH
- lékařská onkologie metody trendy MeSH
- lidé MeSH
- software klasifikace statistika a číselné údaje trendy MeSH
- srovnávací genomová hybridizace MeSH
- statistické modely MeSH
- statistika jako téma MeSH
- systémy řízení databází využití MeSH
- teoretické modely MeSH
- zlomy DNA MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- přehledy MeSH