coding sequence Dotaz Zobrazit nápovědu
UWBC biotechnical resource series
XV, 279 s. : il. ; 24 cm
BACKGROUND: The first systematic study of small non-coding RNAs (sRNA, ncRNA) in Streptomyces is presented. Except for a few exceptions, the Streptomyces sRNAs, as well as the sRNAs in other genera of the Actinomyces group, have remained unstudied. This study was based on sequence conservation in intergenic regions of Streptomyces, localization of transcription termination factors, and genomic arrangement of genes flanking the predicted sRNAs. RESULTS: Thirty-two potential sRNAs in Streptomyces were predicted. Of these, expression of 20 was detected by microarrays and RT-PCR. The prediction was validated by a structure based computational approach. Two predicted sRNAs were found to be terminated by transcription termination factors different from the Rho-independent terminators. One predicted sRNA was identified computationally with high probability as a Streptomyces 6S RNA. Out of the 32 predicted sRNAs, 24 were found to be structurally dissimilar from known sRNAs. CONCLUSION: Streptomyces is the largest genus of Actinomyces, whose sRNAs have not been studied. The Actinomyces is a group of bacterial species with unique genomes and phenotypes. Therefore, in Actinomyces, new unique bacterial sRNAs may be identified. The sequence and structural dissimilarity of the predicted Streptomyces sRNAs demonstrated by this study serve as the first evidence of the uniqueness of Actinomyces sRNAs.
- MeSH
- algoritmy MeSH
- bakteriální RNA genetika chemie MeSH
- druhová specificita MeSH
- financování organizované MeSH
- genom bakteriální MeSH
- intergenová DNA MeSH
- konformace nukleové kyseliny MeSH
- molekulární modely MeSH
- nekódující RNA genetika chemie MeSH
- polymerázová řetězová reakce s reverzní transkripcí MeSH
- sekvence nukleotidů MeSH
- sekvenční analýza hybridizací s uspořádaným souborem oligonukleotidů MeSH
- Streptomyces coelicolor genetika MeSH
- Streptomyces genetika MeSH
- terminátorové oblasti (genetika) MeSH
- výpočetní biologie MeSH
Celogenomové sekvenační analýzy odhalily, že převážná část lidského genomu je transkribována, a identifikovaly tisíce protein nekódujících transkriptů. Nekódující RNA (ncRNA) se dělí na dvě hlavní skupiny: malé a dlouhé ncRNA. Tento přehledový článek je zaměřen na ncRNA s regulační funkcí, a to především na mikroRNA a dlouhé ncRNA. Tyto ncRNA regulují genovou expresi na transkripční a posttranskripční úrovni. V tomto kontextu ncRNA zasahují do regulace většiny buněčných procesů a jejich deregulace má vážné dopady na fenotyp. Již stovky studií prokázaly zapojení ncRNA do patogeneze mnoha onemocnění, od metabolických poruch přes onemocnění orgánových systémů až po různé typy nádorů. Z klinického hlediska patří ncRNA do nové generace diagnostických a prognostických biomarkerů s velkým potenciálem. Vzhledem k vysoké tkáňové specifciitě a schopnosti regulovat více genů často v rámci jedné signální dráhy představují ncRNA i atraktivní terapeutické cíle. Narůstající poznatky o širokém spektru působení ncRNA ukazují na klíčovou roli těchto transkriptů v regulaci exprese. Řada aspektů z biologie ncRNA ještě není objasněna a jejich pochopení nám poskytne nový pohled na komplexnost regulační sítě.
Whole-genome sequencing analyses revealed that the majority of the human genome is transcribed and identified thousands of protein non-coding transcripts. Non-coding RNAs (ncRNAs) are divided into two main groups: small and long ncRNAs. This review is focused on the regulatory ncRNAs mainly on microRNAs and long ncRNAs. These ncRNAs regulate gene expression at the transcriptional and post-transcriptional levels. In this context, ncRNAs are involved in the regulation of most cellular processes and their deregulation has serious impacts on the phenotype. Hundreds of studies have implicated ncRNAs in the pathogenesis of many diseases ranging from metabolic disorders to diseases of organ systems as well as various types of cancers. Clinically, ncRNAs belong to a new generation of diagnostic and prognostic biomarkers with a great potential. Due to high tissue specificity and ability to regulate multiple genes often within one signaling pathway, ncRNAs represent attractive therapeutic targets. Increasing knowledge about a wide spectrum of ncRNA actions demonstrate a pivotal role of these transcripts in expression regulation. Many aspects of the ncRNA biology are still unclear and their understanding will provide us a new perspective on the complexity of the regulatory network.
Non-coding RNAs (ncRNAs) are regulatory molecules encoded in the intergenic or intragenic regions of the genome. In prokaryotes, biocomputational identification of homologs of known ncRNAs in other species often fails due to weakly evolutionarily conserved sequences, structures, synteny and genome localization, except in the case of evolutionarily closely related species. To eliminate results from weak conservation, we focused on RNA structure, which is the most conserved ncRNA property. Analysis of the structure of one of the few well-studied bacterial ncRNAs, 6S RNA, demonstrated that unlike optimal and consensus structures, suboptimal structures are capable of capturing RNA homology even in divergent bacterial species. A computational procedure for the identification of homologous ncRNAs using suboptimal structures was created. The suggested procedure was applied to strongly divergent bacterial species and was capable of identifying homologous ncRNAs.
- MeSH
- bakteriální RNA chemie MeSH
- konformace nukleové kyseliny MeSH
- molekulární sekvence - údaje MeSH
- Mycobacterium genetika MeSH
- nekódující RNA chemie MeSH
- sekvence nukleotidů MeSH
- sekvenční homologie nukleových kyselin MeSH
- Streptomyces genetika MeSH
- Publikační typ
- časopisecké články MeSH
- práce podpořená grantem MeSH
Většinu eukaryotického genomu představují DNA sekvence, které nekódují proteiny. Tyto sekvence jsou přepisovány buď podle vývojového programu daného organizmu nebo v rámci odpovědi na vnější signály. Výsledkem transkripce takových sekvencí je pak velké množství dlouhých nekódujících RNA (lncRNA). Celogenomové studie předpokládají existenci více než 3 300 lncRNA. Dlouhé nekódující RNA jsou definovány jako molekuly nekódujících RNA o délce více než 200 nukleotidů. Vzhledem k vysoké míře komplexnosti a rozmanitosti těchto sekvencí byl nárůst poznání v této oblasti relativně pomalý. Ačkoli bylo dosud funkčně charakterizováno pouze omezené množství lncRNA, jejich regulační potenciál je již dnes evidentní. LncRNA hrají klíčové role jak v transkripčních, tak v post-transkripčních regulačních drahách. U mnoha nádorových onemocnění dochází k deregulaci lncRNA, což společně s jejich funkčními vlastnostmi naznačuje jejich významný potenciál v procesech maligní transformace. Tento přehledový článek je zaměřen na shrnutí nedávno objevených skupin lncRNA, popis jejich biologických funkcí a zejména na jejich význam v nádorové biologii a translačním onkologickém výzkumu.
A major portion of the eukaryotic genome is occupied by DNA sequences; transcripts of these sequences do not code for proteins. This part of the eukaryotic genome is transcribed in a developmentally regulated manner or as a response to external stimuli to produce large numbers of long non-coding RNAs (lncRNAs). Genome-wide studies indicate the existence of more than 3,300 lncRNAs. Long non-coding RNAs are tentatively defined as molecules of ncRNAs that are more than two hundred nucleotides long. Due to the complexity and diversity of their sequences, progress in the field of lncRNAs has been very slow. Nonetheless, lncRNAs have emerged as key molecules involved in the control of transcriptional and posttranscriptional gene regulatory pathways. Although limited numbers of functional lncRNAs have been identified so far, the immense regulatory potential of lncRNAs is already evident, emphasizing that a genome-wide characterization of functional lncRNAs is needed. The fact that many lncRNAs are deregulated in various human cancers, together with their functional characteristics, implies their eminent role in carcinogenesis. In this review, we summarize novel classes of lncRNAs, describe their biological functions emphasizing their roles in tumor biology and translational oncology research.
- Klíčová slova
- lincRNA, T-UC,
- MeSH
- 3' nepřekládaná oblast fyziologie genetika imunologie MeSH
- 5' nepřekládaná oblast fyziologie genetika imunologie MeSH
- financování organizované MeSH
- genetické markery genetika MeSH
- genetické struktury MeSH
- genom lidský fyziologie genetika imunologie MeSH
- hepatocelulární karcinom diagnóza genetika MeSH
- lidé MeSH
- malá nekódující RNA genetika izolace a purifikace MeSH
- mikro RNA genetika izolace a purifikace MeSH
- nádory prostaty diagnóza genetika MeSH
- nádory prsu diagnóza genetika MeSH
- nádory diagnóza etiologie genetika MeSH
- nekódující RNA diagnostické užití genetika izolace a purifikace MeSH
- nepřekládané oblasti fyziologie genetika imunologie MeSH
- proteiny vázající telomery genetika MeSH
- pseudogeny fyziologie genetika imunologie MeSH
- translační biomedicínský výzkum metody trendy MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- přehledy MeSH
Východiska: Prognóza pacientů s karcinomem kolorekta (colorectal cancer – CRC) závisí především na rozsahu onemocnění v době diagnózy, proto je brzký záchyt jedním z hlavních předpokladů úspěšné léčby. Současný výzkum ukazuje, že exozomální dlouhé nekódující RNA (lncRNA) jsou spojeny s rozvojem nádorových onemocnění. Jelikož jsou lncRNA často tkáňově specifické, jejich kvantifikace v exozomech se nabízí jako neinvazivní metoda pro včasnou detekci CRC. V naší práci jsme se zaměřili na optimalizaci protokolu pro analýzu exozomálních lncRNA z krevního séra pacientů s CRC jako potenciálních diagnostických biomarkerů. Materiál a metody: Exozomy byly izolovány pomocí gelové chromatografie ze 150 μl séra pacientů s CRC a zdravých dárců. Jejich kvalita a kvantita byla potvrzena elektronovou mikroskopií a analýzou dynamického rozptylu světla (dynamic light scattering – DLS) a proteinové markery byly detekovány metodou Western blot. Po izolaci RNA byly ze vzorků připraveny cDNA knihovny, které byly sekvenovány pomocí NextSeq 550. Výsledky: Úspěšně jsme izolovali exozomy a ověřili jsme jejich vlastnosti několika různými metodami. Knihovny byly připraveny ze všech vzorků i přes velmi nízký objem výchozího materiálu. Sekvenační data potvrzují přítomnost protein kódující (50 %) i nekódující RNA, kterou tvoří především lncRNA (28,2 %), pseudogeny (15,2 %) a další typy RNA (6,5 %). Výsledky dále ukázaly významně změněné hladiny některých lncRNA, na základě jejichž exprese bylo možné odlišit vzorky od pacientů s CRC od vzorků zdravých kontrol. Pomocí analýzy obohacení genové sady (gene set enrichment analysis – GSEA) jsme pozorovali významně obohacené třídy genů, které souvisejí s opravami DNA nebo regulací buněčného cyklu. Závěr: Naše pilotní data naznačují, že lncRNA představují významnou část RNA přítomné v exozomech a jejich rozdílné hladiny mají schopnost odlišit CRC pacienty od zdravých kontrol. Analýza obohacených genů zároveň prokázala významné zastoupení lncRNA podílejících se na regulaci buněčného cyklu a oprav DNA, což naznačuje jejich možné zapojení do procesů kancerogeneze. Výsledky je však třeba ověřit na větším souboru pacientů.
Background: The prognosis of patients with colorectal cancer (CRC) depends mainly on the extent of the disease at the time of diagnosis; therefore, early detection is one of the main prerequisites for successful treatment. Current research shows that exosomal long non-coding RNAs (lncRNAs) are associated with cancer development. As lncRNAs are often tissue specific, their quantification in exosomes is proposed as a non-invasive method for early detection of CRC. In this study, we aimed to optimize a protocol for analyzing exosomal lncRNAs from blood serum of CRC patients as potential diagnostic biomarkers. Material and methods: Exosomes were isolated by gel chromatography from 150 μl of serum of CRC patients and healthy donors. Their quality and quantity were confirmed by electron microscopy and dynamic light scattering (DLS) analysis; protein markers were detected by Western blot. After RNA isolation, cDNA libraries were prepared and sequenced using NextSeq 550. Results: We successfully isolated exosomes and verified them by several methods. Libraries were prepared from all samples despite very low volume of starting material. The sequencing data confirmed the presence of both protein-coding (50%) and non-coding RNAs, which consisted mainly of lncRNAs (28.2%), pseudogenes (15.2%) and other RNA types (6.5%). The results also showed significantly altered levels of some lncRNAs that could distinguish samples from CRC patients and healthy controls. Using gene set enrichment analysis (GSEA), we observed significantly enriched classes of genes related to DNA repair or cell cycle regulation. Conclusion: Our preliminary data suggest that lncRNAs represent a significant fraction of the RNA present in exosomes and that their distinct levels can separate CRC patients from healthy controls. The analysis of enriched genes also showed a significant representation of lncRNAs involved in cell cycle regulation and DNA repair, suggesting their possible involvement in cancerogenesis. However, the results need to be verified in a larger cohort of patients.
The oocyte-to-embryo transition (OET) transforms a differentiated gamete into pluripotent blastomeres. The accompanying maternal-zygotic RNA exchange involves remodeling of the long non-coding RNA (lncRNA) pool. Here, we used next generation sequencing and de novo transcript assembly to define the core population of 1,600 lncRNAs expressed during the OET (lncRNAs). Relative to mRNAs, OET lncRNAs were less expressed and had shorter transcripts, mainly due to fewer exons and shorter 5' terminal exons. Approximately half of OET lncRNA promoters originated in retrotransposons suggesting their recent emergence. Except for a small group of ubiquitous lncRNAs, maternal and zygotic lncRNAs formed two distinct populations. The bulk of maternal lncRNAs was degraded before the zygotic genome activation. Interestingly, maternal lncRNAs seemed to undergo cytoplasmic polyadenylation observed for dormant mRNAs. We also identified lncRNAs giving rise to trans-acting short interfering RNAs, which represent a novel lncRNA category. Altogether, we defined the core OET lncRNA transcriptome and characterized its remodeling during early development. Our results are consistent with the notion that rapidly evolving lncRNAs constitute signatures of cells-of-origin while a minority plays an active role in control of gene expression across OET. Our data presented here provide an excellent source for further OET lncRNA studies.
- MeSH
- blastomery metabolismus MeSH
- embryo savčí metabolismus MeSH
- myši MeSH
- oocyty metabolismus MeSH
- RNA dlouhá nekódující genetika metabolismus MeSH
- sekvenční analýza RNA MeSH
- stanovení celkové genové exprese MeSH
- vysoce účinné nukleotidové sekvenování MeSH
- vývojová regulace genové exprese * MeSH
- zvířata MeSH
- Check Tag
- myši MeSH
- zvířata MeSH
- Publikační typ
- časopisecké články MeSH
Searching for similar sequences in a database via BLAST or a similar tool is one of the most common bioinformatics tasks applied in general, and to non-coding RNAs in particular. However, the results of the search might be difficult to interpret due to the presence of partial matches to the database subject sequences. Here, we present rboAnalyzer - a tool that helps with interpreting sequence search result by (1) extending partial matches into plausible full-length subject sequences, (2) predicting homology of RNAs represented by full-length subject sequences to the query RNA, (3) pooling information across homologous RNAs found in the search results and public databases such as Rfam to predict more reliable secondary structures for all matches, and (4) contextualizing the matches by providing the prediction results and other relevant information in a rich graphical output. Using predicted full-length matches improves secondary structure prediction and makes rboAnalyzer robust with regards to identification of homology. The output of the tool should help the user to reliably characterize non-coding RNAs in BLAST output. The usefulness of the rboAnalyzer and its ability to correctly extend partial matches to full-length is demonstrated on known homologous RNAs. To allow the user to use custom databases and search options, rboAnalyzer accepts any search results as a text file in the BLAST format. The main output is an interactive HTML page displaying the computed characteristics and other context of the matches. The output can also be exported in an appropriate sequence and/or secondary structure formats.
- Publikační typ
- časopisecké články MeSH
In this review I focus on the role of splicing in long non-coding RNA (lncRNA) life. First, I summarize differences between the splicing efficiency of protein-coding genes and lncRNAs and discuss why non-coding RNAs are spliced less efficiently. In the second half of the review, I speculate why splice sites are the most conserved sequences in lncRNAs and what additional roles could splicing play in lncRNA metabolism. I discuss the hypothesis that the splicing machinery can, besides its dominant role in intron removal and exon joining, protect cells from undesired transcripts.
- MeSH
- RNA dlouhá nekódující * genetika MeSH
- sestřih RNA MeSH
- Publikační typ
- časopisecké články MeSH
- práce podpořená grantem MeSH
- přehledy MeSH