data set
Dotaz
Zobrazit nápovědu
CD-ROM series. 21 ; no. 11
1 elektronický optický disk (CD-ROM) : barev. ; 13 cm
- Konspekt
- Veřejné zdraví a hygiena
- NLK Obory
- management, organizace a řízení zdravotnictví
- demografie
- NLK Publikační typ
- CD-ROM
Cíl: Prezentovat výsledky validace datového standardu (datasetu) pro sběr dat o dekubitálních lézích a zejména identifikovat nezbytné a naopak nadbytečné položky, které by měly být na lokální úrovni poskytovatelů zdravotních služeb monitorovány. Cílem není srovnání počtu záznamů o dekubitech a výskytu dekubitů, ale posouzení možnosti data v klinické praxi zadat a zhodnotit jejich výtěžnost a využitelnost ve vztahu k opatřením nezbytným při poskytování péče. Metodika: V pořadí druhá pilotní validace datasetu byla realizována ve třech zapojených fakultních nemocnicích (centrech) v ČR za období 6 měsíců (2. polovina roku 2017). První pre-pilotní validace byla realizována v předchozích 6 měsících. Statistická analýza dat byla provedena v programu SPSS (IBM Corp., Armonk, NY, USA) na hladině významnosti 0,05. Výsledky: Celkem byly ze všech tří center odevzdány údaje o 320 záznamech pacientů s 310 vyplněnými záznamy o anamnéze a 498 záznamy dekubitů. Nebylly ověřeny statisticky významné rozdíly v dostupnosti dat a vyplněnosti standardizovaného datového souboru v požadované struktuře (p > 0,05). Na základě zhodnocení administrativní zátěže a klinické přínosnosti sledovaných údajů byly provedeny změny ve finálním datovém standardu. Závěr: Připravený technický popis standardizovaného a validovaného souboru spolu s technickým popisem softwaru umožní jednoduchou implementaci na národní úrovni ke sjednocení souboru údajů o výskytu dekubitů.
Aim: To present the validation process of the data standard for the col lection of data on pressure ulcers and, in particular, to identify the necessary and un necessary items that should be monitored at the local level of the health service providers. On the contrary, the aim is not to compare the number of records of pressure ulcers and occurrence of pressure ulcers, but to assess the possibility of data collection in clinical practice and to assess their usability in relation to the measures neces sary for the provision of care. Methodology: Second pilot validation of the dataset was carried out in three participat ing university hospitals (centres) in the Czech Republic for a period of 6 months (2nd half of 2017). The first pre-pilot validation was organised in the previous 6 months. Statistical analysis of data was performed in SPSS (IBM Corp., Armonk, NY, USA) at a significance level of 0.05. Results: In total, data from 320 records of patients were submitted from all three centres, with 310 completed history records and 498 records of pressure ulcers. There were no statistically significant differences in data availability and completion of the standardized data set in the required structure (p > 0.05). Based on an as ses sment of the administrative burden and the clinical benefit of the data, changes were made to the final data standard. Conclusion: The prepared technical description of the standardized and validated dataset together with the technical description of the software will al low simple implementation at national level to unify the special dataset for monitoring of pressure ulcers.
- Klíčová slova
- monitorování dekubitů, validace,
- MeSH
- dekubity * MeSH
- elektronické zdravotní záznamy MeSH
- epidemiologické monitorování MeSH
- lidé MeSH
- registrace MeSH
- sběr dat MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- práce podpořená grantem MeSH
Personalised medicine, new discoveries and studies on rare exposures or outcomes require large samples that are increasingly difficult for any single investigator to obtain. Collaborative work is limited by heterogeneities, both what is being collected and how it is defined. To develop a core set for data collection in rheumatoid arthritis (RA) research which (1) allows harmonisation of data collection in future observational studies, (2) acts as a common data model against which existing databases can be mapped and (3) serves as a template for standardised data collection in routine clinical practice to support generation of research-quality data. A multistep, international multistakeholder consensus process was carried out involving voting via online surveys and two face-to-face meetings. A core set of 21 items ('what to collect') and their instruments ('how to collect') was agreed: age, gender, disease duration, diagnosis of RA, body mass index, smoking, swollen/tender joints, patient/evaluator global, pain, quality of life, function, composite scores, acute phase reactants, serology, structural damage, treatment and comorbidities. The core set should facilitate collaborative research, allow for comparisons across studies and harmonise future data from clinical practice via electronic medical record systems.
- MeSH
- konsensus MeSH
- lidé MeSH
- pozorovací studie jako téma metody normy MeSH
- revmatoidní artritida * MeSH
- sběr dat metody normy MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- časopisecké články MeSH
- konsensuální prohlášení MeSH
- práce podpořená grantem MeSH
Cieľ: LDL-cholesterol (LDL-C) je stanovovaný metódami, ktorých presnosť je významne ovplyvnená v rôznych klinických alebo analytických situáciách. Novo boli popísané dve výpočtové metódy stanovenia LDL-C, rovnica Martin a rovnica Sampson, ktorých vlastnosti porovnávame s Friedewaldovou rovnicou. Súbor a metódy: Vzájomné porovnávania LDL-C stanovené uvedenými 3 rovnicami boli vykonané na 4 reálnych súboroch lipidových dát, vytvorených pri rôznych predošlých štúdiách, o rozsahu od n = 140 po n = 7 393 a na nami novo navrhnutom umelom súbore dát. Výsledky: Rozdiel medzi hodnotami LDL-C stanovenými rôznymi rovnicami sa postupne zväčšuje so znižovaním hladín LDL-C, a to rovnako v podskupine nízkych hodnôt TG aj podskupinách stredných a vyšších hodnôt TG. Platí to pre všetky 4 reálne súbory aj pre umelý súbor. Tieto rozdiely sú tým viditeľnejšie, čím väčší je rozsah súboru. Pre umelý súbor bola celková zhoda medzi kategóriami LDL-C najnižšia pri porovnaní Friedewaldovej a Martinovej rovnice (83,1 %), vyššia medzi rovnicami Sampson a Martin (88,9 %) a najvyššia pri porovnaní rovníc Friedewald a Sampson (90,9 %). Vo všetkých 4 reálnych súboroch boli trendy nadhodnotenia a podhodnotenia medzi rovnicami úplne rovnaké ako v umelom súbore. Záver: Výsledky klinických aj epidemiologických štúdií sú výrazne ovplyvnené použitou metódou stanovenia LDL-C. Pri porovnávaní výpočtových metód stanovenia LDL-C je možné s výhodou použiť popísaný umelý súbor.
Objective: LDL-cholesterol (LDL-C) is determined by methods whose accuracy is significantly affected in various clinical or analytical situations. Two computational methods have recently been described, the Martin equation and the Sampson equation, validity of which we compare with the Friedewald equation. Methods: LDL-C comparisons determined by the 3 equations were performed on 4 real sets of lipid data, generated in various previous studies, ranging from n = 140 to n = 7 393. We have created an artificial set of data on the extent of 900 members with equally distributed values of TC, HDL-C and TG troughout the commonly found range. Such a data set is independent of the phrase "we performed the calculations on our file". Comparisons were also made on this artificial file. Results: The difference between the LDL-C values determined by the different equations gradually increases with decreasing LDL-C levels, both in the subgroup of low TG values and in the subgroups of medium and higher TG values. This applies to all 4 real files as well as to the artificial file. These differences are more visible the larger the file size. For the artificial set, the overall agreement between the LDL-C categories was lowest when comparing the Friedewald and Martin equations (83.1%), higher between the Sampson and Martin equations (88.9%) and highest when comparing the Friedewald and Sampson equations (90.9%). In all 4 real sets, the trends of overestimation and underestimation between the equations were exactly the same as in the artificial set. Conclusion: The results of clinical and epidemiological studies are significantly influenced by the method used to determine LDL-C. When comparing the calculation methods for determining LDL-C, it is possible to preferably use the described artificial set.
- Klíčová slova
- Friedewaldova rovnice, rovnice Martin/Hopkins, rovnice Sampson,
- MeSH
- klinická studie jako téma MeSH
- LDL-cholesterol * analýza MeSH
- lidé MeSH
- triglyceridy analýza MeSH
- Check Tag
- lidé MeSH
... about Change 7 -- 1.3 Three Important Features of a Study of Change 9 -- 2 Exploring Longitudinal Data ... ... on Change 16 -- 2.1 Creating a Longitudinal Data Set 17 -- 2.2 Descriptive Analysis of Individual Change ... ... Systematic Interindividual Differences in Change 57 -- 3.4 Fitting the Multilevel Model for Change to Data ... ... Examining Estimated Fixed Effects 68 -- 3.6 Examining Estimated Variance Components 72 -- 4 Doing Data ... ... for Characterizing the Distribution of Discrete-Time -- Event Occurrence Data 339 -- 10.3 Developing ...
xx, 644 s. : il, tab. ; 24 cm
- MeSH
- longitudinální studie MeSH
- sociální vědy metody MeSH
- výzkum MeSH
- výzkumný projekt MeSH
- Publikační typ
- monografie MeSH
- Konspekt
- Sociologie
- NLK Obory
- sociologie
BACKGROUND: Set-level classification of gene expression data has received significant attention recently. In this setting, high-dimensional vectors of features corresponding to genes are converted into lower-dimensional vectors of features corresponding to biologically interpretable gene sets. The dimensionality reduction brings the promise of a decreased risk of overfitting, potentially resulting in improved accuracy of the learned classifiers. However, recent empirical research has not confirmed this expectation. Here we hypothesize that the reported unfavorable classification results in the set-level framework were due to the adoption of unsuitable gene sets defined typically on the basis of the Gene ontology and the KEGG database of metabolic networks. We explore an alternative approach to defining gene sets, based on regulatory interactions, which we expect to collect genes with more correlated expression. We hypothesize that such more correlated gene sets will enable to learn more accurate classifiers. METHODS: We define two families of gene sets using information on regulatory interactions, and evaluate them on phenotype-classification tasks using public prokaryotic gene expression data sets. From each of the two gene-set families, we first select the best-performing subtype. The two selected subtypes are then evaluated on independent (testing) data sets against state-of-the-art gene sets and against the conventional gene-level approach. RESULTS: The novel gene sets are indeed more correlated than the conventional ones, and lead to significantly more accurate classifiers. The novel gene sets are indeed more correlated than the conventional ones, and lead to significantly more accurate classifiers. CONCLUSION: Novel gene sets defined on the basis of regulatory interactions improve set-level classification of gene expression data. The experimental scripts and other material needed to reproduce the experiments are available at http://ida.felk.cvut.cz/novelgenesets.tar.gz.
Techniky strojového učení jsou metody, které umožní vytvořit z trénovací množiny případů model pro kategorie dat tak, že mohou být nové (neznámé) případy zařazeny do jedné nebo více kategorií schématem odpovídajícím modelu. Pro tento typ analýzy jsou velmi vhodná data ze studií sledujících určitou skupinu osob s opakovaným sběrem dat stejného typu. K vyhledávání znalostí z medicínských dat bylo užito různých algoritmů strojového učení. Bylo testováno několik algoritmů tak, aby bylo možno pokrýt většinu způsobů učení s učitelem. Byly provedeny dva typy pokusů. Jeden hledal vztahy mezi atributy, druhý testoval predikci budoucích příhod. Pro pokusy v tomto sdělení byla užita data z dvacet let trvající longitudinální primárně preventivní studie rizikových faktorů (RF) aterosklerózy u mužů středního věku. Studie se nazývá STULONG (LONGitudinal STUdy). Výsledky ukazují, že některé metody předpovídají některé poruchy lépe než jiné a že je tedy vhodné použít všechny algoritmy najednou a posuzovat spolehlivost výsledku na základě známého trendu každé metody. Algoritmy strojového učení byly také použity k předpovědi příčiny úmrtí. V tomto případě byly výsledky nevalné, pravděpodobně pro malé množství informace ve vstupních položkách v datového souboru.
Machine learning techniques are methods that given a training set of examples infer a model for the categories of the data, so that new (unknown) examples could be assigned to one or more categories by pattern matching within the model. The data from follow-up studies with repeated collection of the same type of data are very suitable for this analysis. Machine learning algorithms belonging to a variety of paradigms have been applied to knowledge discovery on medical data. All the used algorithms belong to the supervised learning paradigm. Several algorithms have been tested, trying to cover most of the kinds of supervised learning. Two kinds of experiments have been carried out. The first is intended to discover associations between attributes. The second kind is intended to test prediction of future disorders. For the experiments in this paper the data used was from the twenty years lasting primary preventive longitudinal study of the risk factors (RF) of atherosclerosis in middle aged men. Study is named STULONG (LONGitudinal STUdy). The results show that some methods predict some disorders better than others, so it is interesting to use all the algorithms at a time and consider the result confidence based upon the known tendency of each method. The machine learning algorithms have been also used in the prediction of death cause, obtaining poor results in this case, maybe due to the small amount of information (entries) of this type in the dataset.
- Klíčová slova
- dobývání znalostí, strojové učení s učitelem, vytěžování z biomedicínských dat, rizikové faktory aterosklerózy,
- MeSH
- algoritmy MeSH
- ateroskleróza diagnóza MeSH
- faktografické databáze MeSH
- financování organizované MeSH
- lidé středního věku MeSH
- lidé MeSH
- metody pro podporu rozhodování MeSH
- prognóza MeSH
- rizikové faktory MeSH
- systémy pro podporu klinického rozhodování MeSH
- ukládání a vyhledávání informací MeSH
- znalostní báze MeSH
- Check Tag
- lidé středního věku MeSH
- lidé MeSH
- mužské pohlaví MeSH
Texts in statistical science
1st ed. xiv, 699 s.
... Hallmarks of data quality in chemical exposure assessment: Introduction -- What do we mean by "data" ... ... -- From exposure data quality to the quality of exposure assessments -- Conclusions ... ... - 5.2.2 Fuzzy methods 48 -- 5.2.3 Probabilistic methods 49 -- 5.2.4 Sensitivity analysis 58 -- 5.3 Data ... ... WHAT DO WE MEAN BY “DATA” IN EXPOSURE ASSESSMENT? 145 -- 3. ... ... FROM EXPOSURE DATA QUALITY TO THE QUALITY OF EXPOSURE ASSESSMENTS 155 -- 5. CONCLUSIONS 157 -- 6. ...
IPCS harmonization project document ; no. 6
xiii, 158 s. : il., tab. ; 30 cm
- MeSH
- hodnocení rizik MeSH
- nejistota MeSH
- sběr dat normy MeSH
- vystavení vlivu životního prostředí MeSH
- Konspekt
- Životní prostředí a jeho ochrana
- NLK Obory
- environmentální vědy
- NLK Publikační typ
- publikace WHO
Cíl: Prezentovat výsledky validace datového standardu (datasetu) pro sběr dat o dekubitálních lézích a zejména identifikovat nezbytné a naopak nadbytečné položky, které by měly být na lokální úrovni poskytovatelů zdravotních služeb monitorovány. Cílem není srovnání počtu záznamů o dekubitech a výskytu dekubitů, ale posouzení možnosti data v klinické praxi zadat a zhodnotit jejich výtěžnost a využitelnost ve vztahu k opatřením nezbytným při poskytování péče. Metodika: V pořadí druhá pilotní validace datasetu byla realizována ve třech zapojených fakultních nemocnicích (centrech) v ČR za období 6 měsíců (2. polovina roku 2017). První pre-pilotní validace byla realizována v předchozích 6 měsících. Statistická analýza dat byla provedena v programu SPSS (IBM Corp., Armonk, NY, USA) na hladině významnosti 0,05. Výsledky: Celkem byly ze všech tří center odevzdány údaje o 320 záznamech pacientů s 310 vyplněnými záznamy o anamnéze a 498 záznamy dekubitů. Nebylly ověřeny statisticky významné rozdíly v dostupnosti dat a vyplněnosti standardizovaného datového souboru v požadované struktuře (p > 0,05). Na základě zhodnocení administrativní zátěže a klinické přínosnosti sledovaných údajů byly provedeny změny ve finálním datovém standardu. Závěr: Připravený technický popis standardizovaného a validovaného souboru spolu s technickým popisem softwaru umožní jednoduchou implementaci na národní úrovni ke sjednocení souboru údajů o výskytu dekubitů.
Aim: To present the validation process of the data standard for the col lection of data on pressure ulcers and, in particular, to identify the necessary and un necessary items that should be monitored at the local level of the health service providers. On the contrary, the aim is not to compare the number of records of pressure ulcers and occurrence of pressure ulcers, but to assess the possibility of data collection in clinical practice and to assess their usability in relation to the measures neces sary for the provision of care. Methodology: Second pilot validation of the dataset was carried out in three participat ing university hospitals (centres) in the Czech Republic for a period of 6 months (2nd half of 2017). The first pre-pilot validation was organised in the previous 6 months. Statistical analysis of data was performed in SPSS (IBM Corp., Armonk, NY, USA) at a significance level of 0.05. Results: In total, data from 320 records of patients were submitted from all three centres, with 310 completed history records and 498 records of pressure ulcers. There were no statistically significant differences in data availability and completion of the standardized data set in the required structure (p > 0.05). Based on an as ses sment of the administrative burden and the clinical benefit of the data, changes were made to the final data standard. Conclusion: The prepared technical description of the standardized and validated dataset together with the technical description of the software will al low simple implementation at national level to unify the special dataset for monitoring of pressure ulcers.