-
Something wrong with this record ?
Dolování silných vzorů z lékařských sekvenčních dat
[Mining the strongest patterns in medical sequential data]
Jiří Kléma, Tomáš Holas, Filip Železný, Filip Karel
Language Czech Country Czech Republic
- MeSH
- Algorithms MeSH
- Atherosclerosis diagnosis etiology MeSH
- Biomedical Research methods instrumentation trends MeSH
- Databases, Factual trends utilization MeSH
- Financing, Organized MeSH
- Cardiovascular Diseases diagnosis etiology MeSH
- Medical Informatics methods instrumentation trends MeSH
- Humans MeSH
- Longitudinal Studies MeSH
- Risk Factors MeSH
- Data Collection methods instrumentation trends MeSH
- Statistics as Topic methods instrumentation trends MeSH
- Models, Theoretical MeSH
- Check Tag
- Humans MeSH
Sekvenční data jsou důležitým zdrojem lékařských znalostí. Tato specifická data mohou vznikat řadou různých způsobů. V tomto článku na příkladu konkrétní studie prezentujeme obecné postupy pro jejich dolování. Jde o preventivní dlouhodobou studii atherosklerózy – data jsou výsledkem dvě dekády trvajícího sledování vývoje rizikových faktorů a přidružených jevů. Hlavním cílem je identifikovat časté sekvenční vzory, tj. opakující se časové jevy, a studovat jejich možnou souvislost s objevením jedné ze sledovaných kardiovaskulárních nemocí. Z širší škály dostupných metod se soustředíme na induktivní logické programování, které potenciální vzory vyjadřuje ve formě rysů v predikátové logice prvního řádu. Rysy jsou nejprve automaticky extrahovány a následně sdružovány do pravidel, která představují výstupní formu získané znalosti. Navržený postup je porovnán s tradičnějšími metodami publikovanými dříve. Jde o metodu posuvných oken a epizodní pravidla.
Sequential data represent an important source of automatically mined and potentially new medical knowledge. They can originate in various ways. Within the presented domain they come from a longitudinal preventive study of atherosclerosis - the data consists of series of long-term observations recording the development of risk factors and associated conditions. The intention is to identify frequent sequential patterns having any relation to an onset of any of the observed cardiovascular diseases. This paper focuses on application of inductive logic programming. The prospective patterns are based on first-order features automatically extracted from the sequential data. The features are further grouped in order to reach final complex patterns expressed as rules. The presented approach is also compared with the approaches published earlier (windowing, episode rules).
Mining the strongest patterns in medical sequential data
Lit.: 6
- 000
- 00000naa 2200000 a 4500
- 001
- bmc09002768
- 003
- CZ-PrNML
- 005
- 20111210152545.0
- 008
- 091110s2008 xr e cze||
- 009
- AR
- 040 __
- $a ABA008 $b cze $c ABA008 $d ABA008 $e AACR2
- 041 0_
- $a cze $b eng
- 044 __
- $a xr
- 100 1_
- $a Kléma, Jiří, $d 1971-
- 245 10
- $a Dolování silných vzorů z lékařských sekvenčních dat / $c Jiří Kléma, Tomáš Holas, Filip Železný, Filip Karel
- 246 11
- $a Mining the strongest patterns in medical sequential data
- 314 __
- $a Gerstnerova laboratoř, katedra kybernetiky, ČVUT, Praha
- 504 __
- $a Lit.: 6
- 520 3_
- $a Sekvenční data jsou důležitým zdrojem lékařských znalostí. Tato specifická data mohou vznikat řadou různých způsobů. V tomto článku na příkladu konkrétní studie prezentujeme obecné postupy pro jejich dolování. Jde o preventivní dlouhodobou studii atherosklerózy – data jsou výsledkem dvě dekády trvajícího sledování vývoje rizikových faktorů a přidružených jevů. Hlavním cílem je identifikovat časté sekvenční vzory, tj. opakující se časové jevy, a studovat jejich možnou souvislost s objevením jedné ze sledovaných kardiovaskulárních nemocí. Z širší škály dostupných metod se soustředíme na induktivní logické programování, které potenciální vzory vyjadřuje ve formě rysů v predikátové logice prvního řádu. Rysy jsou nejprve automaticky extrahovány a následně sdružovány do pravidel, která představují výstupní formu získané znalosti. Navržený postup je porovnán s tradičnějšími metodami publikovanými dříve. Jde o metodu posuvných oken a epizodní pravidla.
- 520 9_
- $a Sequential data represent an important source of automatically mined and potentially new medical knowledge. They can originate in various ways. Within the presented domain they come from a longitudinal preventive study of atherosclerosis - the data consists of series of long-term observations recording the development of risk factors and associated conditions. The intention is to identify frequent sequential patterns having any relation to an onset of any of the observed cardiovascular diseases. This paper focuses on application of inductive logic programming. The prospective patterns are based on first-order features automatically extracted from the sequential data. The features are further grouped in order to reach final complex patterns expressed as rules. The presented approach is also compared with the approaches published earlier (windowing, episode rules).
- 650 _2
- $a lékařská informatika $x metody $x přístrojové vybavení $x trendy $7 D008490
- 650 _2
- $a databáze faktografické $x trendy $x využití $7 D016208
- 650 _2
- $a sběr dat $x metody $x přístrojové vybavení $x trendy $7 D003625
- 650 _2
- $a longitudinální studie $7 D008137
- 650 _2
- $a ateroskleróza $x diagnóza $x etiologie $7 D050197
- 650 _2
- $a rizikové faktory $7 D012307
- 650 _2
- $a kardiovaskulární nemoci $x diagnóza $x etiologie $7 D002318
- 650 _2
- $a biomedicínský výzkum $x metody $x přístrojové vybavení $x trendy $7 D035843
- 650 _2
- $a statistika jako téma $x metody $x přístrojové vybavení $x trendy $7 D013223
- 650 _2
- $a teoretické modely $7 D008962
- 650 _2
- $a algoritmy $7 D000465
- 650 _2
- $a financování organizované $7 D005381
- 650 _2
- $a lidé $7 D006801
- 700 1_
- $a Železný, Filip
- 700 1_
- $a Karel, Filip, $d 1981- $7 xx0107491
- 773 0_
- $w MED00011033 $t Lékař a technika $g Roč. 38, č. 4 (2008), s. 87-94 $x 0301-5491
- 910 __
- $a ABA008 $b B 1367 $c 1071 b $y 9
- 990 __
- $a 20091109082008 $b ABA008
- 991 __
- $a 20091113160545 $b ABA008
- 999 __
- $a ok $b bmc $g 691937 $s 553841
- BAS __
- $a 3
- BMC __
- $a 2008 $b 38 $c 4 $d 87-94 $i 0301-5491 $m Lékař a technika $x MED00011033
- LZP __
- $a 2009-36/mkal