The impact of the classification method and features selection for the speech emotion recognition accuracy is discussed in this paper. Selecting the correct parameters in combination with the classifier is an important part of reducing the complexity of system computing. This step is necessary especially for systems that will be deployed in real-time applications. The reason for the development and improvement of speech emotion recognition systems is wide usability in nowadays automatic voice controlled systems. Berlin database of emotional recordings was used in this experiment. Classification accuracy of artificial neural networks, k-nearest neighbours, and Gaussian mixture model is measured considering the selection of prosodic, spectral, and voice quality features. The purpose was to find an optimal combination of methods and group of features for stress detection in human speech. The research contribution lies in the design of the speech emotion recognition system due to its accuracy and efficiency.
- MeSH
- Algorithms * MeSH
- Databases, Factual MeSH
- Emotions physiology MeSH
- Voice Quality MeSH
- Humans MeSH
- Neural Networks, Computer MeSH
- Signal Processing, Computer-Assisted instrumentation MeSH
- Speech physiology MeSH
- ROC Curve MeSH
- Pattern Recognition, Automated * MeSH
- Pattern Recognition, Physiological physiology MeSH
- Check Tag
- Humans MeSH
- Publication type
- Journal Article MeSH
Tento článek se zabývá automatickou lokalizací objektů (očí, úst) ve dvourozměrných (2D) černobílých obrazech obličejů. Je motivován praktickým problémem v genetice člověka a výstup lokalizace objektů v dané databázi obrazů je zapotřebí pro řešení dalších úloh v genetickém výzkumu. V článku se aplikuje robustní filtr na obrazy s cílem odstranit šum. Hlavní metodou jsou šablony. Ústa a obě oči se lokalizují současně za použití váženého Pearsonova korelačního koeficientu nebo jeho robustní analogie založené na robustních regresních metodách. V databázi s 212 obrazy obličejů tato metoda správně nalezne ústa a oči ve 100 % případů. Také robustní korelační koeficient založený na regresní metodě nejmenších vážených čtverců lokalizuje ústa a oči ve 100 % obrazů uvažované databáze. Článek studuje robustní aspekty této metody vzhledem k otočení, šumu, okluzi a asymetrii v obraze. Současná lokalizace úst i obou očí je invariantní vůči libovolnému otočení obličeje. Tato studie využívá speciální vlastnosti daných obrazů obličejů vzhledem k očekávanému použití v genetických aplikacích.
This paper is devoted to automatic localization of objects (eyes, mouth) in two-dimensional (2D) grey scale images of faces. Motivated by a practical problem in human genetics, the output of the localization of objects in the given database of images is needed for further tasks in the genetic research. A robust filter is applied on the image to ensure denoising. Templates are used as the main method. The mouth and both eyes are localized jointly using the weighted Pearson product-moment correlation coefficient or its robust analogy based on robust regression methods. In the database with 212 images of faces the method allows to locate the mouth and eyes correctly in 100 % of cases. Also the robust correlation coefficient based on the least weighted squares regression localizes the mouth and both eyes in 100 % of images of the given database. Robustness aspects of the method are examined with respect to rotation, noise, occlusion and asymmetry in the image. The joint localization of the mouth and both eyes produces the method invariant to rotation of any degree. This work is tailor made for the given images with expected usage of the methods in genetic applications.
- Keywords
- lokalizace objektů, šablony, detekce oči a úst, robustní korelační analýza, redukce šumu,
- MeSH
- Biometry methods MeSH
- Contrast Sensitivity physiology MeSH
- Databases as Topic standards MeSH
- Photography methods MeSH
- Genetic Research MeSH
- Image Interpretation, Computer-Assisted methods MeSH
- Humans MeSH
- Face MeSH
- Eye MeSH
- Image Processing, Computer-Assisted methods MeSH
- Regression Analysis MeSH
- Reproducibility of Results MeSH
- Pattern Recognition, Physiological physiology MeSH
- Subtraction Technique standards MeSH
- Mouth MeSH
- Image Enhancement methods MeSH
- Check Tag
- Humans MeSH
Mnoho lidí a zvířat řeší ve svém každodenním životě problémy časoprostorového charakteru. K jejich úspěšnému řešení lze často dojít užitím více typů strategií chování. V našem malém souhrnném článku prezentujeme přehled několika možných řešení jednoduchého problému jak dostihnout pohybující se cíl. Různé živočišné druhy využívají při navigaci na pohyblivý cíl různé přístupy. V článku také představujeme náš jednoduchý model navigace na pohybující se cíl u potkana. Zmiňujeme se i o některých mozkových strukturách, které se zúčastňují zpracování informace o pohybujících se objektech, jejich pronásledování nebo predikci trajektorie cíle.
Many animals and humans often solve spatio-temporal problems in their daily lives. Their successful solution is frequently obtainable by using various behavioral strategies. Here we present a review of possible solutions of a problem „how to reach the moving ta rget“. Different animal species use different ways for navigation to a moving goal. We also present our simple behavioral model for na vigation towards a moving goal in laboratory rats. We also discuss some known brain structures participated in process of reaching, purs uing or predicting trajectory of moving target.
- MeSH
- Behavior, Animal physiology MeSH
- Financing, Organized MeSH
- Rats MeSH
- Models, Animal MeSH
- Size Perception physiology MeSH
- Motion MeSH
- Spatial Behavior physiology MeSH
- Pattern Recognition, Physiological physiology MeSH
- Time Perception physiology MeSH
- Motion Perception physiology MeSH
- Space Perception physiology MeSH
- Check Tag
- Rats MeSH