Back to Search Start Over

Segmentace řeči

Authors :
Sysel, Petr
Míča, Ivan
Sysel, Petr
Míča, Ivan

Abstract

V rámci diplomové práce byl vytvořen program pro segmentaci nahrávek řeči na fonémy. Tento program byl vytvořen v prostředí Matlab a skládá se z několika skriptů. Program umožňuje automatickou segmentaci. Segmentace řeči je proces nalezení hranic mezi fonémy v mluvené řeči. Automatická segmentace je založena na metodě vektorové kvantizace. V prvním kroku výpočtu je provedena extrakce příznaků. Dále jsou části řeči přiděleny k určeným centroidům. Místo změny centroidu je označeno jako hranice fonémů. Tímto programem byla zpracována skupina nahrávek a vyhodnocena účinnost automatické segmentace. K programu byl vytvořen podrobný návod k obsluze. Dále jsou v práci stručně rozebrány jednotlivé použité metody zpracování řeči s uvedením jejich implementace v programu a odůvodnění nastavení jejich proměnných parametrů.<br />The programme for the segmentation of a speech into fonems was created as a part of the master´s thesis. This programme was made in the programme Matlab and consists of several scripts. The programme serves for automatic segmentation. Speech segmentation is the process of identifying the boundaries between phonemes in spoken natural languages. Automatic segmentation is based on vector quantization. In the first step of algorithm, feature extraction is realized. Then speech segments are assigned to calculated centroids. Position where centroid is changed is marked as a boundary of phoneme. The audiorecords were elaborated by the programme and a operation of the automatic segmentation was analysed. A detailed manual was created to the programme too. Individual used methods of the elaboration of a speech were in the master´s thesis briefly descripted, its implementations in the programme and reasons of set of its parameters.

Details

Database :
OAIster
Notes :
Czech
Publication Type :
Electronic Resource
Accession number :
edsoai.ocn978324536
Document Type :
Electronic Resource