Back to Search Start Over

Innehållsbaserad uppsnabbning av video

Innehållsbaserad uppsnabbning av video

Authors :
Lundström, Joakim
Publication Year :
2022
Publisher :
KTH, Skolan för elektroteknik och datavetenskap (EECS), 2022.

Abstract

This report demonstrates and explores alternative methods for speeding up video with associated audio. Two methods have been investigated, these have been combined and evaluated. The first one is to find quiet segments in the video and drastically accelerate them. The other method is to use a speech-to-text service to measure speech speed and speed up the content based on the measured speed, this method proved not to be suitable with the developed implementation together with the chosen speech-to-text software. Dynamically adjusting the speed of audio and video after analyzing for quiet segments is a suitable alternative to a constant speed factor. This method has in some cases made the content easier to understand compared to acceleration with a fixed factor at the same audio and video duration, thus the goal of the work has been fulfilled, although not fully. Det här arbetet visar och undersöker alternativa metoder för hastighetsökning av video med tillhörande ljud. Två metoder har undersökts, dessa har kombinerats och utvärderats. Den ena metoden som undersökts är att hitta tysta stunder i innehållet och drastiskt accelerera dessa. Den andra metoden är att med hjälp av en tal-till-text tjänst mäta talhastighet och snabba upp innehållet utifrån den uppmätta hastigheten, denna metod visade sig inte vara lämplig med den implementation som tagits fram tillsammans med de tal-till-text-mjukvaror som testats. Att anpassa hastigheten på ljud och video dynamiskt efter analys av tysta stunder är ett lämpligt alternativ till en konstant hastighetsförändring. Denna metod har i vissa fall gjort innehållet lättare att uppfatta och förstå vid samma totala tidslängd på ljud och video jämfört med uppsnabbning med fast faktor, därmed har målet med arbetet uppfyllts, om än inte fullt ut.

Details

Language :
Swedish
Database :
OpenAIRE
Accession number :
edsair.od.......260..bb6329ad98da36e1a46b0de32f02e0e7