Back to Search
Start Over
Implementació d'un mòdul descodificador per un sistema OCR
- Source :
- Dipòsit Digital de Documents de la UAB, Universitat Autònoma de Barcelona
- Publication Year :
- 2021
-
Abstract
- En el reconeixement de text en escenes, avui en dia retallar la paraula amb el correcte significat segueix sent un fet complicat. En aquest treball veurem una de les xarxes que ha obtingut bons resultats. Utilitzarem la xarxa BI-STET que utilitza CNN i transformers encoder i decoder. Veurem com funciona i intentarem introduir-li una CNN diferent anomenada PHOCNet, aquesta a diferencia de la BI-STET està pensada per treballar amb imatges amb lletres escrites a mà. En aquest treball compararem les dos CNN esmentades i veurem les seves possibilitats, avantatges i diferencies. Nowadays, In Scene Text Recognition (STR), crooping the words with the correct meaning is still complicated. In this work we will see one of the network that has obtained good results, we will use the BI-STET network that uses CNN and encoder and decoder transformers. We'll see how it Works and try to introduce a new diferent CNN called PHOCNet, unlike BI-STET is designed to work with images with handwritten letters. In this paper we will compare the two CNN mentioned and see their possibilities, advantages and differences. En el reconocimiento de texto en escenas, hoy en dia tecortar la palabra con el significado correcto sigue siendo una tarea complicada. En este trabajo veremos una de las redes que ha obtenido buenos resultados. Utilizaremos la red BI-STET que utiliza una CNN i transformers encoder i decoder. Veremos como funciona i intentaremos introducir una CNN diferente llamada PFOCNet, esta a diferencia de la BI-STET esta pensada para trabajar con imagenes de letras escritas a mano. En este trabajo compararemos estas dos CNN comentadas.
Details
- Language :
- Catalan; Valencian
- Database :
- OpenAIRE
- Journal :
- Dipòsit Digital de Documents de la UAB, Universitat Autònoma de Barcelona
- Accession number :
- edsair.dedup.wf.001..4006bcd2a0cd932a492c40fd429e4976