96 results on '"España Boquera, Salvador"'
Search Results
2. F-Measure as the Error Function to Train Neural Networks
- Author
-
Pastor-Pellicer, Joan, Zamora-Martínez, Francisco, España-Boquera, Salvador, Castro-Bleda, María José, Hutchison, David, editor, Kanade, Takeo, editor, Kittler, Josef, editor, Kleinberg, Jon M., editor, Mattern, Friedemann, editor, Mitchell, John C., editor, Naor, Moni, editor, Nierstrasz, Oscar, editor, Pandu Rangan, C., editor, Steffen, Bernhard, editor, Sudan, Madhu, editor, Terzopoulos, Demetri, editor, Tygar, Doug, editor, Vardi, Moshe Y., editor, Weikum, Gerhard, editor, Rojas, Ignacio, editor, Joya, Gonzalo, editor, and Gabestany, Joan, editor
- Published
- 2013
- Full Text
- View/download PDF
3. Cartografía del aguacate en Michoacán con imágenes Sentinel-2 y una metodología mixta
- Author
-
Espana Boquera, Maria Luisa, primary, Castro Bleda, María José, additional, and España Boquera, Salvador, additional
- Published
- 2022
- Full Text
- View/download PDF
4. Adding Morphological Information to a Connectionist Part-Of-Speech Tagger
- Author
-
Zamora-Martínez, Francisco, Castro-Bleda, María José, España-Boquera, Salvador, Tortajada-Velert, Salvador, Hutchison, David, Series editor, Kanade, Takeo, Series editor, Kittler, Josef, Series editor, Kleinberg, Jon M., Series editor, Mattern, Friedemann, Series editor, Mitchell, John C., Series editor, Naor, Moni, Series editor, Nierstrasz, Oscar, Series editor, Pandu Rangan, C., Series editor, Steffen, Bernhard, Series editor, Sudan, Madhu, Series editor, Terzopoulos, Demetri, Series editor, Tygar, Doug, Series editor, Vardi, Moshe Y., Series editor, Weikum, Gerhard, Series editor, Goebel, Randy, editor, Siekmann, Jörg, editor, Wahlster, Wolfgang, editor, Meseguer, Pedro, editor, Mandow, Lawrence, editor, and Gasca, Rafael M., editor
- Published
- 2010
- Full Text
- View/download PDF
5. Improving Isolated Handwritten Word Recognition Using a Specialized Classifier for Short Words
- Author
-
Zamora-Martínez, Francisco, Castro-Bleda, María José, España-Boquera, Salvador, Gorbe, Jorge, Hutchison, David, Series editor, Kanade, Takeo, Series editor, Kittler, Josef, Series editor, Kleinberg, Jon M., Series editor, Mattern, Friedemann, Series editor, Mitchell, John C., Series editor, Naor, Moni, Series editor, Nierstrasz, Oscar, Series editor, Pandu Rangan, C., Series editor, Steffen, Bernhard, Series editor, Sudan, Madhu, Series editor, Terzopoulos, Demetri, Series editor, Tygar, Doug, Series editor, Vardi, Moshe Y., Series editor, Weikum, Gerhard, Series editor, Goebel, Randy, editor, Siekmann, Jörg, editor, Wahlster, Wolfgang, editor, Meseguer, Pedro, editor, Mandow, Lawrence, editor, and Gasca, Rafael M., editor
- Published
- 2010
- Full Text
- View/download PDF
6. A Flexible System for Document Processing and Text Transcription
- Author
-
Vilar, Juan Miguel, Castro-Bleda, María José, Zamora-Martínez, Francisco, España-Boquera, Salvador, Gordo, Albert, Llorens, David, Marzal, Andrés, Prat, Federico, Gorbe, Jorge, Hutchison, David, Series editor, Kanade, Takeo, Series editor, Kittler, Josef, Series editor, Kleinberg, Jon M., Series editor, Mattern, Friedemann, Series editor, Mitchell, John C., Series editor, Naor, Moni, Series editor, Nierstrasz, Oscar, Series editor, Pandu Rangan, C., Series editor, Steffen, Bernhard, Series editor, Sudan, Madhu, Series editor, Terzopoulos, Demetri, Series editor, Tygar, Doug, Series editor, Vardi, Moshe Y., Series editor, Weikum, Gerhard, Series editor, Goebel, Randy, editor, Siekmann, Jörg, editor, Wahlster, Wolfgang, editor, Meseguer, Pedro, editor, Mandow, Lawrence, editor, and Gasca, Rafael M., editor
- Published
- 2010
- Full Text
- View/download PDF
7. Semiring Lattice Parsing Applied to CYK
- Author
-
España Boquera, Salvador, Gorbe Moya, Jorge, Zamora Martínez, Francisco, Hutchison, David, editor, Kanade, Takeo, editor, Kittler, Josef, editor, Kleinberg, Jon M., editor, Mattern, Friedemann, editor, Mitchell, John C., editor, Naor, Moni, editor, Nierstrasz, Oscar, editor, Rangan, C. Pandu, editor, Steffen, Bernhard, editor, Sudan, Madhu, editor, Terzopoulos, Demetri, editor, Tygar, Doug, editor, Vardi, Moshe Y., editor, Weikum, Gerhard, editor, Martí, Joan, editor, Benedí, José Miguel, editor, Mendonça, Ana Maria, editor, and Serrat, Joan, editor
- Published
- 2007
- Full Text
- View/download PDF
8. Efficient Viterbi Algorithms for Lexical Tree Based Models
- Author
-
España-Boquera, Salvador, Castro-Bleda, Maria Jose, Zamora-Martínez, Francisco, Gorbe-Moya, Jorge, Carbonell, Jaime G., editor, Siekmann, J\'org, editor, Chetouani, Mohamed, editor, Hussain, Amir, editor, Gas, Bruno, editor, Milgram, Maurice, editor, and Zarader, Jean-Luc, editor
- Published
- 2007
- Full Text
- View/download PDF
9. Transcrição humana ou assistência interativa computadorizada: reconhecimento automático, anotação e edição erudite no século XXI
- Author
-
Castro-Bleda, Maria Jose, Vilar Torres, Juan Miguel, España Boquera, Salvador, Llorens, D., Marzal Varó, Andrés, Prat, F., and Zamora Martínez, Francisco Julián
- Subjects
Ancient documents ,Reconocimiento automático de texto interactive ,Transcripción asistida ,Documentos antiguos ,Interacción multimodal persona/computador ,Assisted transcription ,Interactive automatic text recognition ,Multimodal human/computer interaction ,Reconocimiento automático de texto interactivo ,ComputingMethodologies_DOCUMENTANDTEXTPROCESSING ,LENGUAJES Y SISTEMAS INFORMATICOS - Abstract
[EN] Computer assisted transcription tools can speed up the initial process of reading and transcribing texts. At the same time, new annotation tools open new ways of accessing the text in its graphical form. The balance and value of each method still needs to be explored. STATE, a complete assisted transcription system for ancient documents, was presented to the audience of the 2013 International Medieval Congress at Leeds. The system offers a multimodal interaction environment to assist humans in transcribing ancient documents: the user can type, write on the screen with a stylus, or utter a word. When one of these actions is used to correct an erroneous word, the system uses this new information to look for other mistakes in the rest of the line. The system is modular, composed of different parts: one part creates projects from a set of images of documents, another part controls an automatic transcription system, and the third part allows the user to interact with the transcriptions and easily correct them as needed. This division of labour allows great flexibility for organising the work in a team of transcribers., [ES] Las herramientas de ayuda a la transcripción automática pueden acelerar el proceso inicial de la lectura y transcripción de textos. Al mismo tiempo, las nuevas herramientas de anotación aportan nuevas formas de acceder al texto en su forma original gráfica. Sin embargo, todavía es necesario evaluar las bondades y capacidades de los distintos métodos. STATE, un completo sistema de asistencia a la transcripción de documentos antiguos, se presentó a la audiencia del International Medieval Congress de 2013 celebrado en Leeds. El sistema ofrece un entorno de interacción multimodal para ayudar a las personas en la transcripción de documentos antiguos: el usuario puede teclear, escribir en la pantalla con un lápiz óptico o corregir usando la voz. Cada vez que el usuario cambia de esta forma una palabra, el sistema utiliza la corrección para buscar errores en el resto de la línea. El sistema está dividido en diferentes módulos: uno crea proyectos a partir de un conjunto de imágenes de documentos, otro módulo controla el sistema de transcripción automática, y un tercer módulo permite al usuario interactuar con las transcripciones y corregirlas fácilmente cuando sea necesario. Esta división de las tareas permite una gran flexibilidad para organizar el trabajo de los transcriptores en equipo., Work supported by the Spanish Government (TIN2010-18958) and the Generalitat Valenciana (Prometeo/2010/028)
- Published
- 2021
10. Ampliación del Asset Game Artificial Intelligence para Unity incorporando Behavior Trees
- Author
-
Mollá Vayá, Ramón Pascual, España Boquera, Salvador, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Andreu Royo, Jorge, Mollá Vayá, Ramón Pascual, España Boquera, Salvador, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Andreu Royo, Jorge
- Abstract
[ES] En el presente proyecto se lleva a cabo la ampliación del llamado Asset GAIA (Game Artificial Intelligence API), incorporando Behavior Trees (Árboles de Comportamiento), como tecnología para construir inteligencias artificiales que dictarán el comportamiento de NPCs (Non-Playable Characters) en videojuegos de Unity. Además, se construye un módulo en Unity que incorpora este asset y el cual puede ser adquirido por cualquier desarrollador a través de la Asset Store de Unity., [CA] En el present projecte es du a terme la ampliaciò del nomenat Asset GAIA (Game Artificial Intelligence API), incorporant Behavior Trees (Arbres de Comportament), com a tecnologia per a la construcciò d’intel·ligències artificials que dictaran el comportament de NPCs (Non-Playable Characters) en videojocs de Unity. A més, es construïx un mòdul en Unity que incorpora aquest asset i el cual pot ser adquirit per qualsevol desenvolupador a través de la Asset Store de Unity., [EN] In this project, the extension of the so-called Asset GAIA (Game Artificial Intelligence API) is carried out, incorporating Behavior Trees as a technology to build artificial intelligences that will dictate the behavior of NPCs (Non-Playable Characters) in video games developed in Unity. In addition, a module is built in Unity that incorporates this asset and which can be purchased by any developer through the Unity Asset Store.
- Published
- 2021
11. Algoritmos de flujo y su implementación
- Author
-
España Boquera, Salvador, Gørtz, Inge Li, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Pérez López, Máximo, España Boquera, Salvador, Gørtz, Inge Li, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Pérez López, Máximo
- Abstract
[EN] The aim of the project is to survey existing state-of-the-art flow algorithms, and implement them in a conventional programming language. Moreover, design improvements and new solutions will be explored, based on the acquired knowledge. Flow problems appear in flow networks, that are directed graphs where each edge has an associated maximum capacity. A classical problem is to find how much flow can be pushed from a particular source vertex to a sink vertex, given the capacity restrictions. Finding the maximum flow is interesting in engineering problems that can be modeled with a flow network, like transport problems in traffic networks or electrical networks. Furthermore, the maximum flow problem can also be used to find maximum matchings in bipartite graphs, with a plethora of applications. There exist several algorithms to solve the maximum flow problem efficiently, that have different computational complexity depending on the properties of the graph that are applied on. Their differences will be studied, and their efficient implementation, as well as possible improvements., [ES] El objetivo del trabajo es hacer un estudio recopilatorio de los algoritmos de flujos más punteros y realizar una implementación de ellos en un lenguaje de programación convencional. También se explorarán posibles mejoras de diseño y nuevas soluciones, basadas en el conocimiento adquirido. Los problemas de flujo aparecen en redes de flujo, que son grafos dirigidos donde cada arista tiene asociada una capacidad máxima. Un problema clásico es encontrar cuánto flujo se puede transportar desde un vértice fuente hasta un vértice sumidero dados, teniendo en cuenta las restricciones de capacidad. Encontrar el flujo máximo es interesante en problemas de ingenería que se puedan modelar con una red de flujo, como por ejemplo pueden ser problemas de transporte en redes de carreteras o en redes eléctricas. También se puede usar el problema de flujo máximo para encontrar emparejamientos en grafos bipartitos, con múltiples aplicaciones. Existen diversos algoritmos para resolver el problema del flujo máximo eficientemente, que tienen diferente complejidad computacional dependiendo de las propiedades del grafo en el que se apliquen. Se estudiarán sus diferencias y su implementación eficiente, así como posibles mejoras, [EN]
- Published
- 2021
12. The NoisyOffice Database: A Corpus To Train Supervised Machine Learning Filters For Image Processing
- Author
-
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, European Regional Development Fund, Agencia Estatal de Investigación, Castro-Bleda, Maria Jose, España Boquera, Salvador, Pastor Pellicer, Joan, ZAMORA MARTÍNEZ, FRANCISCO JULIÁN, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, European Regional Development Fund, Agencia Estatal de Investigación, Castro-Bleda, Maria Jose, España Boquera, Salvador, Pastor Pellicer, Joan, and ZAMORA MARTÍNEZ, FRANCISCO JULIÁN
- Abstract
[EN] This paper presents the `NoisyOffice¿ database. It consists of images of printed text documents with noise mainly caused by uncleanliness from a generic office, such as coffee stains and footprints on documents or folded and wrinkled sheets with degraded printed text. This corpus is intended to train and evaluate supervised learning methods for cleaning, binarization and enhancement of noisy images of grayscale text documents. As an example, several experiments of image enhancement and binarization are presented by using deep learning techniques. Also, double-resolution images are also provided for testing super-resolution methods. The corpus is freely available at UCI Machine Learning Repository. Finally, a challenge organized by Kaggle Inc. to denoise images, using the database, is described in order to show its suitability for benchmarking of image processing systems.
- Published
- 2020
13. F-Measure as the Error Function to Train Neural Networks
- Author
-
Pastor-Pellicer, Joan, primary, Zamora-Martínez, Francisco, additional, España-Boquera, Salvador, additional, and Castro-Bleda, María José, additional
- Published
- 2013
- Full Text
- View/download PDF
14. Adding Morphological Information to a Connectionist Part-Of-Speech Tagger
- Author
-
Zamora-Martínez, Francisco, primary, Castro-Bleda, María José, additional, España-Boquera, Salvador, additional, and Tortajada-Velert, Salvador, additional
- Published
- 2010
- Full Text
- View/download PDF
15. A Flexible System for Document Processing and Text Transcription
- Author
-
Vilar, Juan Miguel, primary, Castro-Bleda, María José, additional, Zamora-Martínez, Francisco, additional, España-Boquera, Salvador, additional, Gordo, Albert, additional, Llorens, David, additional, Marzal, Andrés, additional, Prat, Federico, additional, and Gorbe, Jorge, additional
- Published
- 2010
- Full Text
- View/download PDF
16. Improving Isolated Handwritten Word Recognition Using a Specialized Classifier for Short Words
- Author
-
Zamora-Martínez, Francisco, primary, Castro-Bleda, María José, additional, España-Boquera, Salvador, additional, and Gorbe, Jorge, additional
- Published
- 2010
- Full Text
- View/download PDF
17. Individualized diagnosis of psychosis based on machine learning from functional magnetic resonance data using an emotional auditory paradigm
- Author
-
SANJUÁN ARIAS, JULIO, Castro-Bleda, Maria Jose, España Boquera, Salvador, Garcia-Marti, G., Carot Sierra, José Miguel, Corripio, I., Soldevila-Matias, P., MARTÍ-BONMATÍ, LUIS, Rubio, J.M., and Crespo-Facorro, B.
- Subjects
ESTADISTICA E INVESTIGACION OPERATIVA ,LENGUAJES Y SISTEMAS INFORMATICOS - Published
- 2019
18. Individualized diagnosis of psychosis based on machine learning from functional magnetic resonance data using an emotional auditory paradigm
- Author
-
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat, SANJUÁN ARIAS, JULIO, Castro-Bleda, Maria Jose, España Boquera, Salvador, Garcia-Marti, G., Carot Sierra, José Miguel, Corripio, I., Soldevila-Matias, P., MARTÍ-BONMATÍ, LUIS, Rubio, J.M., Crespo-Facorro, B., Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad - Departament d'Estadística i Investigació Operativa Aplicades i Qualitat, SANJUÁN ARIAS, JULIO, Castro-Bleda, Maria Jose, España Boquera, Salvador, Garcia-Marti, G., Carot Sierra, José Miguel, Corripio, I., Soldevila-Matias, P., MARTÍ-BONMATÍ, LUIS, Rubio, J.M., and Crespo-Facorro, B.
- Published
- 2019
19. Handwriting recognition by using deep learning to extract meaningful features
- Author
-
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Agencia Estatal de Investigación, Pastor Pellicer, Joan, Castro-Bleda, Maria Jose, España Boquera, Salvador, Zamora-Martinez, Francisco Julián, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Agencia Estatal de Investigación, Pastor Pellicer, Joan, Castro-Bleda, Maria Jose, España Boquera, Salvador, and Zamora-Martinez, Francisco Julián
- Abstract
[EN] Recent improvements in deep learning techniques show that deep models can extract more meaningful data directly from raw signals than conventional parametrization techniques, making it possible to avoid specific feature extraction in the area of pattern recognition, especially for Computer Vision or Speech tasks. In this work, we directly use raw text line images by feeding them to Convolutional Neural Networks and deep Multilayer Perceptrons for feature extraction in a Handwriting Recognition system. The proposed recognition system, based on Hidden Markov Models that are hybridized with Neural Networks, has been tested with the IAM Database, achieving a considerable improvement.
- Published
- 2019
20. Handwriting recognition by using deep learning to extract meaningful features
- Author
-
Pastor-Pellicer, Joan, primary, Castro-Bleda, María José, additional, España-Boquera, Salvador, additional, and Zamora-Martínez, Francisco, additional
- Published
- 2019
- Full Text
- View/download PDF
21. S70. INDIVIDUALIZED DIAGNOSIS OF PSYCHOSIS BASED ON MACHINE LEARNING FROM FUNCTIONAL MAGNETIC RESONANCE DATA USING AN EMOTIONAL AUDITORY PARADIGM
- Author
-
Sanjuan, Julio, primary, Castro-Bleda, Maria Jose, additional, España-Boquera, Salvador, additional, Garcia-Marti, Gracian, additional, Carot, Jose Miguel, additional, Corripio, Iluminada, additional, Soldevila-Matias, Pau, additional, Marti-Bonmati, Luis, additional, Rubio, Jose Manuel, additional, and Crespo-Facorro, Benedicto, additional
- Published
- 2019
- Full Text
- View/download PDF
22. Fallback Variable History NNLMs: Efficient NNLMs by precomputation and stochastic training
- Author
-
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Agencia Estatal de Investigación, Zamora Martínez, Francisco Julián, España Boquera, Salvador, Castro-Bleda, Maria Jose, Palacios Corella, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Agencia Estatal de Investigación, Zamora Martínez, Francisco Julián, España Boquera, Salvador, Castro-Bleda, Maria Jose, and Palacios Corella
- Abstract
[EN] This paper presents a new method to reduce the computational cost when using Neural Networks as Language Models, during recognition, in some particular scenarios. It is based on a Neural Network that considers input contexts of different length in order to ease the use of a fallback mechanism together with the precomputation of softmax normalization constants for these inputs. The proposed approach is empirically validated, showing their capability to emulate lower order N-grams with a single Neural Network. A machine translation task shows that the proposed model constitutes a good solution to the normalization cost of the output softmax layer of Neural Networks, for some practical cases, without a significant impact in performance while improving the system speed.
- Published
- 2018
23. Fallback Variable History NNLMs: Efficient NNLMs by precomputation and stochastic training
- Author
-
Zamora-Martínez, Francisco J., primary, España-Boquera, Salvador, additional, Castro-Bleda, Maria Jose, additional, and Palacios-Corella, Adrian, additional
- Published
- 2018
- Full Text
- View/download PDF
24. Servicio de compilación de programas en C en modo terminal para el entorno Native client de Google Chrome
- Author
-
España Boquera, Salvador, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Rodríguez Revert, Emilio, España Boquera, Salvador, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, and Rodríguez Revert, Emilio
- Abstract
[ES] El lenguaje de programación C es un lenguaje de alta relevancia en el campo de la ingeniería que ha servido como precursor de otros lenguajes actuales (véase C++, Java, C#, JavaScript, Objective-C,…). Esto hace de C un buen lenguaje para iniciarse en la programación y la prueba es que es utilizado en asignaturas de primer curso de varios grados de la UPV. Sin embargo existe una barrera de entrada para nuevos usuarios al necesitar de una serie de herramientas dependientes de cada entorno para poder compilar y ejecutar los programas. Este trabajo rompe con estas barreras al proporcionar un entorno web de edición, compilación y ejecución de programas. A diferencia de otras plataformas similares, nuestra propuesta ejecuta los programas escritos en C directamente sobre el navegador en lugar de utilizar un servidor para su ejecución (redireccionando la entrada/salida a la web). Esto es novedoso, incrementa notablemente la seguridad del servidor y reduce los tiempos de respuesta percibidos por el usuario., [CA] El llenguatge de programació C és un llenguatge d’alta rellevància en el camp de l’enginyeria que ha servit com a precursor d’altres llenguatges actuals (com C++, Java, C#, JavaScript, Objective-C,…). Açò fa de C un bon llenguatge per a iniciar-se en la programació i la prova és que és emprat en assignatures de primer curs en diversos graus de la UPV. No obstant això, hi ha una barrera d’entrada per a nous usuaris al necessitar una sèrie de ferramentes dependents de cada entorn per a poder compilar i executar els programes. Aquest treball trenca amb aquestes barreres al proporcionar un entorn web d’edició, compilació i execució de programes que, a diferència d’altres plataformes semblants, executa els programes escrits en C directament sobre el navegador en compte d’utilitzar un servidor per a la seua execució (redireccionant l’entrada/eixida a la web). Açò és una novetat que a més incrementa notablement la seguretat i redueix el temps de resposta percibit per l’usuari., [EN] The C programming language is a highly relevant language in the field of engineering that has served as a precursor to other current languages (see C ++, Java, C#, JavaScript, Objective-C,…). This makes of C a good language to start programming and, indeed, it is used nowadays as the language of choice to learn programmin in several engineering grades at UPV. However, there is an entry barrier for new users since a series of tools, dependent on each environment, are requried to compile and run the programs. This work breaks down these barriers by providing a web environment for editing, compiling and executing programs that, unlike other similar platforms, can run programs written in C on the browser instead of using a server for execution (by redirecting the input/output to the web). This is not only new but it also increases the security of the server and reduces response times perceived by the user.
- Published
- 2017
25. Contributions to the joint segmentation and classification of sequences (My two cents on decoding and handwriting recognition)
- Author
-
Castro Bleda, María José, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, España Boquera, Salvador, Castro Bleda, María José, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, and España Boquera, Salvador
- Abstract
[EN] This work is focused on problems (like automatic speech recognition (ASR) and handwritten text recognition (HTR)) that: 1) can be represented (at least approximately) in terms of one-dimensional sequences, and 2) solving these problems entails breaking the observed sequence down into segments which are associated to units taken from a finite repertoire. The required segmentation and classification tasks are so intrinsically interrelated ("Sayre's Paradox") that they have to be performed jointly. We have been inspired by what some works call the "successful trilogy", which refers to the synergistic improvements obtained when considering: - a good formalization framework and powerful algorithms; - a clever design and implementation taking the best profit of hardware; - an adequate preprocessing and a careful tuning of all heuristics. We describe and study "two stage generative models" (TSGMs) comprising two stacked probabilistic generative stages without reordering. This model not only includes Hidden Markov Models (HMMs, but also "segmental models" (SMs). "Two stage decoders" may be deduced by simply running a TSGM in reversed way, introducing non determinism when required: 1) A directed acyclic graph (DAG) is generated and 2) it is used together with a language model (LM). One-pass decoders constitute a particular case. A formalization of parsing and decoding in terms of semiring values and language equations proposes the use of recurrent transition networks (RTNs) as a normal form for Context Free Grammars (CFGs), using them in a parsing-as-composition paradigm, so that parsing CFGs result in a slight extension of regular ones. Novel transducer composition algorithms have been proposed that can work with RTNs and can deal with null transitions without resorting to filter-composition even in the presence of null transitions and non-idempotent semirings. A review of LMs is described and some contributions mainly focused on LM interfaces, LM representation and on, [ES] Este trabajo se centra en problemas (como reconocimiento automático del habla (ASR) o de escritura manuscrita (HTR)) que cumplen: 1) pueden representarse (quizás aproximadamente) en términos de secuencias unidimensionales, 2) su resolución implica descomponer la secuencia en segmentos que se pueden clasificar en un conjunto finito de unidades. Las tareas de segmentación y de clasificación necesarias están tan intrínsecamente interrelacionadas ("paradoja de Sayre") que deben realizarse conjuntamente. Nos hemos inspirado en lo que algunos autores denominan "La trilogía exitosa", refereido a la sinergia obtenida cuando se tiene: - un buen formalismo, que dé lugar a buenos algoritmos; - un diseño e implementación ingeniosos y eficientes, que saquen provecho de las características del hardware; - no descuidar el "saber hacer" de la tarea, un buen preproceso y el ajuste adecuado de los diversos parámetros. Describimos y estudiamos "modelos generativos en dos etapas" sin reordenamientos (TSGMs), que incluyen no sólo los modelos ocultos de Markov (HMM), sino también modelos segmentales (SMs). Se puede obtener un decodificador de "dos pasos" considerando a la inversa un TSGM introduciendo no determinismo: 1) se genera un grafo acíclico dirigido (DAG) y 2) se utiliza conjuntamente con un modelo de lenguaje (LM). El decodificador de "un paso" es un caso particular. Se formaliza el proceso de decodificación con ecuaciones de lenguajes y semianillos, se propone el uso de redes de transición recurrente (RTNs) como forma normal de gramáticas de contexto libre (CFGs) y se utiliza el paradigma de análisis por composición de manera que el análisis de CFGs resulta una extensión del análisis de FSA. Se proponen algoritmos de composición de transductores que permite el uso de RTNs y que no necesita recurrir a composición de filtros incluso en presencia de transiciones nulas y semianillos no idempotentes. Se propone una extensa revisión de LMs y algunas contribuciones relacionadas c, [CA] Aquest treball es centra en problemes (com el reconeiximent automàtic de la parla (ASR) o de l'escriptura manuscrita (HTR)) on: 1) les dades es poden representar (almenys aproximadament) mitjançant seqüències unidimensionals, 2) cal descompondre la seqüència en segments que poden pertanyer a un nombre finit de tipus. Sovint, ambdues tasques es relacionen de manera tan estreta que resulta impossible separar-les ("paradoxa de Sayre") i s'han de realitzar de manera conjunta. Ens hem inspirat pel que alguns autors anomenen "trilogia exitosa", referit a la sinèrgia obtinguda quan prenim en compte: - un bon formalisme, que done lloc a bons algorismes; - un diseny i una implementació eficients, amb ingeni, que facen bon us de les particularitats del maquinari; - no perdre de vista el "saber fer", emprar un preprocés adequat i fer bon us dels diversos paràmetres. Descrivim i estudiem "models generatiu amb dues etapes" sense reordenaments (TSGMs), que inclouen no sols inclouen els models ocults de Markov (HMM), sinò també models segmentals (SM). Es pot obtindre un decodificador "en dues etapes" considerant a l'inrevés un TSGM introduint no determinisme: 1) es genera un graf acíclic dirigit (DAG) que 2) és emprat conjuntament amb un model de llenguatge (LM). El decodificador "d'un pas" en és un cas particular. Descrivim i formalitzem del procés de decodificació basada en equacions de llenguatges i en semianells. Proposem emprar xarxes de transició recurrent (RTNs) com forma normal de gramàtiques incontextuals (CFGs) i s'empra el paradigma d'anàlisi sintàctic mitjançant composició de manera que l'anàlisi de CFGs resulta una lleugera extensió de l'anàlisi de FSA. Es proposen algorismes de composició de transductors que poden emprar RTNs i que no necessiten recorrer a la composició amb filtres fins i tot amb transicions nul.les i semianells no idempotents. Es proposa una extensa revisió de LMs i algunes contribucions relacionades amb la seva interfície, amb la seva represen
- Published
- 2016
26. Human or Computer Assisted Interactive Transcription: Automated Text Recognition, Text Annotation, and Scholarly Edition in the Twenty-First Century
- Author
-
Castro Bleda, María José, Vilar Torres, Juan Miguel, España Boquera, Salvador, Llorens Piñana, David, Marzal Varó, Andrés, Prat Villar, Federico, and Zamora, F.
- Subjects
Interacción multimodal persona/computador ,Ancient documents ,Documentos antiguos ,Assisted transcription ,Transcripción asistida ,Interactive automatic text recognition ,Multimodal human/computer interaction ,Reconocimiento automático de texto interactivo - Abstract
Computer assisted transcription tools can speed up the initial process of reading and transcribing texts. At the same time, new annotation tools open new ways of accessing the text in its graphical form. The balance and value of each method still needs to be explored. STATE, a complete assisted transcription system for ancient documents, was presented to the audience of the 2013 International Medieval Congress at Leeds. The system offers a multimodal interaction environment to assist humans in transcribing ancient documents: the user can type, write on the screen with a stylus, or utter a word. When one of these actions is used to correct an erroneous word, the system uses this new information to look for other mistakes in the rest of the line. The system is modular, composed of different parts: one part creates projects from a set of images of documents, another part controls an automatic transcription system, and the third part allows the user to interact with the transcriptions and easily correct them as needed. This division of labour allows great flexibility for organising the work in a team of transcribers. Las herramientas de ayuda a la transcripción automática pueden acelerar el proceso inicial de la lectura y transcripción de textos. Al mismo tiempo, las nuevas herramientas de anotación aportan nuevas formas de acceder al texto en su forma original gráfica. Sin embargo, todavía es necesario evaluar las bondades y capacidades de los distintos métodos. STATE, un completo sistema de asistencia a la transcripción de documentos antiguos, se presentó a la audiencia del International Medieval Congress de 2013 celebrado en Leeds. El sistema ofrece un entorno de interacción multimodal para ayudar a las personas en la transcripción de documentos antiguos: el usuario puede teclear, escribir en la pantalla con un lápiz óptico o corregir usando la voz. Cada vez que el usuario cambia de esta forma una palabra, el sistema utiliza la corrección para buscar errores en el resto de la línea. El sistema está dividido en diferentes módulos: uno crea proyectos a partir de un conjunto de imágenes de documentos, otro módulo controla el sistema de transcripción automática, y un tercer módulo permite al usuario interactuar con las transcripciones y corregirlas fácilmente cuando sea necesario. Esta división de las tareas permite una gran flexibilidad para organizar el trabajo de los transcriptores en equipo. Work supported by the Spanish Government (TIN2010-18958) and the Generalitat Valenciana (Prometeo/2010/028).
- Published
- 2014
27. Nuevo teclado Morse táctil para dispositivos Android
- Author
-
España Boquera, Salvador, Mollá Vayá, Ramón Pascual, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Cabanes Santamaría, Pablo Silverio, España Boquera, Salvador, Mollá Vayá, Ramón Pascual, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Cabanes Santamaría, Pablo Silverio
- Abstract
[ES] Morse5k es un teclado virtual para dispositivos Android [1] de tipo Tablet o Smartphone. Le hemos llamado así porque utiliza una configuración de 5 botones en un grid 2x2 con un botón central: dos de ellos representan puntos, otros dos representan rayas y el central hace la función de validar y escribir el conjunto de puntos y rayas elegidos hasta el momento. La elección de puntos y rayas se debe a que el teclado se inspira en el código Morse: el famoso alfabeto desarrollado por Alfred Vail y Samuel Morse [2]. Fue creado por estos dos inventores de los Estados Unidos para el telégrafo eléctrico, otra de sus invenciones. Hecho a medida para mensajes concisos y más bien cortos en el año 1830, no consta de algunos símbolos, y en especial de los que son más típicos de tiempos actuales como puede ser ‘@’. Por esta razón se han añadido a los ya existentes, combinaciones de puntos y rayas para abarcar más símbolos y no dejar al teclado fuera de contextos más formales donde se necesita más variedad en el alfabeto que en conversaciones más propias de amigos o amigas en chats o juegos.
- Published
- 2015
28. Neural network language models to select the best translation
- Author
-
Khalilov, Maxim, Fonollosa, José A.R., Zamora-Mart nez, Francisco, Castro Bleda, María José, España Boquera, Salvador, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
Natural language processing (Computer science) ,Automatic speech recognition ,Reconeixement automàtic de la parla ,Tractament del llenguatge natural (Informàtica) ,Informàtica::Intel·ligència artificial::Llenguatge natural [Àrees temàtiques de la UPC] ,LENGUAJES Y SISTEMAS INFORMATICOS - Abstract
The quality of translations produced by statistical machine translation (SMT) systems crucially depends on the generalization ability provided by the statistical models involved in the process. While most modern SMT systems use n-gram models to predict the next element in a sequence of tokens, our system uses a continuous space language model (LM) based on neural networks (NN). In contrast to works in which the NN LM is only used to estimate the probabilities of shortlist words (Schwenk 2010), we calculate the posterior probabilities of out-of-shortlist words using an additional neuron and unigram probabilities. Experimental results on a small Italian- to-English and a large Arabic-to-English translation task, which take into account di erent word history lengths (n-gram order), show that the NN LMs are scalable to small and large data and can improve an n-gram-based SMT system. For the most part, this approach aims to improve translation quality for tasks that lack translation data, but we also demonstrate its scalability to large-vocabulary tasks.
- Published
- 2013
29. Human or computer assisted interactive transcription: automated text recognition, text annotation, and scholarly edition in the twenty-first century
- Author
-
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Ministerio de Ciencia e Innovación, Generalitat Valenciana, Castro-Bleda, Maria Jose, Vilar Torres, Juan Miguel, España Boquera, Salvador, Llorens, D., Marzal Varó, Andrés, Prat, F., Zamora Martínez, Francisco Julián, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Ministerio de Ciencia e Innovación, Generalitat Valenciana, Castro-Bleda, Maria Jose, Vilar Torres, Juan Miguel, España Boquera, Salvador, Llorens, D., Marzal Varó, Andrés, Prat, F., and Zamora Martínez, Francisco Julián
- Abstract
[EN] Computer assisted transcription tools can speed up the initial process of reading and transcribing texts. At the same time, new annotation tools open new ways of accessing the text in its graphical form. The balance and value of each method still needs to be explored. STATE, a complete assisted transcription system for ancient documents, was presented to the audience of the 2013 International Medieval Congress at Leeds. The system offers a multimodal interaction environment to assist humans in transcribing ancient documents: the user can type, write on the screen with a stylus, or utter a word. When one of these actions is used to correct an erroneous word, the system uses this new information to look for other mistakes in the rest of the line. The system is modular, composed of different parts: one part creates projects from a set of images of documents, another part controls an automatic transcription system, and the third part allows the user to interact with the transcriptions and easily correct them as needed. This division of labour allows great flexibility for organising the work in a team of transcribers., [ES] Las herramientas de ayuda a la transcripción automática pueden acelerar el proceso inicial de la lectura y transcripción de textos. Al mismo tiempo, las nuevas herramientas de anotación aportan nuevas formas de acceder al texto en su forma original gráfica. Sin embargo, todavía es necesario evaluar las bondades y capacidades de los distintos métodos. STATE, un completo sistema de asistencia a la transcripción de documentos antiguos, se presentó a la audiencia del International Medieval Congress de 2013 celebrado en Leeds. El sistema ofrece un entorno de interacción multimodal para ayudar a las personas en la transcripción de documentos antiguos: el usuario puede teclear, escribir en la pantalla con un lápiz óptico o corregir usando la voz. Cada vez que el usuario cambia de esta forma una palabra, el sistema utiliza la corrección para buscar errores en el resto de la línea. El sistema está dividido en diferentes módulos: uno crea proyectos a partir de un conjunto de imágenes de documentos, otro módulo controla el sistema de transcripción automática, y un tercer módulo permite al usuario interactuar con las transcripciones y corregirlas fácilmente cuando sea necesario. Esta división de las tareas permite una gran flexibilidad para organizar el trabajo de los transcriptores en equipo.
- Published
- 2014
30. Neural network language models for off-line handwriting recognition
- Author
-
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, European Commission, Swiss National Science Foundation, Ministerio de Ciencia e Innovación, Zamora Martínez, Francisco Julián, Frinken, V., España Boquera, Salvador, Castro-Bleda, Maria Jose, Fischer, A., Bunke, Horst, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, European Commission, Swiss National Science Foundation, Ministerio de Ciencia e Innovación, Zamora Martínez, Francisco Julián, Frinken, V., España Boquera, Salvador, Castro-Bleda, Maria Jose, Fischer, A., and Bunke, Horst
- Abstract
[EN] Unconstrained off-line continuous handwritten text recognition is a very challenging task which has been recently addressed by different promising techniques. This work presents our latest contribution to this task, integrating neural network language models in the decoding process of three state-of-the-art systems: one based on bidirectional recurrent neural networks, another based on hybrid hidden Markov models and, finally, a combination of both. Experimental results obtained on the IAM off-line database demonstrate that consistent word error rate reductions can be achieved with neural network language models when compared with statistical N-gram language models on the three tested systems. The best word error rate, 16.1%, reported with ROVER combination of systems using neural network language models significantly outperforms current benchmark results for the IAM database.
- Published
- 2014
31. Herramienta colaborativa para la edición de documentos estructurados
- Author
-
España Boquera, Salvador, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Rodríguez, Gustavo Ezequiel, España Boquera, Salvador, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Rodríguez, Gustavo Ezequiel
- Abstract
[ES] Este proyecto tiene como objetivo el diseño y la implementación de una herramienta para la edición de textos estructurados de manera colaborativa. En un documento estructurado la representación del mismo separa la estructura lógica del mismo de su aspecto final. La utilidad de este tipo de herramienta es indudable, pues son numerosos los entornos donde se realizan documentos entre varios autores y estos documentos tienen una naturaleza estructurada. Sin ir más lejos, se puede tomar como ejemplo la elaboración de un boletín de prácticas entre los diferentes profesores de una asignatura. A pesar de la utilidad general de este tipo de herramientas, este proyecto nace de una necesidad concreta, que es la de ser el apoyo técnico para una Organización no gubernamental (ONG) que se está formando con el objetivo de fomentar y encauzar el desarrollo de libros de texto de primaria y secundaria con licencia Creative Commons o similares., [EN] The main goal of this project is the design and implementation of a tool dedicated to the edition of structured texts in a colaborative way. The usefulness of this kind of tool is out of question, since there are various environments where documents are written by several autors and these documents have a structured nature. In structured documents the logical structure of the document is explicitly represented and is independent of the final aspect. An example of the utility of such a tool is the elaboration of a exercise bulletins between the different teachers of a particular subject. Despite the general usefulness of this kind of tool, this project is born from a concrete necessity. This is the need to provide technical support to an emerging NGO. This organization would have as its objective the promotion of the use of schoolbooks with Creative Commons or a simmilar license.
- Published
- 2014
32. The use of neural networks for tendency prediction in financial series
- Author
-
España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Muñoz Castro, Juan Francisco, España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Muñoz Castro, Juan Francisco
- Abstract
In the present project, a comparison of di erent types of arti cial neu- ral networks has been used to analyze their behavior with noisy time series prediction, with the goal of maximizing the bene t obtainable by investing in them. To do so, a wide range of datasets has been used, containing stock market prices until September 2014 and starting from January 2000 on- wards. The starting experiment has been a regular multilayer perceptron using a sliding window of the latest values as the input of the network and three outputs representing three possible actions as buy, sell or keep. Fur- ther experiments have been tested, such as the replacement of the three outputs classi er by a single one, converting the system in a forecasting model with only one output, or the use of di erent averages of recent val- ues instead of a simple sliding window as the network's input. Also, it has been tested the use of a single dataset from where each sample is used rst to test and validate, and to train the network later on in a new step instead of the traditional way of training-validation-test splitting of data. Finally, two new models that seize all the data have been tested, one with a speci c period of data validation, and the other one with an implicit period, as it has been skipped by doing some networks pre-training. After a comprehensive applying of these methods to the time series, certain pre- dictability was found. Some networks were able to predict the direction of change for the next day with an error rate of around the 40%, which in some optimistic cases decreases to about 30% when rejecting examples where the system has low con dence in its prediction. A practical simu- lation has been explained, showing an average gain close to the 0.33% by acting the half of the times.
- Published
- 2014
33. Semiring Lattice Parsing Applied to CYK
- Author
-
España Boquera, Salvador, primary, Gorbe Moya, Jorge, additional, and Zamora Martínez, Francisco, additional
- Full Text
- View/download PDF
34. Efficient Viterbi Algorithms for Lexical Tree Based Models
- Author
-
España-Boquera, Salvador, primary, Castro-Bleda, Maria Jose, additional, Zamora-Martínez, Francisco, additional, and Gorbe-Moya, Jorge, additional
- Full Text
- View/download PDF
35. F-Measure as the error function to train neural networks
- Author
-
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Ministerio de Ciencia e Innovación, Pastor Pellicer, Joan, Zamora Martínez, Francisco Julián, España Boquera, Salvador, Castro-Bleda, Maria Jose, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Ministerio de Ciencia e Innovación, Pastor Pellicer, Joan, Zamora Martínez, Francisco Julián, España Boquera, Salvador, and Castro-Bleda, Maria Jose
- Abstract
Imbalance datasets impose serious problems in machine learning. For many tasks characterized by imbalanced data, the F-Measure seems more appropiate than the Mean Square Error or other error measures. This paper studies the use of F-Measure as the training criterion for Neural Networks by integrating it in the Error-Backpropagation algorithm. This novel training criterion has been validated empirically on a real task for which F-Measure is typically applied to evaluate the quality. The task consists in cleaning and enhancing ancient document images which is performed, in this work, by means of neural filters.
- Published
- 2013
36. Neural network language models to select the best translation
- Author
-
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Khalilov, Maxim, Fonollosa, José A.R., Zamora-Mart nez, Francisco, Castro Bleda, María José, España Boquera, Salvador, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Khalilov, Maxim, Fonollosa, José A.R., Zamora-Mart nez, Francisco, Castro Bleda, María José, and España Boquera, Salvador
- Abstract
The quality of translations produced by statistical machine translation (SMT) systems crucially depends on the generalization ability provided by the statistical models involved in the process. While most modern SMT systems use n-gram models to predict the next element in a sequence of tokens, our system uses a continuous space language model (LM) based on neural networks (NN). In contrast to works in which the NN LM is only used to estimate the probabilities of shortlist words (Schwenk 2010), we calculate the posterior probabilities of out-of-shortlist words using an additional neuron and unigram probabilities. Experimental results on a small Italian- to-English and a large Arabic-to-English translation task, which take into account different word history lengths (n-gram order), show that the NN LMs are scalable to small and large data and can improve an n-gram-based SMT system. For the most part, this approach aims to improve translation quality for tasks that lack translation data, but we also demonstrate its scalability to large-vocabulary tasks.
- Published
- 2013
37. Catalyde: un entorno de iniciación a la programación con fines educativos
- Author
-
España Boquera, Salvador, Pastor Pellicer, Joan, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Stanciu, Catalin Costin, España Boquera, Salvador, Pastor Pellicer, Joan, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Stanciu, Catalin Costin
- Abstract
[ES] el presente proyecto se ha diseñado e implementado una herramienta de apoyo al aprendizaje en asignaturas de introducción a la programación. Esta herramienta, denominada Catalyde, proporciona una interfaz de usuario accesible mediante un navegador web en el que los alumnos pueden acceder al boletín de prácticas, editar las soluciones a los ejercicios propuestos, compilarlos y ejecutarlos. Si bien ya existen entornos de desarrollo vía web, lo que hace novedoso este entorno para la enseñanza de la programación es la posibilidad de que el alumno pueda resolver las distintas partes de los ejercicios de manera incremental. Es decir, el alumno puede marcar qué partes del código han sido desarrolladas por él y la herramienta utiliza la solución propuesta por el profesor (que permanece oculta) para las partes que todavía no ha completado. De ese modo el alumno puede entender mejor lo que se pide (porque puede probar el programa desde el inicio) y la validez de lo que va realizando sin tener que esperar a completarlo todo al final. También permite evaluar de manera automática la corrección de algunos ejercicios por medio de tests., [EN] In this project, a novel tool called Catalyde has been designed and implemented. This tool is intended to guide students of first courses of Computer Science to develop their programming skills. By means of a web interface, users are able to edit the solutions of exercises proposed by their teacher, to compile and to execute them. One of the unique features of this environment is the possibility of developing solutions in an incremental way by marking and unmarking which parts of the solution are due to the students and which parts should made use of the hidden teacher¿s solution. In this way, students can test the program and can better understand what it is expected from them. They can also check parts of the code without waiting for the complete solution. The tool can also automatically check the validity of some exercises by means of tests.
- Published
- 2013
38. Neural network language models to select the best translation
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Khalilov, Maxim, Rodríguez Fonollosa, José Adrián, Zamora Martínez, Francisco, Castro Bleda, María José, España Boquera, Salvador, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Khalilov, Maxim, Rodríguez Fonollosa, José Adrián, Zamora Martínez, Francisco, Castro Bleda, María José, and España Boquera, Salvador
- Abstract
The quality of translations produced by statistical machine translation (SMT) systems crucially depends on the generalization ability provided by the statistical models involved in the process. While most modern SMT systems use n-gram models to predict the next element in a sequence of tokens, our system uses a continuous space language model (LM) based on neural networks (NN). In contrast to works in which the NN LM is only used to estimate the probabilities of shortlist words (Schwenk 2010), we calculate the posterior probabilities of out-of-shortlist words using an additional neuron and unigram probabilities. Experimental results on a small Italian- to-English and a large Arabic-to-English translation task, which take into account di erent word history lengths (n-gram order), show that the NN LMs are scalable to small and large data and can improve an n-gram-based SMT system. For the most part, this approach aims to improve translation quality for tasks that lack translation data, but we also demonstrate its scalability to large-vocabulary tasks., Peer Reviewed, Postprint (published version)
- Published
- 2013
39. Transcriptor ortográfico-fonético para el castellano
- Author
-
Castro Bleda, María José, España Boquera, Salvador, Marzal Varo, Andrés, and Salvador Igual, Ismael
- Subjects
Lengua española ,Reconocimiento de voz ,Transcriptor ortográfico-fonético - Abstract
El trabajo describe un sistema para transcribir automáticamente texto ortográfico en idioma español en una cadena de símbolos de tipo fonético. El transcriptor ortográfico-fonético se basa en una serie de reglas que indican cómo se deben transcribir los grafemas en unidades de tipo fonético atendiendo al contexto en que se presentan. La utilidad de este transcriptor ortográfico-fonético es, principalmente, el entrenamiento de sistemas de reconocimiento de voz. Se ha incluido la opción de pronunciaciones múltiples (posibilidad de que un sonido no se pronuncie o se pronuncie de diferentes formas). Finalmente, se ha desarrollado una herramienta para crear modelos léxicos de un sistema de reconocimiento automático del habla. Trabajo subvencionado parcialmente por el proyecto CICYT TIC98-0423-C06-02 y el contrato 1FD97-2055-C02-01 del Gobierno español.
- Published
- 2001
40. Implementación de un módulo para el entrenamiento y evaluación de redes neuronales mediante GPUs
- Author
-
España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Palacios Corella, Adrián, España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Palacios Corella, Adrián
- Abstract
El objetivo de este trabajo ha sido la mejora de la implementación de un toolkit de entrenamiento y evaluación de redes neuronales ya existente, incluyendo una versión en lenguaje CUDA para ser ejecutada en GPUs. El toolkit de partida utilizado en este proyecto se denomina "April" (acrónimo de "A Pattern Recognizer In Lua") y ha sido desarrollado con los lenguajes C++ y Lua por los directores de este proyecto final de carrera y permite entrenar redes neuronales artificiales de tipo feedforward utilizando el algoritmo de retropropagación del gradiente. El uso de bibliotecas de cálculo matricial, como la biblioteca MKL de Intel, junto al uso del modo de entrenamiento conocido como "bunch" permite acelerar de manera sustancial las etapas de evaluación y entrenamiento de estas redes, lo cual resulta casi imprescindible en la práctica cuando los experimentos reales requieren periodos de tiempo que van de varios días a varias semanas de CPU. A pesar de las características del toolkit original, resulta muy conveniente
- Published
- 2012
41. Desarrollo, implementación y evaluación de redes neuronales recurrentes de tipo LSTM-g
- Author
-
España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Assaf, Nizar Gandy, España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Assaf, Nizar Gandy
- Abstract
El objetivo de este Proyecto Final de Carrera es la implementación y desarrollo de la redes neuronales recurrentes de tipo Generalized Long Short Term Memory (LSTM-g) y su combinación con un diseño previo para redes de tipo feedforward o multilayer perceptron (MLP) entrenadas mediante Backpropagation. De este modo, se pretende no solamente implementar el algoritmo de entrenamiento de las LSTM-g sino poder utilizar ciertas características de las mismas (puertas "gated") en redes no recurrentes. Otro objetivo es aprovechar el diseño e implementación previas de la versión MLP, una especie de "arma de doble filo" porque nos ofrece partes ya resueltas pero, por otra parte, supone restricciones en el diseño. La memoria de este trabajo realiza un recorrido teórico sobre los distintos tipos de redes neuronales artificiales y sus respectivos algoritmos de aprendizaje abordando las dificultades que poseen. En particular, explicamos la dificultad de entrenar una red neuronal recurrente conforme aumenta la longitud de las secuencias utilizadas, donde se observa el problema del desvanecimiento de errores (Vanishing Gradients)[4] en el proceso de aprendizaje y cómo éste ha sido resuelto en la literatura. Este problema motiva las redes de tipo "long short term memory" que han sido mejoradas en diversos trabajos de la literatura con la aparición de las peephole connections, entre otras. Estas mejoras culmina con la introducción y análisis en profundidad de las redes LSTM y LSTM-g como solución al problema de aprendizaje comentado anteriormente en las redes neuronales recurrentes. A continuación se expone el diseño e implentación eficiente de un caso particular del mecanismo de control de flujo en las redes neuronales recurrentes de tipo LSTM-g como parte de la herramienta April, implementada en C++ y Lua, desarrollada por los codirectores de este proyecto y que, al inicio de este proyecto, disponía de un módulo de entrenamiento de MLPs utilizando el algoritmo de backpropagation. Ex
- Published
- 2012
42. Desarrollo de una matriz virtual software para una empresa de videovigilancia y circuito cerrado de televisión
- Author
-
España Boquera, Salvador, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Puig Álvarez, Alejandro, España Boquera, Salvador, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Puig Álvarez, Alejandro
- Published
- 2011
43. Improving offline handwritten text recognition with hybrid HMM/ANN models
- Author
-
Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Ministerio de Educación y Ciencia, Generalitat Valenciana, España Boquera, Salvador, Castro-Bleda, Maria Jose, Gorbe Moya, Jorge, Zamora Martínez, Francisco Julián, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Ministerio de Educación y Ciencia, Generalitat Valenciana, España Boquera, Salvador, Castro-Bleda, Maria Jose, Gorbe Moya, Jorge, and Zamora Martínez, Francisco Julián
- Abstract
This paper proposes the use of hybrid Hidden Markov Model (HMM)/Artificial Neural Network (ANN) models for recognizing unconstrained offline handwritten texts. The structural part of the optical models has been modeled with Markov chains, and a Multilayer Perceptron is used to estimate the emission probabilities. This paper also presents new techniques to remove slope and slant from handwritten text and to normalize the size of text images with supervised learning methods. Slope correction and size normalization are achieved by classifying local extrema of text contours with Multilayer Perceptrons. Slant is also removed in a nonuniform way by using Artificial Neural Networks. Experiments have been conducted on offline handwritten text lines from the IAM database, and the recognition rates achieved, in comparison to the ones reported in the literature, are among the best for the same task. © 2006 IEEE.
- Published
- 2011
44. Aplicación para la supervisión del preproceso en escritura manuscrita
- Author
-
España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Martínez Morató, Juan, España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Martínez Morató, Juan
- Abstract
El reconocimiento de escritura manuscrita requiere una etapa de normalización de la imagen o preproceso . Recientemente se ha propuesto realizar esta etapa utilizando técnicas basadas en aprendizaje automático, obteniendo mejores resultados que otras técnicas basadas en heurísticos geométricos. Este proyecto pretende generar una aplicación grá ca que facilite el etiquetado de muestras para el entrenamiento supervisado de este preproceso. El objetivo es que dicha aplicación nos permita integrar el etiquetado de las muestras en la herramienta de supervisión del reconocimiento de escritura State . La aplicación desarrollada comprende las tres fases características del preproceso de texto manuscrito: corrección del Slope , corrección del Slant y normalización del tamaño. Para ello, se han implementado tres widgets cada uno de ellos relacionado con una de estas fases que permiten ver y modi car grá camente el resultado del etiquetado. Estos tres widgets permiten encadenar las tres etapas del preproceso desde la imagen original hasta la imagen preprocesada. Para desarrollar la aplicación se han empleado las bibliotecas WPF (Windows Presentation Foundation), EmguCV y el lenguaje C#, esto facilita la integración con State ya que este ultimo ha sido desarrollado con las mismas tecnologías.
- Published
- 2011
45. Desarrollo de un front-end para una herramienta de dictado basada en voz y escritura
- Author
-
España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Pérez Martínez, Alberto, España Boquera, Salvador, Zamora Martínez, Francisco, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Pérez Martínez, Alberto
- Published
- 2011
46. Speech interaction in a multimodal tool for handwritten text transcription
- Author
-
Castro-Bleda, Maria José, primary, España-Boquera, Salvador, additional, Llorens, David, additional, Marzal, Andrés, additional, Prat, Federico, additional, Vilar, Juan Miguel, additional, and Zamora-Martinez, Francisco, additional
- Published
- 2011
- Full Text
- View/download PDF
47. Contributions to the joint segmentation and classification of sequences (My two cents on decoding and handwriting recognition)
- Author
-
España Boquera, Salvador, primary
- Full Text
- View/download PDF
48. Improving a DTW-Based Recognition Engine for On-line Handwritten Characters by Using MLPs
- Author
-
Castro-Bleda, María José, primary, España-Boquera, Salvador, additional, Gorbe-Moya, Jorge, additional, Zamora-Martínez, Francisco, additional, Llorens-Piñana, David, additional, Marzal-Varó, Andrés, additional, Prat-Villar, Federico, additional, and Vilar-Torres, Juan Miguel, additional
- Published
- 2009
- Full Text
- View/download PDF
49. Semiring Lattice Parsing Applied to CYK.
- Author
-
Hutchison, David, Kanade, Takeo, Kittler, Josef, Kleinberg, Jon M., Mattern, Friedemann, Mitchell, John C., Naor, Moni, Nierstrasz, Oscar, Rangan, C. Pandu, Steffen, Bernhard, Sudan, Madhu, Terzopoulos, Demetri, Tygar, Doug, Vardi, Moshe Y., Weikum, Gerhard, Martí, Joan, Benedí, José Miguel, Mendonça, Ana Maria, Serrat, Joan, and España Boquera, Salvador
- Abstract
Context-Free Grammars play an important role in the pattern recognition research community. Word graphs provide a compact representation of the ambiguous alternatives generated during many pattern recognition, machine translation and other NLP tasks. This paper generalizes the framework for string parsing based on semirings and hypergraphs to the case of lattice parsing. This framework is the basis for the implementation of a parsing interface in a dataflow software architecture where modules send and receive word graphs in a serialized form using a protocol which allows the easy generation, filtering and parsing of word graphs. An implementation of the CYK algorithm is presented as an example. Experimental results are reported to demonstrate the proposed method. [ABSTRACT FROM AUTHOR]
- Published
- 2007
- Full Text
- View/download PDF
50. Efficient Viterbi Algorithms for Lexical Tree Based Models.
- Author
-
Carbonell, Jaime G., Siekmann, Jörg, Chetouani, Mohamed, Hussain, Amir, Gas, Bruno, Milgram, Maurice, Zarader, Jean-Luc, España-Boquera, Salvador, Castro-Bleda, Maria Jose, Zamora-Martínez, Francisco, and Gorbe-Moya, Jorge
- Abstract
In this paper we propose a family of Viterbi algorithms specialized for lexical tree based FSA and HMM acoustic models. Two algorithms to decode a tree lexicon with left-to-right models with or without skips and other algorithm which takes a directed acyclic graph as input and performs error correcting decoding are presented. They store the set of active states topologically sorted in contiguous memory queues. The number of basic operations needed to update each hypothesis is reduced and also more locality in memory is obtained reducing the expected number of cache misses and achieving a speed-up over other implementations. [ABSTRACT FROM AUTHOR]
- Published
- 2007
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.