Author: "Bisbal Asensi, Empar" - Searchworks@Jio Institute Digital Library Search Results

Your search keyword '"Bisbal Asensi, Empar"' showing total 7 results

Start Over Author "Bisbal Asensi, Empar"

7 results on '"Bisbal Asensi, Empar"'

1. Desarrollo de un corpus de entrenamiento para sistemas de búsqueda de respuestas basados en aprendizaje automático

Author: Bisbal Asensi, Empar, Moreno Boronat, Lidia, Tomás, David, and Vicedo, Jose-Luis
Subjects: Búsqueda de respuestas, Corpora, Machine learning, Question answering, Corpus, Aprendizaje automático
Abstract: En este trabajo se describe el desarrollo de un corpus de preguntas y respuestas factuales similares a las utilizadas en las conferencias TREC. Dicho corpus consta de más de 70.000 muestras, cada una de ellas con la siguiente información: una pregunta, el tipo de esa pregunta, la respuesta exacta, el párrafo del que ha sido extraída la respuesta, el documento del que ha sido extraído el párrafo y una etiqueta indicando si la respuesta es correcta (muestra positiva) o no (muestra negativa) en el contexto proporcionado. El corpus desarrollado puede ser utilizado, por ejemplo, para entrenar un clasificador binario que decida de forma automática si la respuesta proporcionada por un determinado sistema es correcta o no. Hasta donde conocemos, éste es el primer corpus que puede ser utilizado para entrenar todos y cada uno de los módulos de un sistema de Búsqueda de Respuestas: clasificación de la pregunta, recuperación de información, extracción de la respuesta y validación de la misma. El proceso para la obtención del corpus ha sido realizado de forma semi-automática. This paper describes the development of an English corpus of factoid TREC-like question-answer pairs. The corpus obtained consists of a set of more than 70,000 samples, containing each one the following information: a question, its question type, an exact answer to that question, the different context levels (sentence, paragraph and document) where the answer occurs inside a document, and a label indicating whether the answer is correct (a positive sample) or not (a negative sample). For instance, this corpus can be used for training a binary classifier in order to decide if a given answer is correct (positive) to the question formulated or not (negative). To our knowledge, this is the first corpus that can be used to train each one of the modules of a trainable Question Answering system: question classification, information retrieval, answer extraction and answer validation. The process carried out to obtain the corpus was semi-automatic. Este trabajo ha sido desarrollado en el marco del proyecto CICYT R2D2 (TIC2003-07158-C04).
Published: 2006

2. Una aproximación multilingüe a la clasificación de preguntas basada en aprendizaje automático

Author: Tomás Díaz, David, Vicedo González, José Luis, Suárez Cueto, Armando, Bisbal Asensi, Empar, and Moreno Boronat, Lidia
Subjects: Clasificación de preguntas, Question classification, Aprendizaje basado en ejemplos, Máxima entropía, Support vector machines, Multilingüe, Memory-based learning, Maximum entropy, Multilingual, Machine learning, Máquinas de vectores soporte, Aprendizaje automático
Abstract: Este artículo presenta una aproximación multilingüe a la clasificación de preguntas basada en aprendizaje automático, empleando características de aprendizaje independientes del idioma. Esto va a permitir que el sistema sea flexible y fácilmente adaptable a nuevos idiomas. Sobre un corpus paralelo de preguntas en inglés y castellano, contrastaremos el rendimiento del sistema con tres métodos distintos de aprendizaje: Máquinas de Vectores Soporte, Máxima Entropía y aprendizaje basado en ejemplos. This paper presents a multilingual approach to question classification based on machine learning. This approach is flexible and easy to adapt to new languages using language independent learning features. The system’s performance has been compared in a parallel English-Spanish corpus of questions using three different learning methods: Support Vector Machines, Maximum Entropy and Memory-based Learning. Este trabajo ha sido subvencionado por el proyecto CICYT R2D2 (TIC2003-07158-C04) y por el Ministerio de Educación y Ciencia y el Fondo Social Europeo a través de la beca BES-2004-3935.
Published: 2005

3. Podado y lexicalización de reglas gramaticales y su aplicación al análisis sintáctico parcial

Author: Bisbal Asensi, Empar, Molina Marco, Antonio, and Moreno Boronat, Lidia
Subjects: Shallow parsing, Corpus-based techniques, Análisis sintáctico superficial, Técnicas basadas en corpus
Abstract: En este artículo se presenta un mecanismo de adquisición automática de reglas a partir de corpora anotados sintácticamente. Esta aproximación se basa en una extensión del algoritmo propuesto por Claire Cardie y David Pierce (Cardie y Pierce, 1998). Se muestra cómo mejora el modelo aplicando técnicas de lexicalización (Molina, 2004). In this paper we present a mechanism for the automatic acquisition of rules from syntactic anotated corpora. This approach is based on an extension of the Claire Cardie and David Pierce algorithm (Cardie y Pierce, 1998). The improvement of the model using lexicalization techniques (Molina, 2004) is shown. Este trabajo ha sido subvencionado por los proyectos PROFIT 3LB (FIT-150500-2002-244) y CICYT R2D2 (TIC2003-07158-C04-03).
Published: 2004

4. 3LB: construcción de una base de datos de árboles sintáctico semánticos

Author: Aduriz Agirre, Itziar, Ageno Pulido, Alicia María, Arrieta Cortajarena, Bertol, Arriola Egurrola, José María, Bisbal Asensi, Empar, Castell Ariño, Nuria, Civit Torruella, Montserrat, Díaz de Ilarraza Sánchez, Arantza, Fernández, B., Gojenola Galletebeitia, Koldo, Halkoum, Reda, Marcos Maciá, Raquel, Màrquez Villodre, Lluís, Martí Antonín, Maria Antònia, Martínez-Barco, Patricio, Molina Marco, Antonio, Moreda, Paloma, Moreno Boronat, Lidia, Navarro Colorado, Borja, Oronoz Anchordoqui, Maite, Padró Cirera, Lluís, Palomar, Manuel, Pla Santamaría, Ferrán, Rodríguez Hontoria, Horacio, Saiz Noeda, Maximiliano, Sanchis Arnal, Emilio, Sarasola Gabiola, Kepa, Suárez Cueto, Armando, and Taulé Delor, Mariona
Subjects: Anotación sintáctica, Corpus, Anotación semántica
Abstract: Entidad financiera: MCyT (Proyecto PROFIT: FIT-150500-2002-411).
Published: 2003

5. 3LB-SAT : una herramienta de anotación semántica

Author: Bisbal Asensi, Empar, Molina Marco, Antonio, Moreno Boronat, Lidia, Pla Santamaría, Ferrán, Saiz Noeda, Maximiliano, and Sanchis Arnal, Emilio
Subjects: Herramientas de anotación semántica, Natural language, Lenguaje natural, Corpora anotados, Corpora annotated, Semantic annotation tool
Abstract: Presentamos una herramienta, llamada 3LB-SAT, para el etiquetado semántico de corpus multilingüe. Sus principales características son que está orientado a la palabra, que permite introducir el corpus en diferentes formatos (formato parentizado TBF y formato XML) y que usa el diccionario EuroWordnet para consultar el sentido de las palabras en cuatro lenguas (español, catalán, euskara e inglés). We present a tool, called 3LB-SAT, for the semantic tagging of multilingual corpora. Main features of this tool are that it is word-oriented, allows different formats for input corpus (TBF format, PenTreebank Bracketted Format and XML) and uses EuroWordnet for searching the word sense in four languages. Este trabajo ha sido subvencionado por el proyecto PROFIT 3LB (FIT-150500-2002-244) y el proyecto CICYT TUSIR (TIC2000-0664-C02-01).
Published: 2003

6. Una aproximación multilingüe a la clasificación de preguntas basada en aprendizaje automático

Author: Tomás, David, Vicedo, Jose-Luis, Suárez Cueto, Armando, Bisbal Asensi, Empar, Moreno Boronat, Lidia, Tomás, David, Vicedo, Jose-Luis, Suárez Cueto, Armando, Bisbal Asensi, Empar, and Moreno Boronat, Lidia
Abstract: Este artículo presenta una aproximación multilingüe a la clasificación de preguntas basada en aprendizaje automático, empleando características de aprendizaje independientes del idioma. Esto va a permitir que el sistema sea flexible y fácilmente adaptable a nuevos idiomas. Sobre un corpus paralelo de preguntas en inglés y castellano, contrastaremos el rendimiento del sistema con tres métodos distintos de aprendizaje: Máquinas de Vectores Soporte, Máxima Entropía y aprendizaje basado en ejemplos., This paper presents a multilingual approach to question classification based on machine learning. This approach is flexible and easy to adapt to new languages using language independent learning features. The system’s performance has been compared in a parallel English-Spanish corpus of questions using three different learning methods: Support Vector Machines, Maximum Entropy and Memory-based Learning.
Published: 2005

7. 3LB: construcción de una base de datos de árboles sintáctico-semánticos para el catalán, euskera y castellano

Author: Palomar, Manuel, Civit Torruella, Montserrat, Díaz de Ilarraza Sánchez, Arantza, Moreno Boronat, Lidia, Bisbal Asensi, Empar, Aranzabe Urruzola, María Jesús, Ageno Pulido, Alicia María, Martí Antonín, Maria Antònia, Navarro Colorado, Borja, Palomar, Manuel, Civit Torruella, Montserrat, Díaz de Ilarraza Sánchez, Arantza, Moreno Boronat, Lidia, Bisbal Asensi, Empar, Aranzabe Urruzola, María Jesús, Ageno Pulido, Alicia María, Martí Antonín, Maria Antònia, and Navarro Colorado, Borja
Abstract: En este artículo presentamos los resultados del proyecto 3LB, consistente en el desarrollo de tres corpus (para el catalán, el castellano y el euskera) anotados sintáctica y semánticamente. Se exponen los criterios que se han seguido para las diferentes anotaciones, las diferentes herramientas desarrolladas para los distintos etiquetados, así como los resultados de evaluación de la anotación., In this paper, we present the results of the 3LB project, which consist on the development of three corpora (one for Catalan, one for Spanish and one for Basque) with syntactic and semantic annotation. We show the criteria followed for each annotation, the different tools developed for each tagging and the results of annotation evaluation.
Published: 2004

Catalog

Books, media, physical & digital resources

See catalog results

Searchworks

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources

Refine your results

7 results on '"Bisbal Asensi, Empar"'

1. Desarrollo de un corpus de entrenamiento para sistemas de búsqueda de respuestas basados en aprendizaje automático

2. Una aproximación multilingüe a la clasificación de preguntas basada en aprendizaje automático

3. Podado y lexicalización de reglas gramaticales y su aplicación al análisis sintáctico parcial

4. 3LB: construcción de una base de datos de árboles sintáctico semánticos

5. 3LB-SAT : una herramienta de anotación semántica

6. Una aproximación multilingüe a la clasificación de preguntas basada en aprendizaje automático

7. 3LB: construcción de una base de datos de árboles sintáctico-semánticos para el catalán, euskera y castellano

Catalog

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Topic

Publication Year Range

Language

Publication Type

Database

7 results on '"Bisbal Asensi, Empar"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources