91 results on '"Oliver González, Antoni"'
Search Results
2. El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya
- Author
-
Oliver González, Antoni, primary
- Published
- 2023
- Full Text
- View/download PDF
3. Cadlaws – An English–French Parallel Corpus of Legally Equivalent Documents
- Author
-
Sole Mauri, Francina, Sánchez Gijón, Pilar, Oliver González, Antoni, Sole Mauri, Francina, Sánchez Gijón, Pilar, and Oliver González, Antoni
- Abstract
This article presents Cadlaws, a new English–French corpus built from Canadian legal documents, and describes the corpus construction process and preliminary statistics obtained from it. The corpus contains over 16 million words in each language and includes unique features since it is composed of documents that are legally equivalent in both languages but not the result of a translation. The corpus is built upon enactments co-drafted by two jurists to ensure legal equality of each version and to reflect the concepts, terms and institutions of two legal traditions. In this article the corpus definition as a parallel corpus instead of a comparable one is also discussed. Cadlaws has been pre-processed for machine translation and baseline Bilingual Evaluation Understudy (bleu), a score for comparing a candidate translation of text to a gold-standard translation of a neural machine translation system. To the best of our knowledge, this is the largest parallel corpus of texts which convey the same meaning in this language pair and is freely available for non-commercial use., Cet article présente Cadlaws, un nouveau corpus anglais-français construit à partir de documents juridiques canadiens. L’article décrit le processus de construction du corpus ainsi que les statistiques préliminaires obtenues à partir de celui-ci. Le corpus contient plus de 16 millions de mots dans chaque langue et présente des caractéristiques uniques puisqu’il est composé de documents juridiquement équivalents dans les deux langues mais qui ne sont pas le résultat d’une traduction. Le corpus est construit à partir de textes co-rédigés par deux juristes afin de garantir l’égalité juridique de chaque version et de refléter les concepts, termes et institutions de deux traditions juridiques. Dans cet article, la définition du corpus comme un corpus parallèle au lieu d’un corpus comparable est également discutée. Cadlaws a été prétraité pour la traduction automatique et offre la valeur d’évaluation bleu (Bilingual Evaluation Understudy), un score permettant de comparer une traduction avec la norme d’un système de traduction automatique neuronal. À notre connaissance, il s’agit du plus grand corpus parallèle de textes véhiculant le même sens dans cette paire de langues et il est disponible gratuitement pour une utilisation non commerciale., Este artículo presenta Cadlaws, un nuevo corpus en los pares de lenguas inglés y francés, creado con base en documentos legales canadienses. Describe el proceso de construcción del corpus y las estadísticas preliminares que se obtuvieron de aquél. Este corpus contiene más de 16 millones de vocablos en cada idioma e incluye características únicas, pues está conformado por documentos equivalentes desde el punto de vista jurídico en ambos idiomas como lengua de partida. El corpus se basó en autos legales redactados de manera conjunta por dos juristas para garantizar la equivalencia jurídica de cada versión y reflejar los conceptos, términos e instituciones de dos tradiciones del derecho. En este artículo, también se estudia la definición de corpus como corpus paralelo en oposición al corpus comparable. Cadlaws se procesó previamente para traducción automática y el suplente de evaluación bilingüe de referencia (bleu, por sus siglas en inglés), un puntaje que sirve para comparar un texto presentado como candidato para la traducción de un texto contra una traducción considerada patrón de referencia en un sistema de traducción automática neuronal. Hasta donde sabemos, este es el corpus paralelo de textos con el mismo significado en este par de lenguas más extenso que existe, y ofrece libre acceso para uso no comercial.
- Published
- 2021
4. Detección de Metaforicidad en Pares Adjetivo-Sustantivo
- Author
-
Torres Rivera, Andrés, Oliver González, Antoni, and Coll Florit, Marta
- Subjects
Deep Learning ,Metáfora ,Aprendizaje Profundo ,Lenguajes y Sistemas Informáticos ,Metaphor ,Word Embeddings ,NLP ,PLN - Abstract
In this paper we propose a neural network approach to detect the metaphoricity of Adjective-Noun pairs using pre-trained word embeddings and Word similarity using dot product. We found that metaphorical word pairs tend to have a lower dot product score while literal pairs a higher score. On this basis, we compared seven optimizers and two activation functions, from which the best performing pairs obtained an accuracy score of 97.69% and 97.74%, which represents an improvement of 6% over other current approaches. En este artículo proponemos un acercamiento mediante redes neuronales para la detección de la metaforicidad de pares Adjetivo-Sustantivo empleando Word embeddings pre-entrenados y similitud de palabras mediante el producto escalar. Encontramos que los pares de palabras metafóricos tienden a tener un producto escalar bajo mientras que los pares no metafóricos un resultado más alto. Bajo este supuesto, comparamos siete optimizadores y dos funciones de activación, de las cuales los pares con mejor desempeño obtuvieron una exactitud de 97.69% y 97.74%, que representa una mejora de 6% sobre otros enfoques actuales. This research was conducted in the framework of the project MOMENT: Metaphors of severe mental disorders. Discourse analysis of affected people and mental health professionals, funded by the Spanish National Research Agency (Agencia Estatal de Investigación, AEI) and the European Regional Development Fund, within the National Programme for Research Aimed at the Challenges of Society. Ref. FFI2017-86969-R (AEI/FEDER, UE).
- Published
- 2020
5. MTUOC: easy and free integration of NMT systems in professional translation environments
- Author
-
Oliver González, Antoni and Universitat Oberta de Catalunya (UOC)
- Subjects
traducció automàtica ,traducción automática ,Machine translating ,neural machine translation ,traducció automàtica neuronal ,machine translation ,traducción automática neuronal - Abstract
In this paper the MTUOC project, aiming to provide an easy integration of neural and statistical machine translation systems, is presented. Almost all the required software to train and use neural and statistical MT systems is released under free licences. However, their use is not always easy and intuitive and medium-high specialized skills are required. MTUOC project provides simplified scripts for preprocessing and training MT systems, and a server and client for easy use of the trained systems. The server is compatible with popular CAT tools for a seamless integration. The project also distributes some free engines.
- Published
- 2020
6. Post-editing for professional translators: cheer or fear?
- Author
-
Alvarez Vidal, Sergi, Oliver González, Antoni, Badia Cardús, Toni, Universitat Oberta de Catalunya (UOC), and Universitat Pompeu Fabra
- Subjects
Translating and interpreting ,postedició ,translators' perceptions ,translation workflow ,NMT ,percepció dels traductors ,percepción de los traductores ,machine translation ,Traducció i interpretació ,traducció automàtica ,postedición ,traducción automática ,post-editing ,flux de treball de traducció ,TAN ,Traducción e interpretación ,flujo de trabajo de traducción - Abstract
Currently, post-editing of machine translation (MT) has been introduced as a regular practice in the translation workflow, especially since the good results in quality obtained by neural MT (NMT). This fact is linked to the efforts LSPs and customers have done to reduce costs due to the recent global crisis and the increasing globalization, which has had a negative impact on translators' revenues and on their working practices. In this context, post-editing is often perceived with a negative bias by translators. We study attitudes of translators post-editing for the first time and relate them to their productivity rates. We also compare the results with a survey answered by professional post-editors assessing their perception of the task in the current marketplace. Actualment, la postedició de traducció automàtica (TA) és considerada una pràctica habitual en el flux de treball de la traducció, sobretot per la bona qualitat que s'obté amb la traducció automàtica neuronal (TAN). Aquest fet està assocat als esforços que han fet els proveïdors de serveis lingüístics i els clients per reduir els costos a causa de la crisi mundial dels darrers temps i la creixent globalització, que ha tingut un impacte negatiu sobre els ingressos dels traductors i sobre les seves pràctiques professionals. En aquest cotext, els traductors acostumen a percebre la postedició amb un biaix negatiu. En aquest article es presenta un dels primers estudis sobre les actituds dels traductors envers la postedició i es relacionen amb les seves taxes de productivitat. També acarem els resultats amb una enquesta contestada per posteditors professionals que avaluen la seva percepció de la tasca en el mercat actual.
- Published
- 2020
7. Entrenament, avaluació i integració d'un traductor automàtic neuronal de l'àmbit biomèdic a una empresa
- Author
-
Oliver González, Antoni, Méndez Arroyo, Marta, Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació, Oliver González, Antoni, Méndez Arroyo, Marta, and Universitat Autònoma de Barcelona. Facultat de Traducció i d'Interpretació
- Abstract
La traducció automàtica neuronal està, actualment, a l'ordre del dia de totes les agències del sector. En aquest treball de fi de màster es duu a terme la creació d'un motor de traducció automàtica neuronal, amb la combinació d'idiomes EN>ES, en l'àmbit biomèdic en col·laboració amb una agència de traducció i mitjançant la configuració de Marian. Es presenta tot el procés que comporta la creació d'un motor, inclosos la decisió de les llengües i l'àmbit, la cerca i preparació dels corpus, l'entrenament i l'avaluació. L'objectiu del treball és entrenar un motor de traducció automàtica que permeti augmentar la productivitat d'una empresa de traducció o d'un sector d'aquesta empresa i comprovar si ofereix millors o pitjors resultats que alguns dels traductors més potents del mercat, com són Google Translate i DeepL., La traducción automática neuronal está, actualmente, a la orden del día de todas las agencias del sector. En este trabajo de fin de máster se lleva a cabo la creación de un motor de traducción automática neuronal con la combinación de idiomas EN>ES, del ámbito biomédico en colaboración con una agencia de traducción y a partir de la configuración de Marian. Se presenta todo el proceso que implica la creación de un motor, que incluyen la decisión de las lenguas y el ámbito, la búsqueda y preparación de los corpus, el entrenamiento y la evaluación. El objetivo de este trabajo es entrenar un motor de traducción automática que permita augmentar la productividad de una empresa de traducción o de un sector de esa empresa i comprobar si ofrece mejores o peores resultados que algunos de los traductores más potentes del mercado, como son Google Translate i DeepL., Neural Machine translation is the new state-of-art in all the translation industry. In this Master's Degree dissertation, we create a neural machine translation engine with the language combination EN>ES about biomedicine in collaboration with a translation agency, built from Marian's configuration. We present all the processes that involves the creation of an engine, included the language and the field decision, the corpus research and preprocessing, the training and the evaluation. The aim of this dissertation is to train a machine translation engine that allows increase the productivity of a translation agency or part of it, and verify if it offers better or worse results than some of the best translation engines in the market, such as Google Translate and DeepL.
- Published
- 2020
8. Metaphoricity Detection in Adjective-Noun Pairs
- Author
-
Torres Rivera, Andrés, Oliver González, Antoni, Coll Florit, Marta, Torres Rivera, Andrés, Oliver González, Antoni, and Coll Florit, Marta
- Abstract
In this paper we propose a neural network approach to detect the metaphoricity of Adjective-Noun pairs using pre-trained word embeddings and Word similarity using dot product. We found that metaphorical word pairs tend to have a lower dot product score while literal pairs a higher score. On this basis, we compared seven optimizers and two activation functions, from which the best performing pairs obtained an accuracy score of 97.69% and 97.74%, which represents an improvement of 6% over other current approaches., En este artículo proponemos un acercamiento mediante redes neuronales para la detección de la metaforicidad de pares Adjetivo-Sustantivo empleando Word embeddings pre-entrenados y similitud de palabras mediante el producto escalar. Encontramos que los pares de palabras metafóricos tienden a tener un producto escalar bajo mientras que los pares no metafóricos un resultado más alto. Bajo este supuesto, comparamos siete optimizadores y dos funciones de activación, de las cuales los pares con mejor desempeño obtuvieron una exactitud de 97.69% y 97.74%, que representa una mejora de 6% sobre otros enfoques actuales.
- Published
- 2020
9. MOMENT: Metaphors of severe mental disorder. Discourse analysis of affected people and mental health professionals
- Author
-
Coll Florit, Marta, Climent Roca, Salvador, Correa-Urquiza, Martín, Hernández, Eulàlia, Oliver González, Antoni, Pié, Asun, Universitat Rovira i Virgili, Universitat Oberta de Catalunya. Estudis de Psicologia i Ciències de l'Educació, and Universitat Oberta de Catalunya. Estudis d'Arts i Humanitats
- Subjects
Teoría de la Metáfora Conceptual ,Teoria de la Metàfora Conceptual ,lingüística de corpus ,Lenguajes y Sistemas Informáticos ,corpus linguistics ,anàlisi del discurs ,salut mental ,análisis del discurso ,Mental health ,discourse analysis ,Conceptual Metaphor Theory ,salud mental - Abstract
El proyecto MOMENT pretende contribuir a mejorar la comprensión del trastorno mental grave a partir del análisis del discurso de los dos grandes colectivos implicados, personas diagnosticadas y profesionales de la salud mental, aplicando como método de análisis la Teoría de la Metáfora Conceptual y la lingüística de corpus. En este marco, se constituirá un corpus anotado manualmente de testimonios en primera persona de ambos colectivos, que a su vez pueda servir como banco de experimentación en detección automática de metáforas. De esta manera, se pretende avanzar tanto en la detección y anotación manual de metáforas, como en la detección computacional. Desde un punto de vista social, el objetivo del proyecto es identificar y sistematizar las concepciones y asunciones dominantes sobre el trastorno mental grave, así como promover el cambio de posibles discursos que nieguen la capacidad agentiva de las personas diagnosticadas. The MOMENT project aims to contribute to a better understanding of severe mental disorders by analyzing the discourse of the two main groups involved, affected people and mental health professionals, in the light of the Conceptual Metaphor Theory and Corpus Linguistics methodology. In this framework, a corpus of first-person accounts from both groups will be designed, built and manually annotated. In turn, the corpus will serve as an experimental bank for automatic detection of metaphors. Therefore, MOMENT aims to improve both manual and automatic metaphor detection and annotation. From a social point of view, the goal of the project is twofold: on the one hand, to detect and systematize dominant conceptualizations and ideas about the disorder; and, on the other hand, to identify and promote the change of potential discourses which deny the agentive capacity of affected people.
- Published
- 2018
10. La terminología jurídica del IATE en catalán
- Author
-
Vàzquez Garcia, Mercè, Oliver González, Antoni, Ubide Ferrer, Georgina, and Universitat Oberta de Catalunya. Estudis d'Arts i Humanitats
- Subjects
Terminologia ,corpus lingüístics ,lcsh:Language and Literature ,processament del llenguatge natural ,text corpora ,Terminología ,Terms and phrases ,linguistics ,procesamiento del lenguaje natural ,traducción ,corpus lingüísticos ,lingüística ,translation ,traducció ,Terminology ,natural language processing ,lcsh:PC1-5498 ,terminology ,lcsh:Romanic languages ,lcsh:P - Abstract
Les institucions europees elaboren una gran diversitat de lleis i documentació que pertanyen a diferents àmbits de coneixement i que són traduïdes a totes les llengües oficials de la Unió Europea. Aquest conjunt de lleis i disposicions constitueix el cabal comunitari (acquis communautaire) i conté el conjunt del dret comunitari vigent. La terminologia que és present en el cabal comunitari es troba recollida en la base de dades terminològica multilingüe IATE (InterActive Terminology for Europe). Actualment les lleis i la documentació que constitueixen el cabal comunitari no estan disponibles en llengua catalana i, en conseqüència, la terminologia corresponent tampoc no forma part de la base de dades terminològica IATE. Per a disposar del recull més ampli possible de terminologia jurídica present en el IATE en llengua catalana aprofitant repertoris terminològics existents, en aquest article presentem un mètode de treball que permet seleccionar la terminologia jurídica present en el IATE i localitzar de manera automàtica els corresponents equivalents de traducció en català. Els resultats obtinguts confirmen que l'aprofitament de recursos terminològics ja disponibles permet completar la base de dades IATE amb les corresponents denominacions en llengua catalana de manera ràpida i eficaç. Amb aquest mètode de treball s'obre la possibilitat de crear nous repertoris terminològics en llengua catalana que serveixin per a completar els diferents àmbits temàtics del IATE i que puguin estar a disposició d'especialistes, traductors, correctors i usuaris de la llengua en general., Europe’s institutions draw up a wide variety of laws and documentation belonging to different fields of knowledge, which are translated into all the official languages of the European Union. This set of laws and provisions constitutes the body of European law (the acquis communautaire) and encompasses all applicable community legislation. The terminology contained in this body of European law is gathered together in the IATE (InterActive Terminology for Europe) multilingual terminology database. As of today, the legislation and other documentation constituting this body of law are not available in Catalan, and so neither does the associated terminology form part of the IATE database. To possess the broadest possible collection of legal terminology present in IATE in Catalan, taking advantage of existing terminological directories, in this article, we present a working method that permits selection of the legal terminology present in IATE and the automatic location of the associated equivalents translated into Catalan. The results obtained confirm that taking advantage of pre-existing terminological resources permits quick and efficient supplementing of the IATE database with the associated terms in Catalan. This approach opens up the possibility of creating new terminological directories in Catalan to complement IATE’s thematic areas and that may be made available to specialists, translators, correctors and language users in general., Las instituciones europeas elaboran una gran diversidad de leyes y documentación que pertenecen a diferentes ámbitos de conocimiento y que son traducidas a todas las lenguas oficiales de la Unión Europea. Este conjunto de leyes y disposiciones constituye el acervo (acquis communautaire) y contiene el conjunto del derecho comunitario vigente. La terminología que está presente en el acervo se encuentra recogida en la base de datos terminológica multilingüe IATE (InterActive Terminology for Europe). Actualmente las leyes y la documentación que constituyen el acervo no están disponibles en lengua catalana y, en consecuencia, la terminología correspondiente tampoco forma parte de la base de datos terminológica IATE. Para disponer de la recopilación más amplia posible de terminología jurídica presente en el IATE en lengua catalana aprovechando repertorios terminológicos existentes, en este artículo presentamos un método de trabajo que permite seleccionar la terminología jurídica presente en el IATE y localizar de manera automática los correspondientes equivalentes de traducción en catalán. Los resultados obtenidos confirman que el aprovechamiento de recursos terminológicos ya disponibles permite completar la base de datos IATE con las correspondientes denominaciones en lengua catalana de manera rápida y eficaz. Con este método de trabajo se abre la posibilidad de crear nuevos repertorios terminológicos en lengua catalana que sirvan para completar los diferentes ámbitos temáticos del IATE y que puedan estar a disposición de especialistas, traductores, correctores y usuarios de la lengua en general.
- Published
- 2018
11. MOMENT: Metáforas del trastorno mental grave. Análisis del discurso de personas afectadas y profesionales de la salud mental
- Author
-
Coll Florit, Marta, Climent Roca, Salvador, Correa-Urquiza, Martín, Hernández, Eulàlia, Oliver González, Antoni, Pié, Asun, Coll Florit, Marta, Climent Roca, Salvador, Correa-Urquiza, Martín, Hernández, Eulàlia, Oliver González, Antoni, and Pié, Asun
- Abstract
El proyecto MOMENT pretende contribuir a mejorar la comprensión del trastorno mental grave a partir del análisis del discurso de los dos grandes colectivos implicados, personas diagnosticadas y profesionales de la salud mental, aplicando como método de análisis la Teoría de la Metáfora Conceptual y la lingüística de corpus. En este marco, se constituirá un corpus anotado manualmente de testimonios en primera persona de ambos colectivos, que a su vez pueda servir como banco de experimentación en detección automática de metáforas. De esta manera, se pretende avanzar tanto en la detección y anotación manual de metáforas, como en la detección computacional. Desde un punto de vista social, el objetivo del proyecto es identificar y sistematizar las concepciones y asunciones dominantes sobre el trastorno mental grave, así como promover el cambio de posibles discursos que nieguen la capacidad agentiva de las personas diagnosticadas., The MOMENT project aims to contribute to a better understanding of severe mental disorders by analyzing the discourse of the two main groups involved, affected people and mental health professionals, in the light of the Conceptual Metaphor Theory and Corpus Linguistics methodology. In this framework, a corpus of first-person accounts from both groups will be designed, built and manually annotated. In turn, the corpus will serve as an experimental bank for automatic detection of metaphors. Therefore, MOMENT aims to improve both manual and automatic metaphor detection and annotation. From a social point of view, the goal of the project is twofold: on the one hand, to detect and systematize dominant conceptualizations and ideas about the disorder; and, on the other hand, to identify and promote the change of potential discourses which deny the agentive capacity of affected people.
- Published
- 2018
12. El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya
- Author
-
Oliver González, Antoni
- Subjects
Terminologia ,corpus paralelo ,procesamiento de lenguajes naturales ,traducció automàtica estadística ,Terminología ,traducción automática estadística ,Terms and phrases ,parallel corpus ,extractores de terminología ,statistical machine translation ,processament de llenguatges naturals ,translation memory ,extractors de terminologia ,corpus paral·lel ,memoria de traducción ,memòria de traducció ,natural language processing ,terminology extraction - Abstract
In this paper the process of compilation of the parallel corpus from the Official Diary of the Catalan Government (DOGC) is presented. It describes the downloading process, the tools and processes for the treatment and linguistic analysis. The final result is a big parallel corpus that is freely available in several formats and with several annotation levels. This corpus is a very valuable resource for different applications. As example, three possible fields of application are described: as a translation memory to be used in a Computer-Assisted Translation tool; for terminology extraction and query and for training statistical machine translation systems. En este trabajo se presenta el proceso de compilación del corpus paralelo del Diario Oficial de la Generalitat de Catalunya (DOGC). Describe el proceso de descarga, las herramientas y los procesos para el tratamiento y el análisis lingüístico. El resultado final es un gran corpus paralelo que está disponible gratuitamente en varios formatos y con varios niveles de anotación. Este corpus es un recurso muy valioso para diferentes aplicaciones. Como ejemplo, se describen tres posibles campos de aplicación: como una memoria de traducción para ser utilizada en una herramienta de traducción asistida por computadora; para la extracción y consulta de terminología y para la formación de sistemas estadísticos de traducción automática. En aquest treball es presenta el procés de compilació del corpus paral·lel del Diari Oficial de la Generalitat de Catalunya (DOGC). Descriu el procés de descàrrega, les eines i els processos per al tractament i l'anàlisi lingüística. El resultat final és un gran corpus paral·lel que està disponible gratuïtament en diversos formats i amb diversos nivells d'anotació. Aquest corpus és un recurs molt valuós per a diferents aplicacions. Com a exemple, es descriuen tres possibles camps d'aplicació: com una memòria de traducció per ser utilitzada en una eina de traducció assistida per computadora; per a l'extracció i consulta de terminologia i per a la formació de sistemes estadístics de traducció automàtica.
- Published
- 2017
13. Morphological Analysis of the Dravidian Language Family
- Author
-
Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural, Kumar, Arun, Cotterell, Ryan, Oliver González, Antoni, Padró, Lluís, Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural, Kumar, Arun, Cotterell, Ryan, Oliver González, Antoni, and Padró, Lluís
- Abstract
The Dravidian family is one of the most widely spoken set of languages in the world, yet there are very few annotated resources available to NLP researchers. To remedy this, we create DravMorph, a corpus annotated for morphological segmentation and part-of-speech. Also, we exploit novel features and higher-order models to achieve promising results on these corpora on both tasks, beating techniques proposed in the literature by as much as 4 points in segmentation F1., Postprint (published version)
- Published
- 2017
14. InLéctor: automatic creation of bilingual e-books to promote reading in a foreign language
- Author
-
Oliver González, Antoni, primary
- Published
- 2017
- Full Text
- View/download PDF
15. TMX: intercambio de memorias de traducción
- Author
-
Oliver González, Antoni
- Subjects
memoria de traducción ,TMX ,Translating and interpreting ,estándar ,eines TAO ,standard ,memòria de traducció ,herramientas TAO ,estàndard ,CAT tools ,Traducción e interpretación ,translation memory ,Traducció i interpretació - Abstract
En este artículo presentamos TMX (Translation Memory eXchange), el formato estándar de intercambio de memorias de traducción. Repasaremos el concepto de memoria de traducción y sus usos, que las convierten en uno de los principales recursos para el traductor. Veremos las estrategias para recuperar de manera rápida los segmentos más similares al que estamos traduciendo y los mecanismos para ordenar los segmentos recuperados según su similitud con el segmento a traducir. Se analizarán los formatos internos de las memorias de traducción en las principales herramientas de traducción asistida y se verá la importancia de disponer de un formato de intercambio que sea estándar, versátil y que permita su evolución para adaptarse a las nuevas necesidades. Presentaremos brevemente las especificaciones del formato TMX y sus diferentes niveles y analizaremos el grado de aceptación de este formato entre las herramientas de traducción asistida. Finalmente presentaremos algunas de las propuestas de futuro para este formato. En aquest article presentem TMX (Translation Memory eXchange), el format estàndard d'intercanvi de memòries de traducció. Repassarem el concepte de memòria de traducció i els seus usos, que les converteixen en un dels principals recursos per al traductor. Veurem les estratègies per recuperar de manera ràpida els segments més similars als que estem traduint i els mecanismes per ordenar els segments recuperats segons la seva similitud amb el segment a traduir. Presentarem breument les especificacions del format TMX i els seus diferents nivells i analitzarem el grau d'acceptació d'aquest format entre les eines de traducció assistida. In this paper the standard format for translation memories interchange (TMX) is presented. We review the concept of translation memory and its uses. We also present strategies for quick access to the most similar segments to the one being translated and the ways to sort the retrieved segments according to similarity. The specifications of the TMX format and its levels will be presented. We analyze the degree of implementation of this format in CAT tools.
- Published
- 2015
16. TMX: Translation memories interchange
- Author
-
Oliver González, Antoni
- Subjects
TMX, translation memory, CAT tools, standard ,TMX, memories de traducció, eines TAO, estàndard ,TMX ,memoria traducción - Abstract
En aquest article presentem TMX (Translation Memory eXchange), el format estàndard d'intercanvi de memòries de traducció. Repassarem el concepte de memòria de traducció i els seus usos, que les converteixen en un dels principals recursos per al traductor. Veurem les estratègies per recuperar de manera ràpida els segments més similars als que estem traduint i els mecanismes per ordenar els segments recuperats segons la seva similitud amb el segment a traduir. Presentarem breument les especificacions del format TMX i els seus diferents nivells i analitzarem el grau d'acceptació d'aquest format entre les eines de traducció assistida., In this paper the standard format for translation memories interchange (TMX) is presented. We review the concept of translation memory and its uses. We also present strategies for quick access to the most similar segments to the one being translated and the ways to sort the retrieved segments according to similarity. The specifications of the TMX format and its levels will be presented. We analyze the degree of implementation of this format in CAT tools, En este artículo presentamos el TMX (Translation Memory eXchange), el formato estándar de intercambio de memorias de traducción. Repasaremos el concepto de memoria de traducción y sus usos que las convierten en uno de los principales recursos para el traductor. Veremos las estrategias para recuperar de manera rápida los segmentos más similares a que estamos traduciendo y los mecanismos para ordenar los segmentos recuperados según su similitud con el segmento a traducir. Se analizarán los formatos internos de las memorias de traducción en las principales herramientas de traducción asistida y se verá la importancia de disponer de un formato de intercambio que sea estándar, versátil y que permita su evolución para adaptarse a las nuevas necesidades.Presentaremos brevemente las especificaciones del formato TMX y sus diferentes niveles y analizaremos el grado de aceptación de este formato entre las herramientas de traducción asistida. Finalmente presentaremos algunas de las propuestas de futuro para este formato.
- Published
- 2015
17. Joint Bayesian Morphology learning of Dravidian Languages
- Author
-
Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural, Kumar, Arun, Padró, Lluís, Oliver González, Antoni, Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural, Kumar, Arun, Padró, Lluís, and Oliver González, Antoni
- Abstract
In this paper a methodology for learning the complex agglutinative morphology of some Indian languages using Adaptor Grammars and morphology rules is presented. Adaptor grammars are a compositional Bayesian framework for grammatical inference, where we define a morphological grammar for agglutinative languages and morphological boundaries are inferred from a plain text corpus. Once morphological segmentations are produce, regular expressions for sandhi rules and orthography are applied to achieve the final segmentation. We test our algorithm in the case of two complex languages from the Dravidian family. The same morphological model and results are evaluated comparing to other state-of-the art unsupervised morphology learning systems, Postprint (published version)
- Published
- 2016
18. Learning agglutinative morphology of indian languages with linguistically motivated adaptor grammars
- Author
-
Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural, Kumar, Arun, Padró, Lluís, Oliver González, Antoni, Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural, Kumar, Arun, Padró, Lluís, and Oliver González, Antoni
- Abstract
In this paper an automatic morphology learning system for complex and agglutinative languages is presented. We process complex agglutinative morphology of Indian languages using Adaptor Grammars and linguistic rules of morphology. Adaptor Grammars are a compositional Bayesian framework for grammatical inference, where we define a morphological boundaries are inferred from a corpora of plain text. Once it produces morphological segmentation, regular expressions for orthography rules are applied to achieve final segmentation. We test our algorithm in the case of three complex languages from the Dravidian family and evaluate the results comparing to other state of the art unsupervised morphology learning systems and show significant improvements in the results., Postprint (published version)
- Published
- 2016
19. Metodología y evaluación de la expansión del WordNet del gallego con WN-Toolkit
- Author
-
Gómez Guinovart, Xavier and Oliver González, Antoni
- Subjects
Terminologia ,Corpus paralelos ,corpus paralelo ,Terminología ,Lexical acquisition ,Terms and phrases ,WordNet ,parallel corpus ,Multilingual resources ,corpus paral·lel ,adquisició d'informació lèxica ,Parallel corpora ,Recursos plurilingües ,Lenguajes y Sistemas Informáticos ,Adquisición de información léxica - Abstract
In this paper the methodology and a detailed evaluation of the results of the expansion of the Galician WordNet using the WN-Toolkit are presented. This toolkit allows the creation and expansion of wordnets using the expand model. In our experiments we have used methodologies based on dictionaries and parallel corpora. The evaluation of the results has been performed both in an automatic and in a manual way, allowing a comparison of the precision values obtained with both evaluation procedures. The manual evaluation provides details about the source of the errors. This information has been very useful for the improvement of the toolkit and for the correction of some errors in the reference WordNet for Galician. En este artículo se presenta la metodología utilizada en la expansión del WordNet del gallego mediante el WN-Toolkit, así como una evaluación detallada de los resultados obtenidos. El conjunto de herramientas incluido en el WN-Toolkit permite la creación o expansión de wordnets siguiendo la estrategia de expansión. En los experimentos presentados en este artículo se han utilizado estrategias basadas en diccionarios y en corpus paralelos. La evaluación de los resultados se ha realizado de manera tanto automática como manual, permitiendo así la comparación de los valores de precisión obtenidos. La evaluación manual también detalla la fuente de los errores, lo que ha sido de utilidad tanto para mejorar el propio WN-Toolkit, como para corregir los errores del WordNet de referencia para el gallego. En aquest article es presenta la metodologia utilitzada en l'expansió del WordNet del gallec mitjançant el WN-Toolkit, així com una avaluació detallada dels resultats obtinguts. El conjunt d'eines inclòs en el WN-Toolkit permet la creació o expansió de wordnets seguint l'estratègia d'expansió. En els experiments presentats en aquest article s'han utilitzat estratègies basades en diccionaris i en corpus paral·lels. L'avaluació dels resultats s'ha realitzat de manera tant automàtica com a manual, permetent així la comparació dels valors de precisió obtinguts. L'avaluació manual també detalla la font dels errors, la qual cosa ha estat d'utilitat tant per millorar el propi WN-Toolkit, com per corregir els errors del WordNet de referència per al gallec.
- Published
- 2014
20. InLéctor: enhanced bilingual e-books for language learning
- Author
-
Oliver González, Antoni, Coll-Florit, Marta, Iribarren i Donadeu, Teresa, Climent Roca, Salvador, and Universitat Oberta de Catalunya (UOC)
- Subjects
alineació de textos ,aprendizaje de lenguas ,Libros electrónicos ,translation ,traducció ,augment de text ,aprenentatge de llengües ,Llibres electrònics ,language learning ,text alignment ,e-books ,aumento de texto ,text augmentation ,alineación de textos ,Electronic books ,traducción - Abstract
The InLéctor project aims to promote reading in original language, offering an interactive scenario which facilitates foreign language teaching and selflearning, as well as the study of literature. In order to achieve this aim, the project develops computational techniques which provide automatically generation of bilingual e-books, incorporating dictionaries, ontologies and audios. Bilingual reading offers the option of moving from the original text to the translated one with a single click. The audio support is based on the human reading of the work in its original language. Moreover, it is planned to incorporate an interactive dictionary service which will show in advance the most difficult words in the text according to the language level of the user. Augmented information will also provide links to encyclopedic entries, images and audio directly related to the fragment of the text being read. The project ensures the creation and distribution of these parallel books in different output formats (html, epub and mobi), which are compatible with the most common tablets and e-books nowadays. The literary works and their translations are published in the public domain. The developed programs are based on free software and will also be published under a free license.
- Published
- 2014
21. Unsupervised learning of agglutinated morphology using nested Pitman-Yor process based morpheme induction algorithm
- Author
-
Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural, Kumar, Arun, Padró, Lluís, Oliver González, Antoni, Universitat Politècnica de Catalunya. Departament de Ciències de la Computació, Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural, Kumar, Arun, Padró, Lluís, and Oliver González, Antoni
- Abstract
In this paper we describe a method to morphologically segment highly agglutinating and inflectional languages from Dravidian family. We use nested Pitman-Yor process to segment long agglutinated words into their basic components, and use a corpus based morpheme induction algorithm to perform morpheme segmentation. We test our method in two languages, Malayalam and Kannada and compare the results with Morfessor, Postprint (author's final draft)
- Published
- 2015
22. Revisión de técnicas para la construcción de WordNets mediante estrategia de expansión
- Author
-
Oliver González, Antoni, Climent Roca, Salvador, and Contreras Figueras, Marta
- Subjects
WordNet ,Lenguajes y Sistemas Informáticos ,Semántica ,Recursos léxicos ,Lexical resources ,Semantics - Abstract
Este artículo ofrece una revisión de métodos para la construcción de WordNets siguiendo la estrategia de expansión, es decir, mediante la traducción de las variantes inglesas del Princeton WordNet. En el proceso de construcción se han utilizado recursos libres disponibles en Internet. El artículo presenta también los resultados de la evaluación de las técnicas en la construcción de los WordNets 3.0 para el castellano y catalán. Estas técnicas se pueden utilizar para la construcción de WordNets para otras lenguas. This paper presents a review of methods for building WordNets following the expand model, that is, by translating the English variants of the Princeton WordNet. Only free resources available online have been used. The paper also presents the evaluation of the techniques applied in the construction of Spanish and Catalan WordNets 3.0. These techniques can be also used for other languages. Este trabajo se ha llevado a cabo dentro del proyecto Know2 Language understanding technologies for multilingual domain-oriented information access (MICINN, TINN2009-14715-C04-04).
- Published
- 2012
23. Ús de la Vikipèdia per al desenvolupament de recursos lingüístics: el WordNet 3.0 català i castellà
- Author
-
Oliver González, Antoni and Climent Roca, Salvador
- Subjects
procesamiento del lenguaje natural ,Linguistic resources ,Recursos lingüísticos ,Viquipèdia ,processament del llenguatge natural ,WordNet ,Recursos lingüístics ,natural language processing ,Wikipedia - Abstract
En aquest article presentem l'estat de la qüestió en l'ús de la Viquipèdia per a tasques relacionades amb el processament del llenguatge natural i tres aplicacions que hem creat per a l'enriquiment d'un recurs lingüístic de gran abast: el WordNet versió 3.0 per al català i castellà. Els investigadors en aquesta àrea fa anys que cerquen vies perquè les aplicacions integrin informació sobre coneixement del món, d'una manera més o menys estructurada, ja que aquest tipus de coneixement ha demostrat ser molt important per a resoldre de manera satisfactòria moltes tasques de processament del llenguatge. La Viquipèdia pot respondre perfectament a aquesta demanda d'informació amb l'avantatge del seu accés lliure i la seva actualització constant. We describe the state of the art in the use of Wikipedia for natural language processing tasks and also describe three applications of our own that enrich a powerful language resource: WordNet version 3.0 in Catalan and Spanish. Researchers have for many years sought applications that would take account of world knowledge in a more or less structured way, as this kind of knowledge has proven to be crucial to satisfactorily solving certain language processing tasks. Wikipedia may be the answer to the provision of this kind of information, as it is constantly updated and access is free. En este artículo presentamos el estado de la cuestión en el uso de la Viquipèdia para tareas relacionadas con el procesamiento del lenguaje natural y tres aplicaciones que hemos creado para el enriquecimiento de un recurso lingüístico de gran alcance: el WordNet versión 3.0 para el catalán y castellano. Los investigadores en esta área hace años que buscan vías porque las aplicaciones integren información sobre conocimiento del mundo, de una manera más o menos estructurada, puesto que este tipo de conocimiento ha demostrado ser muy importante para resolver de manera satisfactoria muchas tareas de procesamiento del lenguaje. La Viquipèdia puede responder perfectamente a esta demanda de información con la ventaja de su acceso libre y su actualización constante.
- Published
- 2012
24. Revisión de técnicas para la construcción de WordNets mediante la estrategia de expansión
- Author
-
Oliver González, Antoni, Climent Roca, Salvador, and Contreras Figueras, Marta
- Subjects
recursos léxicos ,recursos lèxics ,semàntica ,semántica ,Natural language processing (Computer science) ,WordNet ,Tratamiento del lenguaje natural (Informática) ,lexical resources ,Tractament del llenguatge natural (Informàtica) ,semantics - Abstract
Este artículo ofrece una revisión de métodos para la construcción de WordNets siguiendo la estrategia de expansión, es decir, mediante la traducción de las variants inglesas del Princeton WordNet. En el proceso de construcción se han utilizado recursos libres disponibles en Internet. El artículo presenta también los resultados de la evaluación de las técnicas en la construcción de los WordNets 3.0 para el castellano y catalán. Estas técnicas se pueden utilizar para la construcción de WordNets para otras lenguas. This paper presents a review of methods for building WordNets following the expand model, that is, by translating the English variants of the Princeton WordNet. Only free resources available online have been used. The paper also presents the evaluation of the techniques applied in the construction of Spanish and Catalan WordNets 3.0. These techniques can be also used for other languages. Aquest article ofereix una revisió de mètodes per a la construcció de WordNets seguint l'estratègia d'expansió, és a dir, mitjançant la traducció de les variants angleses del Princeton WordNet. En el procés de construcció s'han utilitzat recursos lliures disponibles en Internet. L'article presenta també els resultats de l'avaluació de les tècniques en la construcció dels WordNets 3.0 per al castellà i català. Aquestes tècniques es poden utilitzar per la construcció de WordNets per a altres llengües.
- Published
- 2012
25. Parallel corpora for WordNet construction: machine translation vs. automatic sense tagging
- Author
-
Oliver González, Antoni and Climent Roca, Salvador
- Subjects
ComputingMethodologies_PATTERNRECOGNITION ,InformationSystems_INFORMATIONSTORAGEANDRETRIEVAL ,lexical resources ,parallel corpora ,ComputingMethodologies_ARTIFICIALINTELLIGENCE ,wordnet ,automatic sense tagging ,machine translation - Abstract
In this paper we present a methodology for WordNet construction based on the exploitation of parallel corpora with semantic annotation of the English source text. We are using this methodology for the enlargement of the Spanish and Catalan versions of WordNet 3.0, but the methodology can also be used for other languages. As big parallel corpora with semantic annotation are not usually available, we explore two strategies to overcome this problem: to use monolingual sense tagged corpora and machine translation, on the one hand; and to use parallel corpora and automatic sense tagging on the source text, on the other. With these resources, the problem of acquiring a WordNet from parallel corpora can be seen as a word alignment task. Fortunately, this task is well known, and some aligning algorithms are freely available.
- Published
- 2012
26. A revision of techniques for WordNet construction following the expand model
- Author
-
Oliver González, Antoni, Climent Roca, Salvador, and Contreras Figueras, Marta
- Subjects
WordNet ,Lenguajes y Sistemas Informáticos ,Semántica ,Recursos léxicos ,Lexical resources ,Semantics - Abstract
Este artículo ofrece una revisión de métodos para la construcción de WordNets siguiendo la estrategia de expansión, es decir, mediante la traducción de las variantes inglesas del Princeton WordNet. En el proceso de construcción se han utilizado recursos libres disponibles en Internet. El artículo presenta también los resultados de la evaluación de las técnicas en la construcción de los WordNets 3.0 para el castellano y catalán. Estas técnicas se pueden utilizar para la construcción de WordNets para otras lenguas. This paper presents a review of methods for building WordNets following the expand model, that is, by translating the English variants of the Princeton WordNet. Only free resources available online have been used. The paper also presents the evaluation of the techniques applied in the construction of Spanish and Catalan WordNets 3.0. These techniques can be also used for other languages. Este trabajo se ha llevado a cabo dentro del proyecto Know2 Language understanding technologies for multilingual domain-oriented information access (MICINN, TINN2009-14715-C04-04).
- Published
- 2012
27. WN-Toolkit: un toolkit per a la creació de WordNets a partir de diccionaris bilingües
- Author
-
Oliver González, Antoni
- Subjects
lcsh:Language and Literature ,lcsh:Philology. Linguistics ,lcsh:P1-1091 ,estratègia d'expansió ,WordNet ,estrategia de expansión ,expand model ,lcsh:P - Abstract
En aquest article presentem un conjunt de programes que faciliten la creació de WordNets a partir de diccionaris bilingües mitjançant l'estratègia d'expansió. Els programes estan escrits en Python i són per tant multiplataforma. El seu ús, tot i que no disposen d'una interfície gràfica d'usuari, és molt senzill. Aquests programes s'han fet servir amb èxit en el projecte Know2 per a la creació de les versions 3.0 dels WordNets català i espanyol. Els programes estan publicats sota una llicència GNU-GPL i es poden descarregar lliurement de http://lpg.uoc.edu/wn-toolkit. This paper presents a set of programs to facilitate the creation of WordNet from bilingual dictionaries following the expand model. The programs are written in Python and are therefore multiplatform. The programs are very easy to use although they don't have a graphical user interface. These programs have been successfully used in the Know 2 Project for the creation of Catalan and Spanish WordNet 3.0. The programs are published under the GNU-GPL licence and can be freely downloaded from http://lpg.uoc.edu/wn-toolkit. En este artículo presentamos un conjunto de programas que facilitan la creación de WordNets a partir de diccionarios bilingües mediante la estrategia de expansión. Los programas están escritos en Python y son por lo tanto multiplataforma. Su uso, a pesar de que no disponen de una interfaz gráfica de usuario, es muy sencillo. Estos programas se han usado con éxito en el proyecto Know2 para la creación de las versiones 3.0 de los WordNets catalán y español. Los programas están publicados bajo una licencia GNU-GPL y se pueden descargar libremente de http://lpg.uoc.edu/wn-toolkit.
- Published
- 2012
28. InLéctor: a system for bilingual interactive reading
- Author
-
Oliver González, Antoni, Coll Florit, Marta, and Climent Roca, Salvador
- Subjects
Libro electrónico ,Lenguajes y Sistemas Informáticos ,Language learning ,Aprendizaje de lenguas ,Electronic book - Abstract
Este proyecto pretende desarrollar un sistema que genere libros bilingües, con audio e interactivos. El sistema ofrecerá diversos formatos de salida que permitan leer y escuchar los libros en diferentes dispositivos, como libros electrónicos, tabletas y ordenadores. Asimismo, ofrecerá la posibilidad de obtener libros paralelos impresos. The aim of this project is the development of a system for the generation of interactive bilingual electronic books with audio support. The system will offer several output formats for reading and listening the books on different devices such as electronic books, tablets and computers. It will also allow printing a parallel bilingual book. Este trabajo se ha llevado a cabo dentro del proyecto Know2 Language understanding technologies for multilingual domain-oriented information access (MICINN, TINN2009-14715-C04-04).
- Published
- 2012
29. AVI.cat: a virtual assistant for the improvement of writing skills in Catalan
- Author
-
Oliver González, Antoni, Climent Roca, Salvador, and Coll-Florit, Marta
- Subjects
Catalan language ,correcció gramatical ,Natural language processing (Computer science) ,Lenguajes y Sistemas Informáticos ,lengua catalana ,Tratamiento del lenguaje natural (Informática) ,Grammar checking ,Corrección gramatical ,llengua catalana ,Tractament del llenguatge natural (Informàtica) - Abstract
En esta demostración presentamos un primer prototipo de asistente para la mejora de la redacción en catalán. El sistema va más allá de un simple corrector gramatical, ya que propone enlaces a gramáticas y ejercicios que permiten al usuario practicar los aspectos donde presenta más carencias. El sistema funciona también como evaluador de nivel y permite realizar un seguimiento de las mejoras del usuario. In this demo we present a first prototype of an assistant for the improvement of writing skills in Catalan. The system is more than a grammatical checker as it proposes links to grammatical explanations and exercises, allowing the user to practice specific aspects. The program also works as a level evaluator and allows to track the user¿s improvements. En aquesta demostració presentem un primer prototip d'assistent per a la millora de la redacció en català. El sistema va més enllà d'un simple corrector gramatical, ja que proposa enllaços a gramàtiques i exercicis que permeten a l'usuari practicar els aspectes on presenta més manques. El sistema funciona també com a avaluador de nivell i permet realitzar un seguiment de les millores de l'usuari.
- Published
- 2011
30. Construcción de los WordNets 3.0 para castellano y catalán mediante traducción automática de corpus anotados semánticamente
- Author
-
Oliver González, Antoni and Climent Roca, Salvador
- Subjects
recursos lingüísticos ,traducción automática ,WordNet - Abstract
Este artículo describe una metodología de construcción de WordNets que se basa en la traducción automática de un corpus en inglés desambiguado por sentidos. El corpus que utilizamos está formado por las propias glosas de WN 3.0 etiquetadas semánticamente y por el corpus Semcor. Los resultados de precisión son comparables a los obtenidos mediante métodos basados en diccionarios bilingües para las mismas lenguas. La metodología descrita se está utilizando, en combinación con otras estrategias, en la creación de los WordNets 3.0 del español y catalán. This paper describes a methodology for the construction of WordNets based on machine translation of an English sense tagged corpus. We use the Semcor corpus and the WordNet 3.0 sense tagged glosses as a corpus. Precision results are comparable to those obtained by methods based on bilingual dictionaries for the same languages. This methodology is being used for the construction of the Spanish and Catalan WordNets 3.0 in combination with other strategies.
- Published
- 2011
31. TMX: Translation memories interchange
- Author
-
Oliver González, Antoni, primary
- Published
- 2015
- Full Text
- View/download PDF
32. Methodology and evaluation of the Galician WordNet expansion with the WN-Toolkit
- Author
-
Gómez Guinovart, Xavier, Oliver González, Antoni, Gómez Guinovart, Xavier, and Oliver González, Antoni
- Abstract
In this paper the methodology and a detailed evaluation of the results of the expansion of the Galician WordNet using the WN-Toolkit are presented. This toolkit allows the creation and expansion of wordnets using the expand model. In our experiments we have used methodologies based on dictionaries and parallel corpora. The evaluation of the results has been performed both in an automatic and in a manual way, allowing a comparison of the precision values obtained with both evaluation procedures. The manual evaluation provides details about the source of the errors. This information has been very useful for the improvement of the toolkit and for the correction of some errors in the reference WordNet for Galician., En este artículo se presenta la metodología utilizada en la expansión del WordNet del gallego mediante el WN-Toolkit, así como una evaluación detallada de los resultados obtenidos. El conjunto de herramientas incluido en el WN-Toolkit permite la creación o expansión de wordnets siguiendo la estrategia de expansión. En los experimentos presentados en este artículo se han utilizado estrategias basadas en diccionarios y en corpus paralelos. La evaluación de los resultados se ha realizado de manera tanto automática como manual, permitiendo así la comparación de los valores de precisión obtenidos. La evaluación manual también detalla la fuente de los errores, lo que ha sido de utilidad tanto para mejorar el propio WN-Toolkit, como para corregir los errores del WordNet de referencia para el gallego.
- Published
- 2014
33. Com es treballa en una aula virtual multilingüe? Un entorn d'aprenentatge multilingüe amb Moodle i Apertium
- Author
-
Oliver González, Antoni and Borrell Condom, Cristina
- Subjects
traductor automático ,multilingüe ,Web-based instruction ,Enseñanza virtual ,Ensenyament virtual ,open source software ,machine translator ,Moodle ,entorno ,multilingual ,entorn ,traductor automàtic ,environment ,programari lliure ,Apertium ,software libre - Abstract
La UOC, en el marc de la càtedra de multilingüisme UOC-Linguamón, ha desenvolupat un entorn virtual d'aprenentatge amb un sistema de traducció automàtica integrat. Gràcies a aquest projecte, que funciona amb les aplicacions de programari lliure Moodle i Apertium, es pot disposar d'un entorn d'aprenentatge multilingüe en català, castellà, anglès i francès. Aquest entorn s'alliberarà amb una llicència de programari lliure. El traductor inclou un detector de llengua i un mòdul de preedició que corregeix els missatges entrants sense cap mena d'intervenció de l'usuari. Això ajuda a millorar la qualitat de les traduccions resultants. Tot el sistema s'ha adaptat a la tipologia textual dels missatges electrònics amb un estudi previ dels missatges dels fòrums de la UOC. The UOC, within the framework of the Linguamón-UOC Chair in Multilingualism, has developed a virtual learning environment with an integrated machine translation system. Thanks to this project, which works with free software applications Moodle and Apertium, a multilingual learning environment can be provided in Catalan, English, French and Spanish. This environment is to be released under a free software licence. The translator includes a language detector and a pre-editing module that corrects incoming messages, without requiring any intervention from the user. This helps improve the quality of the resulting translations. The whole system has been adapted to the type of text seen in email messages following the prior study of the messages seen on the UOC's forums. La UOC, en el marco de la cátedra de multilingüismo UOC-Linguamón, ha desarrollado un entorno virtual de aprendizaje con un sistema de traducción automática integrado. Gracias a este proyecto, que funciona con las aplicaciones de software libre Moodle y Apertium, puede disponerse de un entorno de aprendizaje multilingüe en catalán, castellano, inglés y francés. Este entorno se liberará bajo una licencia de software libre. El traductor incluye un detector de lengua y un módulo de preedición que corrige los mensajes entrantes sin ningún tipo de intervención por parte del usuario. Eso ayuda a mejorar la calidad de las traducciones resultantes. Todo el sistema se ha adaptado a la tipología textual de los mensajes electrónicos con un estudio previo de los mensajes de los foros de la UOC.
- Published
- 2008
34. Análisis de los fenómenos lingüísticos de los mensajes de correo electrónico en catalán desde la perspectiva de la traducción automática
- Author
-
Oliver González, Antoni, Climent Roca, Salvador, Moré López, Joaquim, and Taulé Delor, Mariona
- Subjects
causas de errores de traducción ,traducció automàtica ,causes d'errors de traducció ,traducción automática ,mensajes de correo electrónico ,translation errors ,missatges de correu electrònic ,Machine translating ,emails ,machine translation - Abstract
Los sistemas de traducción automática están preparados para traducir textos que son normativamente correctos. Sin embargo, en la traducción automática de mensajes de correo electrónico hay elementos ajenos a la norma que provocan errores de traducción y es necesario conocerlos si se quiere optimizar un entorno de traducción automática de mensajes de correo electrónico, como el que se diseñó para el proyecto Interlingua desarrollado por la UOC. Una tarea importante de dicho proyecto fue el análisis de los fenómenos lingüísticos no normativos de un corpus de mensajes electrónicos escritos en catalán y su impacto en la calidad de traducción al español. En este artículo presentamos este análisis. Curiosamente los errores de competencia de los emisores causan más errores de traducción que los fenómenos característicos de la comunicación por correo electrónico, como los errores de teclado, vocabulario sms, emoticonos, etc. Emails contain linguistic phenomena that deviate from standard language norms and may cause machine translation errors. In order to design an email translation environment for the Interlingua project developed at UOC, we classified deviations from the standard in a corpus of emails in Catalan and analysed their impact on the machine translation quality in Spanish. Here we present this analysis. Curiously, most translation errors are caused by the lack of linguistic competence of the sender. The impact of characteristic email phenomena (smileys, performance errors, sms vocabulary, etc.) is not so strong. Els sistemes de traducció automàtica estan preparats per traduir textos que són normativament correctes. No obstant això, en la traducció automàtica de missatges de correu electrònic hi ha elements aliens a la norma que provoquen errors de traducció i és necessari conèixer-los si es vol optimitzar un entorn de traducció automàtica de missatges de correu electrònic, com el qual es va dissenyar per al projecte Interlingua desenvolupat per la UOC. Una tasca important d'aquest projecte va ser l'anàlisi dels fenòmens lingüístics no normatius d'un corpus de missatges electrònics escrits en català i el seu impacte en la qualitat de traducció a l'espanyol. En aquest article presentem aquesta anàlisi. Curiosament els errors de competència dels emissors causen més errors de traducció que els fenòmens característics de la comunicació per correu electrònic, com els errors de teclat, vocabulari sms, emoticones, etc.
- Published
- 2005
35. Traducción automática estadística basada en n-gramas
- Author
-
Oliver González, Antoni, Badia Cardús, Toni, Boleda Torrent, Gemma, and Melero Nogués, María Teresa
- Subjects
corpus paral·lel ,corpus paralelo ,traducció automàtica estadística ,traducción automática estadística ,Traducció automàtica ,Traducción automática ,parallel text ,statistical machine translation ,N-gram model ,N-gramas ,Machine translating - Abstract
En este artículo presentamos un sistema experimental de traducción automática de tipo estadístico basado en n-gramas. El sistema utiliza un corpus paralelo y fue concebido inicialmente como una extensió de un sistema de Traducción Asistida (TAO). Los buenos resultados obtenidos para el par de lenguas catalán-castellano nos han impulsado a explorar su utilización como sistema de traducción automática, comparándolo con una memoria de traducción comercial y con un sistema de traducción automática convencional. In this paper we present an experimental statistical machine translation system based on n-grams extracted from a parallel corpus. The system was conceived as an extension of a CAT system. However, its good performance in the language pair Catalan-Spanish has driven us to explore its use as a machine translation system. En aquest article presentem un sistema experimental de traducció automàtica de tipus estadístic basat en n-gramas. El sistema utilitza un corpus paral·lel i va ser concebut inicialment com una extensió d'un sistema de Traducció Assistida (TAO). Els bons resultats obtinguts per al parell de llengües català-castellà ens han impulsat a explorar la seva utilització com a sistema de traducció automàtica, comparant-ho amb una memòria de traducció comercial i amb un sistema de traducció automàtica convencional.
- Published
- 2005
36. El proyecto METIS-II
- Author
-
Oliver González, Antoni, Boleda Torrent, Gemma, Melero Nogués, Maite, and Badia Cardús, Toni
- Subjects
corpus paral·lel ,corpus paralelo ,traducció automàtica estadística ,Statistical machine translation ,Traducció automàtica ,parallel corpus ,Traducción automática ,Machine translating ,Traducción automática estadística - Abstract
Presentamos el proyecto METIS-II, dirigido a la creación de un sistema de traducción automático estadístico que utiliza como recursos principales un corpus monolingüe (de la lengua destino) y un diccionario bilingüe, eliminando la necesidad de disponer de un corpus paralelo para entrenar el sistema. We present the METIS-II project, aimed at creating a Statistical Machine Translation system which uses only a monolingual corpus of the target language and a bilingual dictionary, thus eliminating the need for parallel corpora to train the system. Presentem el projecte METIS-II, dirigit a la creació d'un sistema de traducció automàtic estadístic que utilitza com a recursos principals un corpus monolingüe (de la llengua destino) i un diccionari bilingüe, eliminant la necessitat de disposar d'un corpus paral·lel per entrenar el sistema.
- Published
- 2005
37. Tecnologies de la traducció per a la gestió de la doble oferta docent en català i castellà a la UOC
- Author
-
Climent Roca, Salvador, Moré López, Joaquim, Oliver González, Antoni, Salvatierra Mallarach, Míriam, Sánchez Sáiz, Imma, Vàzquez Garcia, Mercè, and Universitat Oberta de Catalunya (UOC)
- Subjects
castellà ,catalán ,translation technologies ,tecnologías de la traducción ,Traducció automàtica ,Traducción automática ,Spanish ,català ,castellano ,Machine translating ,tecnologies de la traducció ,Catalan - Abstract
La Universitat Oberta de Catalunya (UOC) és una universitat plenament virtual que actualment, deu anys després de ser fundada, l'any 1994, ofereix un total de 17 titulacions homologades en català. L'any 2000 la UOC va començar a fer docència universitària també en castellà, amb la inauguració del campus iberoamericà, el qual aplega actualment uns cinc mil estudiants distribuïts en 14 titulacions i unes 400 aules i assignatures.
- Published
- 2005
38. Adquisició d'informació lèxica i morfosintàctica a partir de corpus sense anotar: aplicació al rus i al croat
- Author
-
Oliver González, Antoni and Universitat Oberta de Catalunya (UOC)
- Subjects
adquisición léxica ,lexical acquisition ,adquisició lèxica ,Natural language processing (Computer science) ,filología eslava ,Slavonic philology ,filologia eslava ,Tratamiento del lenguaje natural (Informática) ,Tractament del llenguatge natural (Informàtica) ,computational morphology ,morfología computacional ,morfologia computacional - Abstract
Tesis doctoral en Lingüística realizada por Antoni Oliver González bajo la dirección de la doctora Irene Castellón Masalles (U. de Barcelona) y del doctor Lluís Márquez Villodre (U. Politécnica de Catalunya). El acto de defensa de la tesis tuvo lugar el 27 de julio de 2004 ante el tribunal formado por los doctores Horacio Rodríguez Hontoria (U. Politécnica de Catalunya), Joan Castellví Vives (U. de Barcelona), Iñaki Alegría Loinaz (U. País Vasco), Toni Badia Cardús (U. Pompeu Fabra) y Ana María Fernández Montraveta (U. Autónoma de Barcelona). La calificación obtenida fue Sobresaliente Cum Laude por unanimidad. PhD Thesis in Linguistics written by Antoni Oliver González uinder the sypervision of Dr. Irene Castellón Masalles (U. de Barcelona) and Dr. Lluís Márquez Villodre (U. Politécnica de Catalunya). The author was examined in July 27th, 2004 by the commitee formed by Dr. Horacio Rodríguez Hontoria (U. Politécnica de Catalunya), Dr. Joan Castellví Vives (U. de Barcelona), Dr. Iñaki Alegría Loinaz (U. País Vasco), Dr. Toni Badia Cardús (U. Pompeu Fabra) y Dr. Ana María Fernández Montraveta (U. Autónoma de Barcelona). The grade obtained was Sobresaliente Cum Laude. Tesi doctoral en Lingüística realitzada per Antoni Oliver González sota la direcció de la doctora Irene Castelló Masalles (UB) i del doctor Lluís Márquez Villodre (UPC). L'acte de defensa de la tesi va tenir lloc el 27 de juliol de 2004 davant el tribunal format pels doctors Horaci Rodríguez Hontoria (UPC), Joan Castellví Vives (UB), Iñaki Alegria Loinaz (UPV/EHU), Toni Badia Cardús (UPF) i Ana María Fernández Montraveta (UAB). La qualificació obtinguda va ser Excel·lent Cum Laude per unanimitat.
- Published
- 2005
39. Qualitat i traducció
- Author
-
Oliver González, Antoni and Universitat Oberta de Catalunya (UOC)
- Subjects
calidad ,translation assessment ,translation ,traducció ,errors en la traducció ,translation errors ,Traducciones ,qualitat ,Traduccions ,evaluación de la traducción ,quality ,Translations ,avaluació de la traducció ,errores en la traducción ,traducción - Abstract
En aquest article es presenten una sèrie de conceptes bàsics sobre qualitat aplicats a la traducció. Per assolir uns bons nivells de qualitat a les nostres traduccions haurem de tenir la màxima cura del procés, cosa que implica dissenyar uns fluxos de treball clars i fer servir les eines adequades, i haurem d'aplicar estratègies encertades de control i de garantia de qualitat. Així, doncs, aquest primer article se cenyeix als aspectes teòrics i generals del control de qualitat de les traduccions i no entra a definir encara què es considera error, quina tipologia específica d'errors ens podem trobar en una traducció i quin valor o quina gravetat tenen. Dit d'una altra manera, cal definir si tenen la mateixa consideració els errors que afecten les convencions gràfiques (abreviacions, majúscules, etc.) que els errors de sintaxi, o bé si una imprecisió terminològica té el mateix valor que un contrasentit, per exemple.
- Published
- 2004
40. Uso de Internet para aumentar la cobertura de un sistema de adquisición léxica del ruso
- Author
-
Oliver González, Antoni, Castellón Masalles, Irene, and Màrquez Villodre, Lluís
- Subjects
Filología eslava ,Lexical acquisition ,Slavonic philology ,Lengua rusa ,Russian language ,Adquisición léxica ,Computational morphology ,Morfología computacional - Abstract
En este artíiculo presentamos una metodología para la adquisición de recursos léxicos a partir de corpus sin anotar. Esta metodología está demostrando ser de una gran eficacia para lenguas que, como el ruso, presentan una morfología rica y de tipo predominantemente concatenativa. La metodología puede aplicarse tanto a la creación de nuevos recursos léxicos como en la ampliación de recursos léxicos ya existentes. Presentamos asimismo una extensión de la metodología que realiza consultas automáticas a Internet para adquirir aquellas entradas para las cuales no existe suficiente información en nuestro corpus. This paper present a methodology for the automatic acquisition of lexical resources from raw corpora. This methodology has proved to be efficient for those languages that, like Russian, present a rich and mainly concatenative morphology. This method can be applied in the creation of new resources, as well as in the enrichment of existing resources. We also present an extension of the system that uses automatic querying to Internet to acquire those entries for which we have not enough information in our corpus. Esta investigación se ha llevado a cabo con el apoyo de los proyectos INTERLINGUA (Universitat Oberta de Catalunya e IN3-IR266) y HERMES (TIC2000-0335-C03-02).
- Published
- 2003
41. Uso de Internet para aumentar la cobertura de un sistema de adquisición léxica para el ruso
- Author
-
Oliver González, Antoni, Castellón Masalles, Irene, Màrquez Villodre, Lluís, Universitat Oberta de Catalunya. Internet Interdisciplinary Institute (IN3), Universitat de Barcelona, and Universitat Politècnica de Catalunya
- Subjects
adquisición léxica ,Slavonic philology ,filologia eslava ,rús ,Russian ,Computational linguistics ,morfología computacional ,ruso ,lexical acquisition ,adquisició lèxica ,filología eslava ,Lingüística computacional ,computational morphology ,morfologia computacional - Abstract
En este artículo presentamos una metodología para la adquisición de recursos léxicos a partir de corpus sin anotar. Esta metodología está demostrando ser de una gran eficacia para lenguas que, como el ruso, presentan una morfología rica y de tipo predominantemente concatenativa. La metodología puede aplicarse tanto a la creación de nuevos recursos léxicos como en la ampliación de recursos léxicos ya existentes. Presentamos asimismo una extensión de la metodología que realiza consultas automáticas a Internet para adquirir aquellas entradas para las cuales no existe suficiente información en nuestro corpus. This paper presents a methodology for the automatic acquisition of lexical resources from raw corpora. This methodology has proved to be efficient for those languages that, like Russian, present a rich and mainly concatenative morphology. This method can be applied in the creation of new resources, as well as in the enrichment of existing resources. We also present an extension of the system that uses automatic querying to Internet to acquire those entries for which we have not enough information in our corpus.
- Published
- 2003
42. Adquisición automática de información léxica y morfosintáctica a partir de corpus sin anotar: aplicación al serbocroata y ruso
- Author
-
Oliver González, Antoni, Castellón Masalles, Irene, and Màrquez Villodre, Lluís
- Subjects
llengües eslaves ,Computacional morphology ,Natural language processing (Computer science) ,lenguas eslavas ,Slavonic languages ,Tratamiento del lenguaje natural (Informática) ,análisis morfológico ,morphological analysis ,anàlisi morfològica ,Tractament del llenguatge natural (Informàtica) ,computational morphology ,morfología computacional ,morfologia computacional - Abstract
En este artículo presentamos una metodología para la adquisición automática de información léxica y morfosintáctica a partir de corpus sin anotar. El sistema utiliza información sobre la morfología flexiva de la lengua a tratar, así como información léxica y morfosintáctica de las palabras pertenecientes a clases no flexivas y de las palabras cuya flexión no corresponde a paradigmas regulares. Se trata de un sistema en desarrollo por lo que las evaluaciones que incluímos son preliminares. This paper presents a methodology for the automatic acquisition of lexical and morpho-syntactic information from raw corpora. The system uses information about the inflectional morohology of the language and lexical and morho-syntactic information of the words belonging to non-inflectional categories and of the words not belonging to regular paradigms. En aquest article presentem una metodologia per a l'adquisició automàtica d'informació lèxica i morfosintàctica a partir de corpus sense anotar. El sistema utilitza informació sobre la morfologia flexiva de la llengua a tractar, així com informació lèxica i morfosintàctica de les paraules pertanyents a classes no flexives i de les paraules la flexió de les quals no correspon a paradigmes regulars. Es tracta d'un sistema en desenvolupament pel que les avaluacions que incloem són preliminars.
- Published
- 2002
43. InLéctor: sistema de lectura bilingüe interactiva
- Author
-
Oliver González, Antoni, Coll Florit, Marta, Climent Roca, Salvador, Oliver González, Antoni, Coll Florit, Marta, and Climent Roca, Salvador
- Abstract
Este proyecto pretende desarrollar un sistema que genere libros bilingües, con audio e interactivos. El sistema ofrecerá diversos formatos de salida que permitan leer y escuchar los libros en diferentes dispositivos, como libros electrónicos, tabletas y ordenadores. Asimismo, ofrecerá la posibilidad de obtener libros paralelos impresos., The aim of this project is the development of a system for the generation of interactive bilingual electronic books with audio support. The system will offer several output formats for reading and listening the books on different devices such as electronic books, tablets and computers. It will also allow printing a parallel bilingual book.
- Published
- 2012
44. AVI.cat: asistente virtual para la mejora de la redacción en catalán
- Author
-
Oliver González, Antoni, Climent Roca, Salvador, Coll Florit, Marta, Oliver González, Antoni, Climent Roca, Salvador, and Coll Florit, Marta
- Abstract
En esta demostración presentamos un primer prototipo de asistente para la mejora de la redacción en catalán. El sistema va más allá de un simple corrector gramatical, ya que propone enlaces a gramáticas y ejercicios que permiten al usuario practicar los aspectos donde presenta más carencias. El sistema funciona también como evaluador de nivel y permite realizar un seguimiento de las mejoras del usuario., In this demo we present a first prototype of an assistant for the improvement of writing skills in Catalan. The system is more than a grammatical checker as it proposes links to grammatical explanations and exercises, allowing the user to practice specific aspects. The program also works as a level evaluator and allows to track the user’s improvements.
- Published
- 2011
45. ¿Cómo se trabaja en un aula virtual multilingüe? Un entorno de aprendizaje con Moodle y Apertium
- Author
-
Oliver González, Antoni, Borrell, Cristina, Oliver González, Antoni, and Borrell, Cristina
- Published
- 2008
46. La traducció automàtica a internet
- Author
-
Oliver González, Antoni and Oliver González, Antoni
- Abstract
A Internet es poden trobar molts productes i serveis de traducció automàtica. En aquest article presentarem una classificació funcional d’aquests productes i serveis, posant un especial èmfasi en aquells que puguin ser més útils per a un traductor professional. No presentarem una guia exhaustiva de productes o serveis de traducció automàtica sinó únicament anomenarem alguns dels que ens puguin servir com a exemples de les idees exposades. També s'analitzarà la manera d'incorporar les eines de traducció automàtica existents a Internet en el flux de treball d'un traductor professional., There are many machine translation products and services to be found on the internet. This article presents a functional classification of such products and services, placing particular emphasis on those that a professional translator may find more useful. The classification does not constitute an exhaustive guide to machine translation products and services; it simply identifies some of those that may serve as examples of the ideas discussed. The article also analyses the way in which the machine translation tools currently available on the internet are incorporated into the workflow of a professional translator., En Internet pueden encontrarse muchos productos y servicios de traducción automática. En este artículo presentaremos una clasificación funcional de estos productos y servicios, poniendo especial énfasis en aquellos que puedan ser más útiles para un traductor profesional. No presentaremos una guía exhaustiva de productos o servicios de traducción automática si no que únicamente nombraremos algunos de los que nos puedan servir como ejemplos de las ideas expuestas. También se analizará la manera de incorporar las herramientas de traducción automática existentes en Internet en el flujo de trabajo de un traductor profesional.
- Published
- 2006
47. El proyecto METIS-II
- Author
-
Badia Cardús, Toni, Boleda Torrent, Gemma, Melero Nogués, María Teresa, Oliver González, Antoni, Badia Cardús, Toni, Boleda Torrent, Gemma, Melero Nogués, María Teresa, and Oliver González, Antoni
- Abstract
Presentamos el proyecto METIS-II, dirigido a la creación de un sistema de traducción automático estadístico que utiliza como recursos principales un corpus monolingüe (de la lengua destino) y un diccionario bilingüe, eliminando la necesidad de disponer de un corpus paralelo para entrenar el sistema., We present the METIS-II project, aimed at creating a Statistical Machine Translation system which uses only a monolingual corpus of the target language and a bilingual dictionary, thus eliminating the need for parallel corpora to train the system.
- Published
- 2005
48. Análisis de los fenómenos lingüísticos de los mensajes de correo electrónico en catalán desde la perspectiva de la traducción automática
- Author
-
Moré López, Joaquim, Climent Roca, Salvador, Oliver González, Antoni, Taulé Delor, Mariona, Moré López, Joaquim, Climent Roca, Salvador, Oliver González, Antoni, and Taulé Delor, Mariona
- Abstract
Los sistemas de traducción automática están preparados para traducir textos que son normativamente correctos. Sin embargo, en la traducción automática de mensajes de correo electrónico hay elementos ajenos a la norma que provocan errores de traducción y es necesario conocerlos si se quiere optimizar un entorno de traducción automática de mensajes de correo electrónico, como el que se diseñó para el proyecto Interlingua desarrollado por la UOC. Una tarea importante de dicho proyecto fue el análisis de los fenómenos lingüísticos no normativos de un corpus de mensajes electrónicos escritos en catalán y su impacto en la calidad de traducción al español. En este artículo presentamos este análisis. Curiosamente los errores de competencia de los emisores causan más errores de traducción que los fenómenos característicos de la comunicación por correo electrónico, como los errores de teclado, vocabulario sms, emoticonos, etc., Emails contain linguistic phenomena that deviate from standard language norms and may cause machine translation errors. In order to design an email translation environment for the Interlingua project developed at UOC, we classified deviations from the standard in a corpus of emails in Catalan and analysed their impact on the machine translation quality in Spanish. Here we present this analysis. Curiously, most translation errors are caused by the lack of linguistic competence of the sender. The impact of characteristic email phenomena (smileys, performance errors, sms vocabulary, etc.) is not so strong.
- Published
- 2005
49. Adquisición automática de información léxica y morfosintáctica a partir de corpus sin anotar : aplicación al serbo-croata y ruso
- Author
-
Oliver González, Antoni, Castellón Masalles, Irene, Màrquez Villodre, Lluís, Oliver González, Antoni, Castellón Masalles, Irene, and Màrquez Villodre, Lluís
- Abstract
En este artículo presentamos una metodología para la adquisición automática de información léxica y morfosintáctica a partir de corpus sin anotar. El sistema utiliza información léxica y morfosintáctica a partir de corpus sin anotar. El sistema utiliza información sobre la morfología flexiva de la lengua a tratar, así como información léxica y morfosintáctica de las palabras pertenecientes a clases no flexivas y de las palabras cuya flexión no responde a paradigmas regulares. Se trata de un sistema en desarrollo por lo que las evaluaciones que incluimos son preliminares., This paper presents a methodology for the automatic acquisition of lexical and morpho-syntactic information from raw corpora. The system uses information about the inflectional morphology of the language and lexical and morpho-syntactic information of the words belonging to non-inflectional categories and of the words not belonging to regular paradigms.
- Published
- 2002
50. Les tecnologies de la traducció
- Author
-
Oliver González, Antoni, Climent Roca, Salvador Moré López, Joaquim, Oliver González, Antoni, Oliver González, Antoni, Climent Roca, Salvador Moré López, Joaquim, and Oliver González, Antoni
- Abstract
La traducció ja no és una pràctica artesanal. Aquest llibre ens introdueix de forma clara i completa en el món de la traducció automàtica i semiautomàtica, amb èmfasi especial en programes i recursos lliures i gratuïts.
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.