20 results on '"Lenguaje de programación R"'
Search Results
2. Statistical model for analizing negative variables with application to compression test on concrete.
- Author
-
URREA MONTOYA, AMYLKAR, HERNÁNDEZ BARAJAS, FREDDY, PATIÑO RODRÍGUEZ, CARMEN, and MANCO, OLGA USUGA
- Subjects
- *
STATISTICAL models , *MONTE Carlo method , *RANDOM variables , *PERCENTILES , *DATA compression , *WEIBULL distribution , *CONCRETE testing , *BAYES' estimation - Abstract
In some areas of knowledge, we can find phenomena represented by negative variables (ℝ# ) ; having a statistical model is crucial to describe the phenomenon and explain it using other variables. This paper proposes a regression model to analyze negative random variables using the reflected Weibull distribution. This paper reports the RelDists package created in the R programming language to implement the proposed model. A Monte Carlo simulation study was conducted to explore the performance of the estimation procedure. The simulation study encompasses two cases: without covariates and with covariables. In the first case, we only have the response variable to estimate the distribution parameters. In the second case, we have the response variable and two explanatory variables to estimate the model parameters. Additionally, censored and uncensored data were considered in the simulation study. From the simulation study, we found that the estimation procedure achieves accurate estimations of the parameters as the sample size increases and the percentage of censoring decreases. In the paper, we present an application of the proposed model using experimental data from a compression test with concrete specimens. In the application, a model was fitted to explain the shrinkage strain using the variable time. The regression model for negative variables and the RelDists package can be used by academic, scientific, and business communities to perform reliability analysis. [ABSTRACT FROM AUTHOR]
- Published
- 2022
- Full Text
- View/download PDF
3. Desarrollo de herramientas para el manejo de inventarios de manera fácil e intuitiva
- Author
-
Roa Melo, Juan Felipe
- Subjects
Control de inventarios ,Lenguaje de programación R ,Ingeniería ,Manejo de inventarios - Abstract
La intención de este proyecto de grado es el desarrollo de un paquete de inventarios en el lenguaje de pro-gramación R (InvControl). Este paquete viene acompañado de un texto guía ("Inventory Control: Principles and Practice") que explica la teoría cada uno de los modelos de control de inventarios desarrollados, así mismo, muestra cómo se deben utilizar las funciones, los parámetros requeridos y ejemplos para que el uso del paquete InvControl sea de una manera fácil e intuitiva. The intention of this master¿s project is the development of an inventory package in the R programming language (InvControl). This package is complemented by a text guidebook that explains the theory for each inventory control model developed, as well as showing how to use the functions, the required parameters, and examples so that the use of the InvControl package is easy and intuitive. Magíster en Ingeniería Industrial Maestría
- Published
- 2021
4. Aplicación del software estadístico R para evaluar el aprendizaje de conceptos vectoriales en estudiantes de nivel Medio Superior.
- Author
-
Sánchez-Sánchez, Rubén, Becerra-Rodríguez, Diego Fernando, and Mora, César
- Abstract
Copyright of Latin-American Journal of Physics Education is the property of Latin-American Physics Education Network and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2014
5. Caracterización de los municipios de Castilla y León atendiendo a factores demográficos
- Author
-
Cardona Arévalo, Álvaro, Tapia García, Jesús Alberto, Rodríguez Rodríguez, Jesús María, Cardona Arévalo, Álvaro, Tapia García, Jesús Alberto, and Rodríguez Rodríguez, Jesús María
- Abstract
En este trabajo de fin de grado se va a realizar una clasificación de los municipios de Castilla y León en función de factores demográficos. Se emplearán datos obtenidos a partir del módulo de datos básicos del Sistema de Información Estadística de la Junta de Castilla y León del año 2018. La clasificación obtenida va a permitir describir características comunes de los municipios. Para ello, se aplicarán diversas técnicas multivariantes gracias al lenguaje de programación R., The present dissertation includes a classification of the municipalities of “Castilla y León” according to demographic factors. It will be used the data obtained from the basic data module of the Statistical Information System of the ”Junta de Castilla y León”for the year 2018. The classification obtained will make it possible to describe common characteristics of the municipalities. For this purpose, it will be applied several multivariate techniques thanks to the programming language R., Grado en Estadística
- Published
- 2020
6. Predicción del precio en el mercado de viviendas en la ciudad de Valencia mediante redes neuronales en el año 2020
- Author
-
Ribal Sanchis, Francisco Javier, Universitat Politècnica de València. Departamento de Economía y Ciencias Sociales - Departament d'Economia i Ciències Socials, Universitat Politècnica de València. Facultad de Administración y Dirección de Empresas - Facultat d'Administració i Direcció d'Empreses, Antón Ruiz, Alejandro, Ribal Sanchis, Francisco Javier, Universitat Politècnica de València. Departamento de Economía y Ciencias Sociales - Departament d'Economia i Ciències Socials, Universitat Politècnica de València. Facultad de Administración y Dirección de Empresas - Facultat d'Administració i Direcció d'Empreses, and Antón Ruiz, Alejandro
- Abstract
[ES] Las redes neuronales artificiales permiten capturar las relaciones entre las variables decisivas para la fijación del valor del mercado de la vivienda. En este TFG se construye, a partir de la web idealista, una base de datos de precios de oferta y características (ubicación, superficie, habitaciones, planta y ascensor) de viviendas en la ciudad de Valencia, a partir de la cual se diseña, aplica y optimiza un modelo para la predicción del precio de oferta de una vivienda en base a sus características, basado en redes neuronales artificiales. A fin de valorar la precisión del modelo, se mide el error mediante el error absoluto medio, a partir de un esquema de validación cruzada empleando subconjuntos de entrenamiento, validación y test., [EN] Artificial neural networks are able to capture the relationships between the most relevant variables in market pricing of properties. In the present bachelor¿s thesis, a database containing offer prices and features (location, surface area, rooms, floor and elevator) of properties located in Valencia city is built, using idealista web as the source. With this database, an offer price predictive model using the properties¿ features as an input, and based in neural networks is designed, built, and optimized. In order to assess its performance, mean absolute error is measured within a cross-validation scheme, in which training, validation and test subsets are used.
- Published
- 2020
7. Utilización de la base de datos Eurostat. Elaboración de informes automáticos con R
- Author
-
Ribal Sanchis, Francisco Javier, Debón Aucejo, Ana María, Universitat Politècnica de València. Departamento de Economía y Ciencias Sociales - Departament d'Economia i Ciències Socials, Universitat Politècnica de València. Facultad de Administración y Dirección de Empresas - Facultat d'Administració i Direcció d'Empreses, Reboyras Soleto, Fernando, Ribal Sanchis, Francisco Javier, Debón Aucejo, Ana María, Universitat Politècnica de València. Departamento de Economía y Ciencias Sociales - Departament d'Economia i Ciències Socials, Universitat Politècnica de València. Facultad de Administración y Dirección de Empresas - Facultat d'Administració i Direcció d'Empreses, and Reboyras Soleto, Fernando
- Abstract
[ES] El conocimiento y análisis de datos europeos es un pilar básico de la economía actual. Para ello, la base de datos Eurostat recoge cientos de estadísticas de naturaleza socio-economica de los países la Unión Europea. Sin embargo, la gestión de estos datos puede ser una tarea muy laboriosa. Para poder acceder y posteriormente procesar el gran volumen de información está disponible un paquete denominado 'eurostat' en R. En este trabajo se analizará y clasificará la información disponible en Eurostat para posteriormente diseñar una aplicación mediante R y el paquete de R Shiny. El paquete Shiny permite crear aplicaciones web interactivas con tablas y gráficos de modo que el resultado permitirá obtener información procesada, especialmente en forma gráfica, de Eurostat. Además R permite crear informes automatizados empleando Rmarkdown de modo que se diseñarán y generarán informes automáticos que recojan aspectos específicos de la información estadística., [EN] Knowledge and analysis of european data is a basic pillar of current economy. To fullfill it, the european database Eurostat gathers hundreds of statistics of socioeconomic nature from the countries of the European Union. However, managing data can prove to be a laborious task. In order to access and process the large amount of information there's a package called 'eurostat' available for R. In this work we will analyze and classify the information available in Eurostat to subsequently design an application using R and the R package called Shiny. The Shiny package helps create interactive web applications containing tables and graphs so that the result will enable the extraction of processed information from Eurostat, especially in a graphic way. Furthermore, R can be used to create automatic reports using Rmarkdown in a way that will allow us to design and generate automatic reports that gather specific aspects of the statistical information.
- Published
- 2020
8. Diseño y programación de un tablero de indicadores económicos
- Author
-
Ribal Sanchis, Francisco Javier, Universitat Politècnica de València. Departamento de Economía y Ciencias Sociales - Departament d'Economia i Ciències Socials, Universitat Politècnica de València. Facultad de Administración y Dirección de Empresas - Facultat d'Administració i Direcció d'Empreses, Gil-Terrón Rodríguez, Francisco Javier, Ribal Sanchis, Francisco Javier, Universitat Politècnica de València. Departamento de Economía y Ciencias Sociales - Departament d'Economia i Ciències Socials, Universitat Politècnica de València. Facultad de Administración y Dirección de Empresas - Facultat d'Administració i Direcció d'Empreses, and Gil-Terrón Rodríguez, Francisco Javier
- Abstract
[ES] El análisis de los distintos indicadores económicos y su evolución permite obtener una visión general relativa de la economía de un país. En este trabajo, tras un estudio de los principales indicadores económicos, así como de sus fuentes, se desarrollará un tablero o dashboard para la visualización de la situación económica de España a partir de los valores del propio país y de otras áreas geográficas con las que contrastar la información. Para ello, se empleará el lenguaje de programación R mediante el que se pretende alcanzar una aplicación que obtenga, trate y muestre los datos de manera automatizada., [EN] The analysis of the different economic indicators and their evolution allows to obtain a relative general vision of the economy of a country. In this work, after a study of the main economic indicators, as well as their sources, a dashboard will be developed to visualize the economic situation in Spain based on the values of the country itself and other geographical areas with which contrast the information. To do this, the R programming language will be used to achieve an application that automatically obtains, processes and displays the data., [CA] L’anàlisi dels distints indicadors econòmics i la seua evolució permet obtindre una visió general relativa de l’economia d’un país. En aquest treball, després d’un estudi dels principals indicadors econòmics, així com de les seues fonts, es desenvoluparà un tauler o dashboard per a la visualització de la situació econòmica d’Espanya a partir dels valors del propi país i d’altres àrees geogràfiques amb què contrastar la informació. Per a això, s’emprarà el llenguatge de programació R per mitjà del que es pretén aconseguir una aplicació que obtinga, tracte i mostre les dades de manera automatitzada.
- Published
- 2020
9. El problema de la secretaria
- Author
-
Macia Vazquez, Laura and González Alcón, Carlos
- Subjects
Simulaci´on ,Lenguaje de programación R ,Optimal stopping ,Recursion ,Parada óptima ,Secretary problem ,Recursividad ,Problema de la secretaria ,Programming language R ,Parada ´optima ,Simulation ,Lenguaje de programaci´on R - Abstract
En este trabajo se presenta un problema de parada ´optima, conocido por una de sus versiones como el problema de la secretaria. Consiste en seleccionar al mejor candidato para un puesto vacante entre un n´umero conocido de solicitantes que acuden a ser entrevistados. Se estudia la soluci´on aportada por la literatura y se muestran los resultados mediante simulaciones y gr´aficas. Se aporta c´odigo inform´atico con funciones que implementan la soluci´on, tanto haciendo uso de la recursividad como evit´andola. Tambi´en se estudia un problema similar propuesto por Cayley, en el que el n´umero de entrevistas est´a acotado. En la ´ultima parte del trabajo se proponen y resuelven dos generalizaciones del problema inicial. En la primera se permite cualquier funci´on objetivo. En la segunda, se resuelve el problema cuando las vacantes a cubrir son varias. This work presents an optimal stopping problem, known by one of its versions as the secretary problem. It involves selecting the best candidate for a vacant position from a known number of applicants who come to be interviewed. The solution provided by the literature is studied and the results are shown using simulations and graphs. Computer code is provided with functions that implement the solution, both making use of recursion and avoiding it. A similar problem proposed by Cayley is also studied, in which the number of interviews is limited. In the last part of the work, two generalizations of the initial problem are proposed and solved. In the first, any objective function is allowed. In the second, the problem is solved when there are several vacancies to fill.
- Published
- 2020
10. Bioestadística aplicada en restauración ecológica: análisis de casos en paisajes andinos degradados de Colombia
- Author
-
Prado Castillo, Luis Fernando and Carmona Berraquero, Fernando
- Subjects
Bioinformática -- TFM ,lenguaje de programación R ,ecological restoration ,R programming language ,restauración ecológica ,llenguatge de programació R ,restauració ecològica ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
En Colombia, la restauración ecológica es una práctica que ha tenido un crecimiento en las últimas décadas y pese a que el país cuenta con un Plan Nacional de Restauración, las iniciativas son dispersas, con bajo presupuesto para las necesidades evidenciadas, limitados equipos científicos especializados e insípido desarrollo de su cuerpo de conocimiento científico para abordar la diversidad de ecosistemas y escenarios de degradación existentes. Así, uno de los grandes desafíos existentes es validar el cuerpo de conocimiento que se requiere para optimizar recursos y esfuerzos mediante una apropiada identificación y aplicación de herramientas de la bioestadística para la resolución de problemas de investigación en restauración ecológica. Se explora aquí -mediante el uso del lenguaje de programación R- diversos métodos de análisis estadísticos aplicados a la generación de conocimiento en ecología de la restauración en los Andes nororientales colombianos, con énfasis en tres aspectos: a) la efectividad de la técnica de nucleación; b) el abordaje de la restauración a través de grupos funcionales de plantas; y c) el análisis de las relaciones planta-animal; determinantes en la evaluación de la efectividad de los procesos de restauración ecológica en sus primeras etapas de desarrollo sobre pastizales abandonados en bosques andinos degradados. In Colombia, the ecological restoration is a practice that has been growing in the last decades and despite the fact that Colombia have athe last decades and despite the fact that the Colombia have a National Restoration Plan, the initiatives are scattered, with low budget for the evidenced needs, limited specialized scientific teams and insipid development of its body of scientific knowledge to address the diversity of ecosystems and existing degradation scenarios. Thus, one of the great challenges is to validate the body of knowledge required to optimize resources and efforts through an appropriate identification and application of biostatistics tools to solve research problems in ecological restoration. We explore here -through the use of the R programming language- various methods of statistical analysis applied to the generation of knowledge in the ecology of restoration in the northeastern Andes of Colombia, with emphasis on three aspects: a) the effectiveness of the nucleation technique; b) the restoration approach through functional groups of plants; and c) the analysis of plant-animal relationships; determinants in the evaluation of the effectiveness of ecological restoration processes in their early stages of development over abandoned pastures in degraded Andean forests. A Colòmbia, la restauració ecològica és una pràctica que ha tingut un creixement en les últimes dècades, i malgrat que el país compta amb un Pla Nacional de Restauració. Les iniciatives són disperses, amb baix pressupost per a les necessitats evidenciades, limitades a equips científics especialitzats i poc desenvolupats per abordar la diversitat d'ecosistemes i escenaris de degradació existents. Així, un dels grans reptes existents és validar el cos de coneixement que es requereix per optimitzar recursos i esforços mitjançant una apropiada identificació i aplicació d'eines de la bioestadística per a la resolució de problemes d'investigació en restauració ecològica. S'explora, mitjançant l'ús del llenguatge de programació R diversos mètodes d'anàlisi estadístics aplicats a la generació de coneixement en ecologia de la restauració als Andes nord-orientals colombians, amb èmfasi en tres aspectes: a) l'efectivitat de la tècnica de nucleació; b) l'abordatge de la restauració a través de grups funcionals de plantes; i c) l'anàlisi de les relacions planta-animal; determinants en l'avaluació de l'efectivitat dels processos de restauració ecològica en les seves primeres etapes de desenvolupament sobre pastures abandonades en boscos andins degradats.
- Published
- 2019
11. Modelos probabilísticos para la estimación de resultados deportivos
- Author
-
Fernández García, Juan Diego and González Alcón, Carlos
- Subjects
Poisson bivariada ,Matriz estoc´astica ,Lenguaje de programación R ,Poisson univariada ,Poisson bivariada Regresión ,Probabilidad de transición ,Probabilidad de transici´on ,Matriz estocástica ,Cadena de Markov ,Regresi´on ,Lenguaje de programaci´on R - Abstract
En este trabajo se presentar´an dos modelos probabil´ısticos cuya principal herramienta es la distribuci´on de Poisson. El objetivo de estas dos propuestas es asignar a cada partido de f´utbol una distribuci´on de probabilidad para los posibles resultados. En la primera propuesta asumiremos independencia entre los goles que marcar´an los equipos enfrentados. El modelo alternativo est´a fundamentado en la Poisson Bivariante, que asume correlaci´on entre el n´umero de goles de ambos equipos. Se analizan y comparan ambos m´etodos utilizando los datos de LaLiga y La Liga Iberdrola. Propondremos tambi´en un modelo de partido como cadena de Markov que nos permita hacer simulaciones. En particular en la presente memoria, constar´an ejemplos con datos de LaLiga y La Liga Iberdrola 2018-19. This work will present two probabilistic models whose main tool is the distribution of Poisson. The aim of these two proposals is to assign each football match a probability distribution for the possible outcomes. In the first proposal we will assume independence among the goals that will mark the opposing teams. The alternative model is based on the bivariate Poisson, which assumes correlation between the number of goals of both teams. Both methods are analyzed and compared using data from LaLiga and La Liga Iberdrola. We will also propose a party model as a Markov chain that allows us to do simulations. In particular in this report, examples with data from LaLiga and La Liga Iberdrola 2018-19 will be included.
- Published
- 2019
12. Diseño de aplicación web para el análisis de expresión de archivos en formato mirGFF3
- Author
-
Corral Bondía, Adrián and Pantano Rubiño, Lorena
- Subjects
microRNA ,lenguaje de programación R ,Web applications -- TFM ,Aplicacions web -- TFM ,Shiny ,R programming language ,llenguatge de programació R ,mirTOP ,Aplicaciones web -- TFM ,GEUVADIS - Abstract
Desarrollo de una aplicacion web por medio de lenguaje R y sus paquetes y librerías tidyverse y Shiny, para el análisis de expressions gènica en archivos mirGFF3 asi como de los meta datos asociados, logrando al final, un ensayo con el conjunto de datos de gran tamaño del proyecto Reproducibility of high throughput mRNA sequencing across laboratories de Peter A C t Hoen te. al. dentro del proyecto GEUVADIS (Genetic European Variation in Disease). Development of a web based app using R language and their different packages and libraries: tidyverse and shiny, for the genetic expression analysis of mirGFF3 files and the associated metadata, achieving in the final step, an assay with a large dataset inside the project Reproducibility of high throughout mRNA sequencing across laboratories by Peter A C t Hoen te. al. inside the project GEUVADIS (Genetic European Variation in Disease). Desenvolupament d' una aplicació web mitjançant el llenguatge R y els seus paquets y llibreries: tidyverse i shiny per a l'anàlisis d'expressió gènica en artxius mirGFF3 així com de les metadades associades, obtenint al final, un assaig amb el conjunt de dades de gran mida del projecte Reproducibility of high throughput mRNA sequencing across laboratories de Peter A C t Hoen te. al. dintre del projecte GEUVADIS (Genetic European Variation in Disease).
- Published
- 2019
13. Herramienta en línea para la realización de análisis de significación biológica con R
- Author
-
Morell Bennasser, Antonio and Sánchez Pla, Alexandre
- Subjects
Bioinformática -- TFM ,lenguaje de programación R ,R programming language ,Bioconductor ,significació biològica ,llenguatge de programació R ,biological significance ,significación biológica ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
Esta memoria es el resultado de un trabajo de final de master del master en Bioinformática y Bioestadística, en la cual se detalla el proyecto realizado. En este proyecto se ha realizado, por un lado, el diseño de una aplicación para la realización de análisis de significación biológica y, por otro lado, el desarrollo de un prototipo de la aplicación a partir del diseño previo. La memoria está formada por una introducción, en la cual se detallan el contexto y la justificación del proyecto, los objetivos y la metodología seguida. Seguidamente, se habla de los análisis de significación biológica, los distintos tipos y las herramientas para realizarlos. Por último, se detalla el diseño de la aplicación, donde además se explica el porque de la elección de los diferentes análisis implementados y las herramientas utilizadas, y se muestra el prototipo realizado de la aplicación, donde puede verse su funcionamiento y aplicación. Aquesta memòria és el resultat d'un treball de fi de master del master en Bioinformàtica i Bioestadística, on es detalla el projecte realitzat. Dins aquest projecte s'ha realitzat, per una banda, el diseny d'una aplicació per a la realització de anàlisis de significación biològica i, d'altra banda, s'ha desenvolupat un prototip de la aplicació seguint el diseny previ. La memòria està formada per una introducció, on es detalla el contexte i la justificació del projecte, els objectius i la metodología seguida. A continuació, es parla dels anàlisis de significació biològica, els diferents tipus i les eines per a realitzar-los. En darrer lloc, es detalla el diseny de la aplicació, on a més s'explica el perquè de l'elecció dels diferents anàlisis implementats i les eines utilitzades, i es mostra el prototip realitzat de la aplicació, on es pot veure el seu funcionament i aplicació. This memory is the result of a master final work from the master on Bioinformatics and Biostatistics, where there is the project realized on detail. In this project it was made a design of an application for the realization of the biologic signification analyses and an application prototype was developed from the previous design. The memory has an introduction where there is the context and justification of the project, the objectives and the methodology used. Then, it talks about the biologic signification analyses, the different types and the tools to do them. Finally, the application's design is detailed, where also the election of the different analyses implemented is explained and the tools used too, also the prototype of the application is shown, where its operation and application can be seen.
- Published
- 2019
14. Análisis estadístico de eventos asociados a variables de tiempo en R:modelo de supervivencia en pacientes con carcinoma de células renales
- Author
-
Zapata Acevedo, Sebastian Alejandro, Universitat Oberta de Catalunya, Ventura Royo, Carles, and Carmona Berraquero, Fernando
- Subjects
lenguaje de programación R ,R programming language ,càncer ,bioinformatics ,llenguatge de programació R ,Bioinformática -- TFM ,survival data ,datos de supervivencia ,bioinformática ,cáncer ,cancer ,bioinformàtica ,dades de supervivència ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
El análisis de supervivencia es una de las herramientas estadísticas que permite examinar y modelar el tiempo que tarda un evento en ocurrir. En esta tesis se han estudiado métodos para abordar el análisis de supervivencia enfocados en datos del ámbito biomédico. La base de datos sobre la que se trabajó, contiene un estudio de pacientes con cáncer de células renales, un tipo de enfermedad que representa en la actualidad del 2% al 3% de todos los tipos de cáncer y cuya influencia máxima se da en los países occidentales. Se evaluó en primer lugar la función de supervivencia de para las dos situaciones de eventos (muerte y recaída) asociados a variables de tiempo. L'anàlisi de supervivència és una de les eines estadístiques que permet examinar i modelar el temps que triga un esdeveniment a ocórrer. En aquesta tesi s'han estudiat mètodes per abordar l'anàlisi de supervivència enfocats en dades de l'àmbit biomèdic. La base de dades sobre la qual es va treballar, conté un estudi de pacients amb càncer de cèl·lules renals, un tipus de malaltia que representa en l'actualitat del 2% al 3% de tots els tipus de càncer i la influència màxima del qual es dóna als països occidentals. Es va avaluar en primer lloc la funció de supervivència de para les dues situacions d'esdeveniments (mort i recaiguda) associats a variables de temps. The survival analysis is one of the statistical tools that allows us to examine and model the time for the occurrence of an event. In this thesis, methods have been studied to approach survival analysis focused on data from the biomedical field. The database on which we work contains a study about patients with renal cell cancer, a type of disease that currently represents 2% to 3% of all types of cancer and whose maximum influence is in the Western countries. The survival function was first evaluated for the two situations of events (death and relapse) associated with time variables.
- Published
- 2018
15. Missing data analysis in longitudinal data. How to analyze it?
- Author
-
Curto García, Jorge Juan, Universitat Oberta de Catalunya, Sánchez Pla, Alexandre, and Pérez Álvarez, Nuria
- Subjects
Bioinformática -- TFM ,longitudinal data ,bioinformática ,lenguaje de programación R ,R programming language ,datos longitudinales ,bioinformàtica ,bioinformatics ,llenguatge de programació R ,dades longitudinals ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
Mediante este trabajo se pretende caracterizar los estudios con datos longitudinales y los problemas derivados de los análisis en los que se presentan datos faltantes. Apoyándose en los grandes avances en la capacidad computacional que permiten la aplicación de algoritmos más complejos, en los últimos años se han desarrollado nuevos métodos de tratamiento de datos faltantes en el contexto del análisis de datos longitudinales. Se pretende indagar en los distintos tipos de datos faltantes y en la metodología disponible para abordar su análisis en el ámbito de datos longitudinales, para identificar bondades y limitaciones de dichos métodos. En la fase final del trabajo se presentará una ejemplificación de la aplicación de los métodos estudiados mediante el análisis de una base de datos longitudinales en el ámbito de la biomedicina, generando un informe estadístico dinámico (utilizando software de licencia libre: R y Markdown). In this work, we intend to characterize the studies with longitudinal data and the problems derived from the analyzes in which missing data are presented. In recent years, based on the great advances in computational capacity that allow the application of more complex algorithms, there have been developed new methods of processing missing data in the context of longitudinal data analysis. The aim of this work is to investigate the different types of missing data and the available methodology to address their analysis in the longitudinal data field, in order to identify benefits and limitations of these methods. In the final phase of the work, an exemplification of the application of the methods studied will be presented through the analysis of a longitudinal database in the field of biomedicine, generating a dynamic statistical report (using free license software: R and Markdown). Mitjançant aquest treball es pretén caracteritzar els estudis amb dades longitudinals i els problemes derivats de les anàlisis en els quals es presenten dades restants. Recolzant-se en els grans avanços en la capacitat computacional que permeten l'aplicació d'algorismes més complexos, en els últims anys s'han desenvolupat nous mètodes de tractament de dades restants en el context de l'anàlisi de dades longitudinals. Es pretén indagar en els diferents tipus de dades restants i en la metodologia disponible per abordar la seva anàlisi en l'àmbit de dades longitudinals, per identificar bondats i limitacions d'aquests mètodes. En la fase final del treball es presentarà una exemplificació de l'aplicació dels mètodes estudiats mitjançant l'anàlisi d'una base de dades longitudinals en l'àmbit de la biomedicina, generant un informe estadístic dinàmic (utilitzant programari de llicència lliure: R i Markdown).
- Published
- 2018
16. Análisis estadístico de datos obtenidos mediante qPCR y RT-qPCR utilizando métodos de remuestreo
- Author
-
Franquet Bonet, Álvaro, Universitat Oberta de Catalunya, Civit Vives, Sergi, and Sánchez Pla, Alexandre
- Subjects
qPCR ,lenguaje de programación R ,Programari d'aplicació -- Desenvolupament -- TFM ,R programming language ,Application software -- Development -- TFM ,llenguatge de programació R ,Software de aplicación -- Desarrollo -- TFM ,Bootstrap - Abstract
La reacción en cadena de la polimerasa en tiempo real (qPCR) y sus variantes como la retrotranscripción PCR en tiempo real (RT-qPCR), son técnicas de la biología molecular altamente utilizadas en la investigación biomédica para comparar las expresiones relativas (RE) de un grupo tratamiento contra un grupo de control debido a su alta sensibilidad. En este trabajo se presenta una metodología estadística para el análisis de RE obtenidas mediante RT-qPCR o para datos con una estructura similar, así cómo su implementación en la librería testratio creada con el lenguaje de programación R. The real-time polymerase chain reaction (qPCR) and its variants such as realtime PCR retrotranscription (RT-qPCR) are molecular biology techniques highly used in biomedical research to compare the relative expressions (RE) of a treatment group against a control group due to its high sensitivity. This work presents a statistical methodology for the analysis of RE obtained by RT-qPCR or for data with a similar structure, as well as its implementation in the testratio library created with the programming language R. La reacció en cadena de la polimerasa en temps real (qPCR) i les seves variants com la retrotranscripció PCR en temps real (RT-qPCR), són tècniques de la biologia molecular altament usades en la investigació biomèdica per comparar les expressions relatives (RE) d'un grup tractament contra un grup de control per la seva alta sensibilitat. En aquest treball es presenta una metodologia estadística per a l'anàlisi de RE obtingudes mitjançant RT-qPCR o per a dades amb una estructura similar, així com la seva implementació a la llibreria testratio creada amb el llenguatge de programació R.
- Published
- 2016
17. Recommendation system based on competitive neural networks
- Author
-
Rocha Muñoz, Teresa, Ortiz-de-lazcano-Lobato, Juan Miguel, and Lenguajes y Ciencias de la Computación
- Subjects
Grado en Ingeniería Informática - Trabajos Fin de Grado ,Algoritmos computacionales ,R (Lenguaje de programación) ,Redes neuronales ,lenguaje de programación R ,Sistema de recomendación ,Informática - Trabajos Fin de Grado ,redes neuronales competitivas ,clasificación de productos - Abstract
En la presente memoria se expone la implementación del algoritmo de un sistema de recomendación basado en el PCACL (Principal Components Analysis Competitive Learning), que es una red neuronal competitiva que realiza un análisis de componentes principales (PCA) en cada neurona. Además, se exponen las razones por las cuales se ha elegido este algoritmo como el núcleo del sistema de recomendación y la importancia de que se realice un buen entrenamiento de la red neuronal. La implementación del sistema de recomendación se ha realizado en el lenguaje de programación R con la ayuda del entorno de trabajo RStudio, de los cuáles se detallan las características más relevantes en el proceso de esta implementación. Finalmente se realizan y estudian las pruebas realizadas al sistema para comprobar si es fiable o no y si se podría mejorar el algoritmo.
- Published
- 2016
18. Uso de algoritmos de aprendizaje automático aplicados a bases de datos genéticos (HapMap)
- Author
-
Pulido Lozano, Jorge, Universitat Oberta de Catalunya, Jiménez García, Brian, Marco Galindo, Maria Jesús, and Andrio Balado, Pau
- Subjects
lenguaje de programación R ,mineria de dades ,R programming language ,SNP ,minería de datos ,biostatistics ,data mining ,bioinformatics ,PHP ,llenguatge de programació R ,aprenentatge automàtic ,Bioinformática -- TFM ,HapMap ,bioinformática ,bioestadística ,automatic learning ,aprendizaje automático ,MySQL ,bioinformàtica ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
En los últimos años el volumen de información relativa a genoma humano se ha visto incrementado de manera exponencial, obligando al desarrollo de bases de datos biológicas y herramientas de computación para su análisis. La magnitud y complejidad de los datos conlleva la aparición de técnicas de aprendizaje automático que permite obtener nueva información relevante y abrir nuevas vías de investigación. En el presente trabajo se ha aplicado un algoritmo de aprendizaje automático basado en la información contenida en una serie de bases de datos relacionales de consultas estructuradas (MySQL), con información de los SNP´s de todo el genoma de 11 grupos étnicos. Dicho algoritmo escrito en lenguaje R permite la clasificación de los datos en clúster según la semejanza de estos, y el análisis estadístico para determinar la eficacia de la clasificación. In recent years, the volume of information about the human genome has been increasing exponentially, driving the biological databases¿ development and computer tools for their analysis. Due to the amount and complexity that the data carries, it was necessary to create techniques for automatic learning which allow obtaining new patterns and investigation´s lines. In the present work, an automatic learning algorithm has been applied to a database, built in MySQL, with all SNPs detected in the human genome from 11 ethnic groups. The code, written in R, allows a cluster analysis and a graphical representation base on the similarity of the SNPs as well as a statistical test to determine the classification training accuracy. En els últims anys el volum d'informació relativa a genoma humà s'ha vist incrementat de manera exponencial, obligant al desenvolupament de bases de dades biològiques i eines de computació per a la seva anàlisi. La magnitud i complexitat de les dades comporta l'aparició de tècniques d'aprenentatge automàtic que permet obtenir nova informació rellevant i obrir noves vies d'investigació. En el present treball s'ha aplicat un algoritme d'aprenentatge automàtic basat en la informació continguda en una sèrie de bases de dades relacionals de consultes estructurades (MySQL), amb informació dels SNP's de tot el genoma d'11 grups ètnics. Dit algoritme escrit en llenguatge R permet la classificació de les dades en clúster segons la semblança d'aquests, i l'anàlisi estadística per determinar l'eficàcia de la classificació.
- Published
- 2016
19. Estudio y Desarrollo de una Librería en R para Evaluar las Prestaciones de un Clasificador
- Author
-
Ferri Ramírez, César, Hernández Orallo, José, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Morillo Alcivar, Paulina Adriana, Ferri Ramírez, César, Hernández Orallo, José, Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Morillo Alcivar, Paulina Adriana
- Abstract
[ES] Los modelos de clasificación se generan por algoritmos de aprendizaje supervisado, que aprenden a través de un conjunto de datos de entrenamiento. Estos modelos establecen relaciones entre las instancias, que les permiten predecir si pertenecen, o no, a un mismo tipo o clase. Cuando los clasificadores se usan en aplicaciones de la vida real como: discriminación de imágenes, diagnósticos en medicina, gestión de las telecomunicaciones, bioinformática, clasificación de texto, detección de fraude en transacciones financieras, etc., se enfrentan a dificultades ocasionadas por la distribución de las clases y/o por los costes de clasificar erróneamente una instancia. Existen algunas herramientas que permiten evaluar las prestaciones de los clasi- ficadores, una de las más usadas debido a la facilidad de su interpretación es la curva ROC, que aunque tiene asociados estadísticos que permiten seleccionar o descartar modelos de acuerdo a su desempeño, no toma en cuenta la distribución de las clases y el coste de clasificación. Para solventar estas limitaciones surgieron las Curvas de Coste. El propósito de este trabajo es realizar un estudio de las herramientas gráficas de evaluación del rendimiento de clasificadores, dando mayor énfasis a las Curvas de Coste y métodos de selección de umbral sobre clasificadores suaves. Como resultado de este trabajo se desarrolla una librería gráfica, en el lenguaje de programación R, que incorpora estas funcionalidades. Además, se incluyen algunos ejemplos del uso de la nueva librería con conjuntos de datos reales y métodos de clasificación conocidos. Estos ejemplos ilustran las ventajas que presenta la utilización de las Curvas de Costes y los métodos de selección de umbral cuando se requiere evaluar el rendimiento de clasificadores en entornos con contextos cambiantes., [EN] Classification models are generated by supervised learning algorithms that learn through a training dataset. These models establish relationships between instances, which allow them to predict whether they belong or not to the same type or class. When classifiers are used in real-life applications, such as image discrimination, medical diagnosis, telecommunications management, bioinformatics, text classification, fraud detection in financial transactions, and others, they face difficulties caused by the distribution of classes and/or the cost of misclassifying an instance. There are some tools that can evaluate the performance of classifiers. In particular, the ROC curve is one of the most used due to its ease of interpretation. Although it has statistical methods that allow to select or exclude models according to their performance, the ROC Curve does not take into account distributions of classes and misclassification costs. The Cost Curves appeared as a solution to overcome these limitations. This paper aims to research graphic tools for performance evaluation of classi- fiers, focused on Cost Curves and threshold choice methods applied to soft classi- fiers. As a result of this analysis, we develop, using the programming language R, a graphical library that incorporates these functionalities. We include some examples using the new library with real datasets and well-known classifiers methods. These examples illustrate the advantages that introduce the use of Cost Curves and threshold choice methods when we want to assess the performance of classi- fiers in environments with changing context.
- Published
- 2016
20. Practical education of Non-Life Actuarial Mathematics with R: Innovative experience in the University of Barcelona
- Author
-
Claramunt-Bielsa, Mercè, Alegre-Escolano, Antonio, Boj-del-Val, Eva, Costa-Cor, Teresa, Mármol-Jiménez, Maite, Morillo-López, Isabel, and Institut de Ciències de l'Educació, Universitat de Barcelona, REDICE
- Subjects
Free software ,Noves tecnologies ,Llenguatge de programació R ,Educación superior ,Nuevas tecnologías ,Software libre ,Lenguaje de programación R ,Matemática Actuarial No Vida ,Ciencias Actuariales y Financieras ,European Higher Education Area ,New technologies ,Programming language R ,Actuarial and Financial Sciences ,lcsh:LB5-3640 ,lcsh:Theory and practice of education ,Software lliure ,Espai europeu d’educació superior ,Ciències Actuarials i Financeres ,Educación Superior, nuevas tecnologías, software libre, lenguaje de programación R, Matemática Actuarial No Vida, Ciencias Actuariales y Financieras - Abstract
En aquest treball s’explica l’experiència innovadora realitzada en l’assignatura de Matemàtica Actuarial No Vida dintre del projecte REDICE2008 (A0801-06). L’experiència consisteix en el canvi en l’ensenyament pràctic de dita assignatura al incorporar el llenguatge de programació R, conjuntament amb els nous paquets que inclouen funcions sobre matemàtica y estadística actuarial. Seguit d’una introducció, en el treball es comenten els antecedents de l’ensenyament pràctic de l’assignatura en la Universitat de Barcelona i també la situació a España de les tretze universitats que actualment imparteixen la Llicenciatura en Ciències Actuarials i Financeres. A continuació es descriu el desenvolupament del projecte, remarcant les dificultats que implica un canvi d’aquest tipus per als estudiants i els professors, i es detallen els resultats més importants de la innovació. El treball finalitza amb unes conclusions i diversos annexes amb els models d’enquesta passats als estudiants i a les universitats. Espai europeu d’Educació Superior, noves tecnologies, software lliure, llenguatge de programació R, Ciències Actuarials i Financeres., En este trabajo se explica la experiencia innovadora realizada en la asignatura de Matemática Actuarial No Vida dentro del proyecto REDICE2008 (A0801-06). La experiencia consiste en el cambio en la enseñanza práctica de dicha asignatura incorporando el lenguaje de programación R, junto con los nuevos paquetes que incluyen funciones sobre matemática y estadística actuarial. Después de una introducción, en el trabajo se comentan los antecedentes de la enseñanza práctica de la asignatura en la Universidad de Barcelona y también la situación en España de las trece universidades que actualmente imparten la Licenciatura en Ciencias Actuariales y Financieras en España. A continuación se describe el desarrollo del proyecto, remarcando las dificultades que implica un cambio de este tipo para estudiantes alumnado y profesorado, y se detallan los resultados más importantes de la innovación. El trabajo finaliza con unas conclusiones y diversos anexos con los modelos de encuesta pasados a estudiantes alumnado y universidades., In this work it is explained the innovative experience realized in the subject of Non-Life Actuarial Mathematics inside the project REDICE2008 (A0801-06). The experience consists of the change of the practical education of the above mentioned subject incorporating the programming language R, together with the new packages that include functions on mathematics and actuarial statistics. After an introduction, in the work it is commented the precedents of the practical education of the subject in the University of Barcelona and also the situation in Spain of thirteen universities that nowadays they give the Master in Actuarial and Financial Sciences. Later the development of the project is described, noticing the difficulties that there implies a change of this type for students and teachers, and the most important results of the innovation are detailed. The work finishes with the conclusions and diverse annexes with the models of survey gone on to students and universities. Key words: European Space of Higher Education, new technologies, free software, programming language R, Actuarial and Financial Sciences.
- Published
- 2012
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.