78 results on '"Regressionsmodell"'
Search Results
2. Termisk analys av stadsmiljön : En fallstudie av urban värmeöeffekt i Linköping
- Author
-
Karlsson, Linda and Karlsson, Linda
- Abstract
Different environments exhibit varying temperatures, where generally areas with high amounts of vegetation, and consequently significant shading, tend to be cooler than regions dominated by dark buildings and black roofs. As a result, urban areas are generally expected to have higher temperatures in comparison to rural areas or forests. This phenomenon, known as urban heat island effect, can be visualized as a dome-shaped area of hot air that concentrates pollution and can influence the precipitation patterns of a region. This study aimed to examine the urban heat island effect in Linköping from 1984 to 2023, with a focus on analyzing the correlation between the prevalence of impermeable materials and changes in surface temperature using remote sensing and geographic information systems. The study also explored the potential for predicting surface temperatures in 2034 with spatial regression. The results indicated a close relationship between the extent of impermeable materials (indicative of urban land use) and the surface temperatures in Linköping over the study period. Both urban land use and areas with high surface temperatures increased from 1984 to 2023, independent of rising air temperatures. The geographic locations of high urban heat island values have remained largely unchanged over time, but their spatial distibution expanded from 1984 to 2023. The predictive analysis has demonstrated the possibility to predict surface temperatures in 2034, with emphasis on the pivotal role of the model and its explanatory variables. The final predictive model indicates a continuing upward trend in surface temperatures. This study has in summary added an extensive overview of the urban temperature changes in Linköping, identifying potential areas with particularly high surface temperatures historically and provided possible models for predicting trends in the future., Olika miljöer uppvisar varierande temperaturer, där generellt områden med mycket vegetation, och därmed betydande skuggning, tenderar att vara svalare än regioner dominerade av mörka byggnader med svarta tak. Följaktligen förväntas urbana områden generellt ha högre temperaturer jämfört med landsbygdsområden eller skogsområden. Detta fenomen, känt som urban värmeöeffekt, kan förklaras som ett kupolformat område med förhöjda temperaturer som koncentrerar föroreningar, och som kan påverka regionala nederbördsmönster. Denna studie syftade till att undersöka den urbana värmeöeffekten i Linköping från 1984 till 2023, med fokus på att analysera korrelationen mellan förekomsten av ogenomträngliga ytor och förändringar i yttemperatur med hjälp av fjärranalys och geografiska informationssystem. Landsat-satellitbilder har använts för att erhålla data för markanvändning/marktäcke, samt för markytans temperaturer under studieperioden. Studien undersökte också möjligheten att förutsäga yttemperaturer år 2034 med hjälp av två enkla prediktiva modeller i programvaran ArcGIS Pro: Multiskalig Geografiskt Viktad Regression (MGWR) och Forest-baserad Forecast. Resultatet visade en nära relation mellan omfattningen av ogenomträngliga ytor (indikerade som urban markanvändning) och yttemperaturen i Linköping under studieperioden. Både urban markanvändning och områden med höga yttemperatur ökade från 1984 till 2023, oberoende av ökade lufttemperaturer. De geografiska positionerna för höga värmeövärden förblev i stort sett oförändrade över tid, men deras rumsliga fördelning expanderade från 1984 till 2023. Den prediktiva analysen visade att MGWR-modellen uppvisade begränsningar med de valda variablerna och dess samband till varandra. Däremot gav Forest-baserad Forecast-modellen ett mer tillförlitligt resultat, genom att utnyttja historiska yttemperaturer och data om markanvändning och marktäcke. Yttemperaturkartan för 2034 som generades av den senare modellen förutspår en ökning av områden
- Published
- 2024
3. Trinkwasserbefunde – Auswertung langjähriger Daten der Trinkwassertemperatur und mikrobiologischer Parameter mit Indikatorfunktion.
- Author
-
Schönher, Christoph, Kerschbaumer, David, Proksch, Philipp, and Perfler, Reinhard
- Abstract
Copyright of Österreichische Wasser- und Abfallwirtschaft is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2020
- Full Text
- View/download PDF
4. Der Kulturkonsument im Fokus
- Author
-
Gottschalk, Ingrid and Gottschalk, Ingrid
- Published
- 2016
- Full Text
- View/download PDF
5. Bluttransfusionen in der elektiven Primärendoprothetik: Können patientenspezifische Parameter die Transfusion vorhersagen?
- Author
-
Meißner, N, Strahl, A, Rolvien, T, Schrednitzki, D, Halder, AM, Meißner, N, Strahl, A, Rolvien, T, Schrednitzki, D, and Halder, AM
- Published
- 2023
6. Data-driven modelsfor estimating heatpump powerconsumption
- Author
-
Peskova, Monika and Peskova, Monika
- Abstract
The number of installed heat pumps has been rapidly increasing in recent years, acceleratingthe decarbonisation of the heating sector. The impact of the increasing deployment of heatpumps on the grid can be evaluated with the help of models estimating the heat pumppower consumption. This thesis contributes to the field of data-driven heat pump modellingby developing regression models based on data from field installations to reflect the heatpump operation in real conditions. The developed models estimate the heat pump powerconsumption using a limited number of input features (parameters) measured during heatpump operation. This thesis analysed anonymised data obtained from the monitoring systemof domestic ground-source heat pump (GSHP) and air-source heat pump (ASHP) installationsto develop GSHP and ASHP regression models. Prior to developing the regression models, the data were pre-processed and the most important features (measured parameters) used asindependent variables in the regression models were identified. Further, various regressionmodels were proposed ranging from simple-linear, multiple-linear to non-linear (up to thefourth-degree) regression models, with and without the interaction terms and with the varyingnumber of the selected input features. The identified most significant input features fordeveloping the regression models based on the obtained datasets involved supply, sourceand outdoor temperatures and compressor frequency. The results in this thesis showed thatregression models can estimate the heat pump power consumption with a satisfactory accuracy(up toR2 88 % and mean absolute percentage error 13 %). Furthermore, it was proven that nonlinearregression models performed with higher accuracy compared to linear regression modelsand the accuracy was increasing with the increasing number of statistically significant inputfeatures. This thesis also revealed the importance of outlier detection and feature selectionprior to developing heat pump models, Antalet installerade värmepumpar har ökat snabbt de senaste åren, vilket påskyndat avkolningenav värmesektorn. Effekten av den ökande användningen av värmepumpar på nätet kanutvärderas med hjälp av modeller som uppskattar värmepumpens energiförbrukning. Dettaexamensarbete bidrar till området för datadriven värmepumpsmodellering genom att utvecklaregressionsmodeller baserade på data från fältinstallationer för att spegla värmepumpensdrift under verkliga förhållanden. De utvecklade modellerna uppskattar värmepumpensenergiförbrukning med hjälp av ett begränsat antal indatafunktioner (parametrar) som mätsunder värmepumpens drift. Denna avhandling analyserade anonymiserade data som erhållitsfrån övervakningssystemet för inhemska markvärmepumpar (GSHP) och luftvärmepumpar(ASHP) installationer för att utveckla GSHP- och ASHP-regressionsmodeller. Införutvecklingen av regressionsmodellerna förbearbetades data och de viktigaste egenskaperna(uppmätta parametrar) som används som oberoende variabler i regressionsmodellernaidentifierades. Vidare föreslogs olika regressionsmodeller som sträckte sig från enkellinjära, multipellinjära till icke-linjära (upp till fjärde gradens) regressionsmodeller, med ochutan interaktionstermer och med det varierande antalet valda indatafunktioner. De identifierade viktigaste indatafunktionerna för att utveckla regressionsmodellerna baserade på de erhållna datamängderna involverade tillförsel-, käll- och utomhustemperaturer och kompressorfrekvens. Resultaten i denna avhandling visade att regressionsmodeller kan uppskatta värmepumpens energiförbrukning med tillfredsställande noggrannhet (upp tillR2 88 % och genomsnittligt absolut procentuellt fel 13 %). Dessutom bevisades det atticke-linjära regressionsmodeller presterade med högre noggrannhet jämfört med linjäraregressionsmodeller och noggrannheten ökade med det ökande antalet statistiskt signifikantaindatafunktioner. Detta examensarbete avslöjade också vikten av avvikande detektering och funktions
- Published
- 2023
7. Har inflation någon påverkan på ekonomisk tillväxt? : En paneldata analys över länder inom OECD samt Subsahariska Afrika
- Author
-
Jardeskog, Benjamin, Vornanen, Sofie, Jardeskog, Benjamin, and Vornanen, Sofie
- Abstract
Det har länge pågått diskussioner om hur förhållandet mellan inflation och ekonomisk tillväxt ser ut och vilken påverkan, inflation har på ekonomisk tillväxt. I denna uppsats analyseras relationen mellan inflation och ekonomisk tillväxt inom OECD-länder samt Subsahariska Afrika med hjälp av paneldata från tidperioden 2002–2021. Studien använder BNP per capita tillväxt som beroende variabel samt sju oberoende variabler (inflation, initial BNP per capita, befolkningstillväxt, handel, investeringar, statliga utgifter och finansiellt djup) för att utforma en regressionsmodell. Regressionsmodellen genomfördes med fixed effects för att kontrollera icke observerade länder med specifika egenskaper och tidsrelaterade chocker. Resultaten i studien visar att det finns ett negativ samband mellan inflation och ekonomisk tillväxt som är statistik signifikant., There have long been discussions about what the relationship between inflation and economic growth looks like and what impact inflation have on economic growth. In this essay, the relationship between inflation and economic growth is analysed within OECD countries and Sub-saharan Africa in the time period 2002 – 2021 using paneldata. The thesis uses GDP per capita growth as the dependent variable as well as seven independent variables (inflation, initial GDP per capita, population growth, trade, investment, government expenditures and financial depth) to design a regression model. The regression is carried out with fixed effects to control for unobserved countries specifics charactheritstics and time related shocks . The results in the study shows that there exist a negativ relationship between inflation and economic growth which is statistical significant.
- Published
- 2023
8. Modellierung der Qualität von Rotweinen : Rotweindaten wurden unter Verwendung eines Regressionsmodelles ausgewertet
- Author
-
Stattmann, Johanna
- Subjects
Wine quality ,Regression model ,Fermentation ,ingredients ,Weinqualität ,Regressionsmodell ,Inhaltsstoffe ,Python - Abstract
Die Qualität von Wein wird durch eine Vielzahl von Faktoren beeinflusst, darunter die Inhaltsstoffe und der Fermentationsprozess. Inhaltsstoffe wie Zucker, Säuren, Tannine und Aromaverbindungen tragen zur sensorischen Komplexität und Ausgewogenheit des Weins bei. Während der Fermentation verwandeln Hefen den Zucker in Alkohol und produzieren dabei auch Aromen. Die Wahl der Hefestämme und die Kontrolle der Fermentationsbedingungen ermöglichen es den Winzern, den Geschmack und das Aromaprofil des Weins zu beeinflussen. Eine sorgfältige Handhabung und Überwachung während der Fermentation ist entscheidend, um die gewünschte Qualität des Weins zu gewährleisten. Für die Untersuchung der Auswirkungen bestimmter Parameter auf die Weinqualität wurde ein Regressionsmodell mit Hilfe von Python erstellt. Durch die Analyse von Daten über Inhaltsstoffe konnte festgestellt werden, welchen Einfluss diese auf die Qualität des Weins haben. Das Regressionsmodell ermöglichte es, Zusammenhänge und Muster zu identifizieren und Vorhersagen über die Qualität des Weins auf der Grundlage der untersuchten Parameter zu treffen. Diese Analyse bietet wertvolle Erkenntnisse für die Verbesserung der Weinproduktion und die Steigerung der Qualität. The quality of wine is influenced by a variety of factors, including the ingredients and the fermentation process. Ingredients such as sugars, acids, tannins and aroma compounds contribute to the sensory complexity and balance of the wine. During fermentation, yeasts convert sugars into alcohol and also produce aromas. The choice of yeast strains and control of fermentation conditions allow winemakers to influence the flavor and aroma profile of the wine. Careful handling and monitoring during fermentation is critical to ensure the desired quality of the wine. A regression model was built using Python to study the effects of certain parameters on wine quality. By analyzing data on ingredients, it was possible to determine what influence they have on the quality of the wine. The regression model made it possible to identify relationships and patterns and make predictions about wine quality based on the parameters studied. This analysis provides valuable insights for improving wine production and increasing quality.
- Published
- 2023
9. Sobol'-Sensitivitätsanalyse der Untergrundparameter bei der Simulation von oberflächennaher Geothermie mithilfe von Gauß-Prozess-Emulatoren
- Author
-
Lubashevsky, Katrin, Ernst, Oliver, Kolditz, Olaf, Technische Universität Chemnitz, and Helmholtz-Zentrum für Umweltforschung GmbH - UFZ
- Subjects
ddc:519 ,Sensitivitätsanalyse, Sobo'-Indizes, Gauß-Prozess-Emulatoren, Monte-Carlo-Simulation, oberflächennahe Geothermie ,Sensitivitätsanalyse ,Monte-Carlo-Simulation ,Oberflächennahe geothermische Energie ,Kriging ,Regressionsmodell ,Gauß-Prozess ,ddc:500 ,ddc:510 - Abstract
Um den Planungsprozess von oberflächennahen Geothermieanlagen verbessern zu können, ist es von Vorteil, die Parameter zu kennen, welche besonders großen Einfluss auf die Leistung einer solchen Anlage haben. Um dies zu untersuchen, können globale Sensitivitätsanalysen durchgeführt werden. Die in dieser Arbeit vorgestellte Sensitivitätsanalyse beinhaltet ein Parameterscreening mit der One-Variable-At-a-Time-Methode und eine anschließend durchgeführte globale Sensitivitätsanalyse mithilfe von Sobol‘-Indizes. Hierbei werden die Eingabeparameter des verwendeten Berechnungsmodells innerhalb vorher definierter Wertebereiche und gemäß festgelegter Verteilungen variiert, was in einer großen Anzahl an Modelldurchläufen resultiert. Daher kommen bei Sensitivitätsanalysen oftmals approximierte Modelle zum Einsatz, welche das Verhalten des ursprünglichen Berechnungsmodells nachahmen sollen, um auf diese Weise eine geringere Rechenzeit zu erzielen. Hierfür werden in der vorliegenden Arbeit sogenannte Gauß-Prozess-Emulatoren verwendet. In dieser Arbeit werden die genannten Methoden aus mathematischer Sicht vorgestellt und eingeordnet und abschließend an einem analytischen Modell für die Untergrundparameter einer Geothermieanlage vorgeführt.
- Published
- 2022
10. Regressionsmodelle zur Abschätzung eines klimawandelbeeinflussten zukünftigen Regenerosivitätsfaktors auf Basis von Monatswerten. Regression models for the evaluation of the rainfall factor with regard to climate change on the basis of monthly values
- Author
-
Köhn, J., Beylich, M., Meißner, Ralph, Rupp, Holger, Reinstorf, F., Köhn, J., Beylich, M., Meißner, Ralph, Rupp, Holger, and Reinstorf, F.
- Abstract
Der R-Faktor als Maß für die Erosivität von Niederschlagsereignissen findet Anwendung in der Quantifizierung von Bodenverlusten mithilfe der Allgemeinen Bodenabtragsgleichung (ABAG). Die Berechnung des R-Faktors nach Normvorschrift bedarf zeitlich hoch aufgelöster Niederschlagsdaten, die meist nicht flächendeckend vorhanden sind. Aufgrund dessen werden Regressionsmodelle, wie z. B. die länderspezifischen Gleichungen der DIN 19708:2017-08 – "Bodenbeschaffenheit – Ermittlung der Erosionsgefährdung von Böden durch Wasser mit Hilfe der ABAG" oder auch räumlich hoch aufgelöste Radarniederschlagsdaten eingesetzt. In dieser Studie werden zwei für die Praxis einfach gehaltene, regionale Regressionsmodelle für den Landkreis Mansfeld-Südharz zur Berechnung von R-Faktoren vorgestellt. Mit Regressionsgleichung 1 wird ähnlich der Ländergleichung, jedoch auf Grundlage von 6 monatlichen Niederschlagsfaktoren, der R-Faktor auf Landkreisebene berechnet. Die Ergebnisse zeigen, dass die Gleichung eine höhere Genauigkeit aufweist als die DIN-Gleichung für Sachsen-Anhalt. Mit Regressionsgleichung 2 wird auf Grundlage von monatlichen Niederschlagsänderungsfaktoren die Zu- bzw. Abnahme des R-Faktors ermittelt. Die Gleichung wird speziell für die Betrachtung des Klimawandels eingesetzt. Die Validierung anhand von Änderungssignalen eines regionalen Klimamodellensembles des RCP8.5-Szenarios zeigt eine hohe Modellgüte mit einer mittleren Abweichung vom DIN-R-Faktor in der Nahen und Fernen Zukunft von etwa 1 % und einem Korrelationskoeffizienten von größer 0,9. The R-factor as a measure of the erosivity of precipitation events is used to quantify soil losses using the Universal Soil Loss Equation (USLE). The calculation of the exact R-factor requires precipitation data with a high temporal resolution, which are usually not available widely. Due to this, regression models, such as the German Federal State related equation of DIN 19708:2017-08 – "Soil quality – Predicting soil erosion
- Published
- 2022
11. On data-driven nonlinear uncertainty modeling: Methods and application for control-oriented surface condition prediction in hard turning
- Author
-
Christopher Schott, Andreas Kroll, Thomas Niendorf, Lars Kistner, and Felix Wittich
- Subjects
Surface (mathematics) ,0209 industrial biotechnology ,Computer science ,Gauß-Prozess ,02 engineering and technology ,Modell ,Data-driven ,020901 industrial engineering & automation ,Control oriented ,Kriging ,Control theory ,0502 economics and business ,Electrical and Electronic Engineering ,uncertainty ,Regressionsmodell ,Unsicherheit ,Instrumentation ,05 social sciences ,Gaußprozessregression ,Nonlinear system ,Takagi-Sugeno-Regler ,hard turning ,Uncertainty modeling ,Takagi-Sugeno-Modelle ,Hartdrehen ,Takagi Sugeno model ,Gaussian process regression ,050203 business & management - Abstract
In this article, two data-driven modeling approaches are investigated, which allow an explicit modeling of uncertainty. For this purpose, parametric Takagi-Sugeno multi-models with bounded-error parameter estimation and nonparametric Gaussian process regression are applied and compared. These models can for instance be used for robust model-based control design. As an application, the prediction of residual stresses during hard turning depending on the machining parameters and the initial hardness is considered.
- Published
- 2020
12. A comparative view on statistical matching
- Author
-
Borsi, Lisa
- Subjects
Amtliche Statistik ,Umfrage ,Statistik ,Matching ,Regressionsmodell - Abstract
Statistical matching offers a way to broaden the scope of analysis without increasing respondent burden and costs. These would result from conducting a new survey or adding variables to an existing one. Statistical matching aims at combining two datasets A and B referring to the same target population in order to analyse variables, say Y and Z, together, that initially were not jointly observed. The matching is performed based on matching variables X that correspond to common variables present in both datasets A and B. Furthermore, Y is only observed in B and Z is only observed in A. To overcome the fact that no joint information on X, Y and Z is available, statistical matching procedures have to rely on suitable assumptions. Therefore, to yield a theoretical foundation for statistical matching, most procedures rely on the conditional independence assumption (CIA), i.e. given X, Y is independent of Z. The goal of this thesis is to encompass both the statistical matching process and the analysis of the matched dataset. More specifically, the aim is to estimate a linear regression model for Z given Y and possibly other covariates in data A. Since the validity of the assumptions underlying the matching process determine the validity of the obtained matched file, the accuracy of statistical inference is determined by the suitability of the assumptions. By putting the focus on these assumptions, this work proposes a systematic categorisation of approaches to statistical matching by relying on graphical representations in form of directed acyclic graphs. These graphs are particularly useful in representing dependencies and independencies which are at the heart of the statistical matching problem. The proposed categorisation distinguishes between (a) joint modelling of the matching and the analysis (integrated approach), and (b) matching subsequently followed by statistical analysis of the matched dataset (classical approach). Whereas the classical approach relies on the CIA, implementations of the integrated approach are only valid if they converge, i.e. if the specified models are identifiable and, in the case of MCMC implementations, if the algorithm converges to a proper distribution. In this thesis an implementation of the integrated approach is proposed, where the imputation step and the estimation step are jointly modelled through a fully Bayesian MCMC estimation. It is based on a linear regression model for Z given Y and accounts for both a linear regression model and a random effects model for Y. Furthermore, it yields its validity when the instrumental variable assumption (IVA) holds. The IVA corresponds to: (a) Z is independent of a subset X’ of X given Y and X*, where X* = X\X’ and (b) Y is correlated with X’ given X*. The proof, that the joint Bayesian modelling of both the model for Z and the model for Y through an MCMC simulation converges to a proper distribution is provided in this thesis. In a first model-based simulation study, the proposed integrated Bayesian procedure is assessed with regard to the data situation, convergence issues, and underlying assumptions. Special interest lies in the investigation of the interplay of the Y and the Z model within the imputation process. It turns out that failure scenarios can be distinguished by comparing the CIA and the IVA in the completely observed dataset. Finally, both approaches to statistical matching, i.e. the classical approach and the integrated approach, are subject to an extensive comparison in (1) a model-based simulation study and (2) a simulation study based on the AMELIA dataset, which is an openly available very large synthetic dataset and, by construction, similar to the EU-SILC survey. As an additional integrated approach, a Bayesian additive regression trees (BART) model is considered for modelling Y. These integrated procedures are compared to the classical approach represented by predictive mean matching in the form of multiple imputations by chained equation. Suitably chosen, the first simulation framework offers the possibility to clarify aspects related to the underlying assumptions by comparing the IVA and the CIA and by evaluating the impact of the matching variables. Thus, within this simulation study two related aspects are of special interest: the assumptions underlying each method and the incorporation of additional matching variables. The simulation on the AMELIA dataset offers a close-to-reality framework with the advantage of knowing the whole setting, i.e. the whole data X, Y and Z. Special interest lies in investigating assumptions through adding and excluding auxiliary variables in order to enhance conditional independence and assess the sensitivity of the methods to this issue. Furthermore, the benefit of having an overlap of units in data A and B for which information on X, Y, Z is available is investigated. It turns out that the integrated approach yields better results than the classical approach when the CIA clearly does not hold. Moreover, even when the classical approach obtains unbiased results for the regression coefficient of Y in the model for Z, it is the method relying on BART that over all coefficients performs best. Concluding, this work constitutes a major contribution to the clarification of assumptions essential to any statistical matching procedure. By introducing graphical models to identify existing approaches to statistical matching combined with the subsequent analysis of the matched dataset, it offers an extensive overview, categorisation and extension of theory and application. Furthermore, in a setting where none of the assumptions are testable (since X, Y and Z are not observed together), the integrated approach is a valuable asset by offering an alternative to the CIA.
- Published
- 2022
- Full Text
- View/download PDF
13. Transformationen in statistischen Modellen
- Author
-
Handl, Andreas, Müller, Werner A., editor, and Neck, Reinhard, editor
- Published
- 1996
- Full Text
- View/download PDF
14. Basiskarte: Grundzüge der Statistik
- Author
-
Rogge, Klaus-Eckart and Rogge, Klaus-Eckart, editor
- Published
- 1995
- Full Text
- View/download PDF
15. Untersuchung der Aderhautdicke bei aggressiver posteriorer Retinopathia praematurorum, Threshold Disease und Frühgeborenenretinopathie ohne Laserphotokoagulation.
- Author
-
Gökgöz-Özisik, G., Akkoyun, Imren, Oto, S., Bayar, S.A., Tarcan, A., Kayhan, Z., and Yilmaz, G.
- Abstract
Copyright of Der Ophthalmologe is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2016
- Full Text
- View/download PDF
16. Methodenbaukasten zur Quantifizierung der statistischen Güte und deren Sensitivität von Last- und Verschleißanalysen mit einem Beispiel im Kontext alternativer Antriebskonzepte
- Author
-
Lehmann, Thomas, Weihs, Claus, and Müller, Christine
- Subjects
Sensitivitätsanalyse ,Prognose ,Lebensdauer ,Cluster-Analyse ,Batterie ,Clustering ,Güte ,Regressionsmodell ,Prognosemodell - Abstract
Die vorliegende Arbeit wurde im Rahmen einer Industriepromotion bei der Daimler AG in Sindelfingen erstellt. Sie umfasst die Entwicklung und Beschreibung eines statistischen Methodenbaukastens um Last- und Verschleißanalysen prozessual durchführen zu können. Dieser Methodenbaukasten wird an Daten im Kontext alternativer Antriebssysteme beispielhaft erprobt. Der methodische Fokus liegt auf der Quantifizierung und Sensitivität der Güte bzw. Unsicherheit auf den einzelnen Analysestufen. Die erste Analysestufe beinhaltet die Identifizierung verschiedener Gruppen in Belastungsdaten, umgesetzt durch Clusterverfahren. Auf der zweiten Analysestufe sollen über verschiedene lineare und nichtlineare Verfahren Vorhersagen für das Verschleißverhalten der identifizierten Gruppen getroffen werden. Auf beiden Stufen soll sowohl die Güte des Verfahrens als auch dessen Sensitivität quantifiziert werden. Im Rahmen der Arbeit werden alle notwendigen statistischen Methoden definiert, die entsprechenden Gütekriterien werden eingeführt. Der Methodenbaukasten beinhaltet einen iterativen Prozess, in dem in jeder Iteration sowohl das Clustering als auch die Prognose durchgeführt wird. So kann zum einen in jedem Schritt die Güte des jeweiligen Verfahrens und zum anderen die Sensitivität der Güte bzw. Unsicherheit der Verfahren/Modelle über mehrere Iterationen quantifiziert und bewertet werden. Der entwickelte, iterative Prozess, integriert in den Algorithmus des Evidence Accumulation Clusterings, bietet dem Anwender entscheidende methodische Vorteile. Zum einen kann in jedem Schritt die Güte und dessen Sensitivität des jeweiligen Verfahrens bewertet werden, zum anderen wird über die gleichzeitige Durchführung aller Verfahren in jeder Iteration beides über die Analysestufen hin weg quantifiziert. Im Anwendungsbeispiel werden Potentiale aufgezeigt, die Güte der Modelle zu steigern sowie die Sensitivität zu verringern, indem sowohl die Variablenselektion für die Lastanalyse als auch die Modellauswahl für die Verschleißprognose prozessual durchgeführt wird. Der entwickelte Prozess bietet die Möglichkeit, die Qualität und Stabilität der durchgeführten Analyse bereits zu frühen Zeitpunkten (geringe Datenbasis) zu bewerten und ggf. Handlungsmaßnahmen abzuleiten.
- Published
- 2020
17. Analyzing consistency and statistical inference in Random Forest models
- Author
-
Ramosaj, Burim, Pauly, Markus, and Rahnenführer, Jörg
- Subjects
Automatische Klassifikation ,Random Forest ,Missing value imputation ,Partielle Information ,Industrial application ,Consistency ,Regressionsmodell ,Statistical inference ,Uncertainty quantification ,Prediction intervals - Abstract
This thesis pays special attention to the Random Forest method as an ensemble learning technique using bagging and feature sub-spacing covering three main aspects: its behavior as a prediction tool under the presence of missing values, its role in uncertainty quantification and variable screening. In the first part, we focus on the performance of Random Forest models in prediction and missing value imputations while opposing it to other learning methods such as boosting procedures. Therein, we aim to discover potential modifications of Breiman’s original Random Forest in order to increase imputation performance of Random Forest based models using the normalized root mean squared error and the proportion of false classification as evaluation measures. Our results indicated the usage of a mixed model involving the stochastic gradient boosting and a Random Forest based on kernel sampling. Regarding inferential statistics after imputation, we were interested if Random Forest methods do deliver correct statistical inference procedures, especially in repeated measures ANOVA. Our results indicated a heavy inflation of type-I-error rates for testing no mean time effects. We could furthermore show that the between imputation variance according to Rubin’s multiple imputation rule vanishes almost surely, when repeatedly applying missForest as an imputation scheme. This has the consequence of less uncertainty quantification during imputation leading to scenarios where imputations are not proper. Closely related to the issue of valid statistical inference is the general topic of uncertainty quantification. Therein, we focused on consistency properties of several residual variance estimators in regression models and could deliver theoretical guarantees that Random Forest based estimators are consistent. Beside prediction, Random Forest is often used as a screening method for selecting informative features in potentially high-dimensional settings. Focusing on regression problems, we could deliver a formal proof that the Random Forest based internal permutation importance measure delivers on average correct results, i.e. is (asymptotically) unbiased. Simulation studies and real-life data examples from different fields support our findings in this thesis.
- Published
- 2020
- Full Text
- View/download PDF
18. Subgroup analyses and investigations of treatment effect heterogeneity in clinical dose-finding trials
- Author
-
Thomas, Marius, Ickstadt, Katja, and Rahnenführer, Jörg
- Subjects
Selection bias ,Resampling ,Regression trees ,Stichprobe ,Bayesian hierarchical models ,Bias ,Dose-response models ,Arzneimittelentwicklung ,Multiple testing ,Dosis-Wirkungs-Beziehung ,Regressionsmodell - Abstract
Identifying subgroups, which respond differently to a treatment is an important part of drug development. Exploratory subgroup analyses, which have the aim to identify subgroups of patients with differential treatment effects are thus common in many randomized clinical trials. Statistically these analyses are known to be challenging the number of possible subgroups is often large, which leads to multiplicity issues. Often such subgroup analyses are also performed for early phase clinical trials, where an additional challenge is the small sample size. In recent years several statistical approaches to these problems have been proposed, employing for example tree-based recursive partitioning algorithms, which are well-suited for handling interactions, penalized regression methods, which can be used to prevent overfitting when explicitly modeling a large number of covariate effects or Bayesian approaches, which allow incorporating uncertainty and can be used to make optimal decisions with regard to subgroups. The available literature focuses however on two-arm clinical trials, where patients are randomized to the experimental treatment or a control (e.g. current standard of care or placebo). A particular focus of this cumulative thesis is the development of statistical methodology for identification of subgroups in dose-finding trials, in which patients are administered several doses of a new drug. Dose-finding trials play a key role in the drug development process, since they provide valuable information about the effect of the dose on efficacy and safety. For identifying subgroups in this setting we consider the treatment effect to be a function of the dose and then try to identify relevant covariate effects on this treatment effect curve. These identified covariates can then be used to define subgroups with higher treatment effects but also subgroups, which require a different dose of the treatment. We propose two different approaches for this purpose. Firstly, a tree-based recursive partitioning algorithm, which detects covariate effects on the parameters of dose-response models and builds a tree of subgroups with different dose-response curves. Secondly, a Bayesian hierarchical model, which makes use of shrinkage priors to prevent overfitting in the considered settings with low sample sizes and a large number of considered covariates. In addition to approaches for subgroup identification we also consider the problem of testing a prespecified subgroup in addition to the full population in dose-finding trials. In a dose-finding setting contrast tests are often used to test for a significant dose-response signal, while taking the underlying dose-response relationship into account. Optimal contrast tests can be derived, when the underlying dose-response model is known, however often there is uncertainty about this underlying model. Testing procedures, which allow for uncertainty with regard to the underlying model and perform multiple contrast tests are therefore popular approaches in such settings. As a part of this thesis we extend such approaches to settings with multiple populations, in particular the situation, in which a prespecified subgroup is considered in addition to the full population. A last part of this cumulative thesis focuses on treatment effect estimation in identified subgroups. Naive treatment effect estimates in subgroups will often suffer from selection bias, especially when the number of considered subgroups is large. Several approaches to obtain adjusted treatment effect estimates in such situations have been proposed, using resampling, model averaging or penalized regression. We compare these approaches in an extensive simulation study for a large range of scenarios, in which such analyses are performed.
- Published
- 2019
- Full Text
- View/download PDF
19. Regularization Methods for Statistical Modelling in Small Area Estimation
- Author
-
Krause, Joscha
- Subjects
regression model ,estimation ,Stichprobe ,Regressionsmodell ,sample ,Schätzung - Abstract
Die vorgelegte Dissertation trägt den Titel Regularization Methods for Statistical Modelling in Small Area Estimation. In ihr wird die Verwendung regularisierter Regressionstechniken zur geographisch oder kontextuell hochauflösenden Schätzung aggregatspezifischer Kennzahlen auf Basis kleiner Stichproben studiert. Letzteres wird in der Fachliteratur häufig unter dem Begriff Small Area Estimation betrachtet. Der Kern der Arbeit besteht darin die Effekte von regularisierter Parameterschätzung in Regressionsmodellen, welche gängiger Weise für Small Area Estimation verwendet werden, zu analysieren. Dabei erfolgt die Analyse primär auf theoretischer Ebene, indem die statistischen Eigenschaften dieser Schätzverfahren mathematisch charakterisiert und bewiesen werden. Darüber hinaus werden die Ergebnisse durch numerische Simulationen veranschaulicht, und vor dem Hintergrund empirischer Anwendungen kritisch verortet. Die Dissertation ist in drei Bereiche gegliedert. Jeder Bereich behandelt ein individuelles methodisches Problem im Kontext von Small Area Estimation, welches durch die Verwendung regularisierter Schätzverfahren gelöst werden kann. Im Folgenden wird jedes Problem kurz vorgestellt und im Zuge dessen der Nutzen von Regularisierung erläutert. Das erste Problem ist Small Area Estimation in der Gegenwart unbeobachteter Messfehler. In Regressionsmodellen werden typischerweise endogene Variablen auf Basis statistisch verwandter exogener Variablen beschrieben. Für eine solche Beschreibung wird ein funktionaler Zusammenhang zwischen den Variablen postuliert, welcher durch ein Set von Modellparametern charakterisiert ist. Dieses Set muss auf Basis von beobachteten Realisationen der jeweiligen Variablen geschätzt werden. Sind die Beobachtungen jedoch durch Messfehler verfälscht, dann liefert der Schätzprozess verzerrte Ergebnisse. Wird anschließend Small Area Estimation betrieben, so sind die geschätzten Kennzahlen nicht verlässlich. In der Fachliteratur existieren hierfür methodische Anpassungen, welche in der Regel aber restriktive Annahmen hinsichtlich der Messfehlerverteilung benötigen. Im Rahmen der Dissertation wird bewiesen, dass Regularisierung in diesem Kontext einer gegen Messfehler robusten Schätzung entspricht - und zwar ungeachtet der Messfehlerverteilung. Diese Äquivalenz wird anschließend verwendet, um robuste Varianten bekannter Small Area Modelle herzuleiten. Für jedes Modell wird ein Algorithmus zur robusten Parameterschätzung konstruiert. Darüber hinaus wird ein neuer Ansatz entwickelt, welcher die Unsicherheit von Small Area Schätzwerten in der Gegenwart unbeobachteter Messfehler quantifiziert. Es wird zusätzlich gezeigt, dass diese Form der robusten Schätzung die wünschenswerte Eigenschaft der statistischen Konsistenz aufweist. Das zweite Problem ist Small Area Estimation anhand von Datensätzen, welche Hilfsvariablen mit unterschiedlicher Auflösung enthalten. Regressionsmodelle für Small Area Estimation werden normalerweise entweder für personenbezogene Beobachtungen (Unit-Level), oder für aggregatsbezogene Beobachtungen (Area-Level) spezifiziert. Doch vor dem Hintergrund der stetig wachsenden Datenverfügbarkeit gibt es immer häufiger Situationen, in welchen Daten auf beiden Ebenen vorliegen. Dies beinhaltet ein großes Potenzial für Small Area Estimation, da somit neue Multi-Level Modelle mit großem Erklärungsgehalt konstruiert werden können. Allerdings ist die Verbindung der Ebenen aus methodischer Sicht kompliziert. Zentrale Schritte des Inferenzschlusses, wie etwa Variablenselektion und Parameterschätzung, müssen auf beiden Levels gleichzeitig durchgeführt werden. Hierfür existieren in der Fachliteratur kaum allgemein anwendbare Methoden. In der Dissertation wird gezeigt, dass die Verwendung ebenenspezifischer Regularisierungsterme in der Modellierung diese Probleme löst. Es wird ein neuer Algorithmus für stochastischen Gradientenabstieg zur Parameterschätzung entwickelt, welcher die Informationen von allen Ebenen effizient unter adaptiver Regularisierung nutzt. Darüber hinaus werden parametrische Verfahren zur Abschätzung der Unsicherheit für Schätzwerte vorgestellt, welche durch dieses Verfahren erzeugt wurden. Daran anknüpfend wird bewiesen, dass der entwickelte Ansatz bei adäquatem Regularisierungsterm sowohl in der Schätzung als auch in der Variablenselektion konsistent ist. Das dritte Problem ist Small Area Estimation von Anteilswerten unter starken verteilungsbezogenen Abhängigkeiten innerhalb der Kovariaten. Solche Abhängigkeiten liegen vor, wenn eine exogene Variable durch eine lineare Transformation einer anderen exogenen Variablen darstellbar ist (Multikollinearität). In der Fachliteratur werden hierunter aber auch Situationen verstanden, in welchen mehrere Kovariate stark korreliert sind (Quasi-Multikollinearität). Wird auf einer solchen Datenbasis ein Regressionsmodell spezifiziert, dann können die individuellen Beiträge der exogenen Variablen zur funktionalen Beschreibung der endogenen Variablen nicht identifiziert werden. Die Parameterschätzung ist demnach mit großer Unsicherheit verbunden und resultierende Small Area Schätzwerte sind ungenau. Der Effekt ist besonders stark, wenn die zu modellierende Größe nicht-linear ist, wie etwa ein Anteilswert. Dies rührt daher, dass die zugrundeliegende Likelihood-Funktion nicht mehr geschlossen darstellbar ist und approximiert werden muss. Im Rahmen der Dissertation wird gezeigt, dass die Verwendung einer L2-Regularisierung den Schätzprozess in diesem Kontext signifikant stabilisiert. Am Beispiel von zwei nicht-linearen Small Area Modellen wird ein neuer Algorithmus entwickelt, welche den bereits bekannten Quasi-Likelihood Ansatz (basierend auf der Laplace-Approximation) durch Regularisierung erweitert und verbessert. Zusätzlich werden parametrische Verfahren zur Unsicherheitsmessung für auf diese Weise erhaltene Schätzwerte beschrieben. Vor dem Hintergrund der theoretischen und numerischen Ergebnisse wird in der Dissertation demonstriert, dass Regularisierungsmethoden eine wertvolle Ergänzung der Fachliteratur für Small Area Estimation darstellen. Die hier entwickelten Verfahren sind robust und vielseitig einsetzbar, was sie zu hilfreichen Werkzeugen der empirischen Datenanalyse macht.
- Published
- 2019
- Full Text
- View/download PDF
20. Nonparametric least squares estimation in integer-valued GARCH models
- Author
-
Wechsung, Maximilian
- Subjects
010104 statistics & probability ,GARCH-Prozess ,Methode der kleinsten Quadrate ,010102 general mathematics ,0101 mathematics ,Regressionsmodell ,01 natural sciences - Abstract
In this thesis we consider Poisson regression models for count data. Suppose we observe a time series of count variables. Given the information about the past, each count variable has a Poisson distribution with a random intensity. The time series of intensities is unobservable, but we impose a functional relationship between the current intensity and the preceding pair of intensity and count observation. In the literature some consideration has been given to parametric models of the linear INGARCH(1,1) type or more involved ones like the log linear model. In these cases √n-consistency of the partial maximum likelihood estimator has been proven. Suppose that the relationship between a count variable and the respectively preceding pair of count and intensity variables is given by a link function that cannot be characterized by a finite-dimensional parameter. We call this model a nonparametric integer valued GARCH model. In order to obtain a suitable estimation equation in this nonparametric model, a contractive condition has to be imposed on the true link function. We analyze the rate of convergence of a least squares estimator that is inspired by the work of Meister and Kreiß (2016). We prove uniform mixing of the univariate count process and use the derived properties to apply some classical tools from empirical process theory. The size of the class of admissible functions determines the rate of convergence, which is a common property of nonparametric models. Since this estimator is computationally rather impractical, we also analyze the behavior of an approximate least squares estimator. In contrast to the analysis of the first estimator, the examination of the estimators asymptotic quality is based on the exploitation of martingale properties instead of mixing. The approximate least squares estimator is indeed computable, and we take the opportunity to conduct experiments to illustrate the proposed statistical procedure. An exposition of the experimental results will conclude this thesis.
- Published
- 2019
- Full Text
- View/download PDF
21. Hur mäter vi det omätbara?
- Author
-
Tenggren, Johanna, Tran, Tonny, Tenggren, Johanna, and Tran, Tonny
- Abstract
Fastigheter beläggs med olika pris beroende på en mängd olika faktorer. Denna uppsats syftartill att analysera hur några av dessa prispåverkande faktorer och hur de förhåller sig tillsmåhusfastigheter i Helsingborg. Utöver detta kommer även en faktor, kallad njutningsfaktorn,analyseras för att försöka fastställa hur individers preferenser påverkar värdet. Analysenbaseras på statistiska underlag som kommer att behandlas med hjälp av den hedoniskaprismodellen. Bid-rent modellen kommer att appliceras på staden Helsingborg och dessområden för att skapa en bild av lägesfaktorn. En fördjupning i psykologi och urban ekonomikommer att bidra till analysen av både fysiska och psykologiska aspekter. Resultaten vi fåttfram är att det inte enbart kan tas hänsyn till fysiska aspekter i förhållande till pris på fastigheterutan det är även viktigt att behandla de psykologiska aspekterna för varje individ., Different real estates have different value, depending upon several factors. This essay aims toanalyse some of these values bearing factors and how they relate to properties in Helsingborg.Beside these factors another factor, called the pleasure factor, will be analysed in an attempt todetermine how individual preferences affects the value. The analysis will be based on statisticmaterial that will be processed with the hedonic price model. The bid-rent model will beapplied to the city and to its areas, to help create an understanding of the location factor. Adepression of psychology and urban economics will contribute to both physical andpsychological aspects of the analysis. The results that will be presented will show that inconsideration to price we can't just tend to the physical aspects but must also consider thepsychological aspects for each individual.
- Published
- 2018
22. Standzeitenanalyse von Elektrorollern im Free-Floating-Sharing-System in Berlin
- Author
-
Klinke, Sigbert, Härdle, Wolfgang, Lopez Cabrera, Brenda, Vogel, Mareike, Klinke, Sigbert, Härdle, Wolfgang, Lopez Cabrera, Brenda, and Vogel, Mareike
- Abstract
Im Zentrum dieser Arbeit steht die Untersuchung der Standzeiten von Elektrorollern, welche sich in einem Free-Floating-Sharing-System in Berlin befinden, und anhand von verschiedenen Faktoren betrachtet werden soll. Anhand der Aufstellung verschiedener Regressionsmodelle soll der Einfluss von unter anderem meteorologischen und sozioökonomischen Faktoren auf die Wartezeit eines Rollers dargestellt werden., The following thesis includes a non-deployment analysis of electric scooters in a free-floating-sharing-system in Berlin. The influence of various factors such as meteorological and socioeconomic parameters will be used to establish several regressions models.
- Published
- 2018
23. The effects of local authority fiscal decisions on population levels in urban areas.
- Author
-
Cuthbertson, Keith, Foreman-Peck, James, and Gripaios, Peter
- Abstract
Cuthbertson K., Foreman-Peck J. and Gripaios P. (1982) The effects of local authority fiscal decisions on population levels in urban areas, Reg. Studies 16, 165–71. The possible effects of local authority tax and expenditure decisions on population levels in local authority jurisdictions have largely been ignored in the UK, despite both theoretical and empirical work in the USA which suggests that such effects could well be important. This paper examines whether discriminatory local fiscal policies are indeed an important determinant of borough population levels in the UK, by first presenting a simple model of population determination and then testing it with 1971 cross section data for the thirty-two London boroughs. The results suggest that both expenditure and tax policies do have important effects on population levels, the composite effects depending on the extent to which expenditure is financed from domestic rates. [ABSTRACT FROM PUBLISHER]
- Published
- 1982
- Full Text
- View/download PDF
24. A statistical approach to the analysis of phenomena of frequency potentiation of isolated myocardial strips.
- Author
-
Pfeiffer, K. and Kenner, T.
- Abstract
Copyright of Basic Research in Cardiology is the property of Springer Nature and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 1983
- Full Text
- View/download PDF
25. Standzeitenanalyse von Elektrorollern im Free-Floating-Sharing-System in Berlin
- Author
-
Vogel, Mareike, Klinke, Sigbert, Härdle, Wolfgang, and Lopez Cabrera, Brenda
- Subjects
Standzeitenanalyse ,Cox-Regression ,Sharing ,Regression Modell ,ddc:004 ,Regressionsmodell ,Non-deployment analysis ,004 Datenverarbeitung ,Informatik - Abstract
Im Zentrum dieser Arbeit steht die Untersuchung der Standzeiten von Elektrorollern, welche sich in einem Free-Floating-Sharing-System in Berlin befinden, und anhand von verschiedenen Faktoren betrachtet werden soll. Anhand der Aufstellung verschiedener Regressionsmodelle soll der Einfluss von unter anderem meteorologischen und sozioökonomischen Faktoren auf die Wartezeit eines Rollers dargestellt werden., The following thesis includes a non-deployment analysis of electric scooters in a free-floating-sharing-system in Berlin. The influence of various factors such as meteorological and socioeconomic parameters will be used to establish several regressions models.
- Published
- 2018
- Full Text
- View/download PDF
26. Local Optimization and Complexity Control for Symbolic Regression
- Author
-
Kommenda, Michael
- Subjects
Genetische Programmierung ,Regressionsmodell ,Pareto-Verteilung ,Levenberg-Marquardt-Algorithmus - Abstract
eingereicht von Michael Kommenda Universität Linz, Dissertation, 2018
- Published
- 2018
27. Alternative Verfahren zur fokussierten Modellwahl in Regressionsmodellen
- Author
-
Behl, Peter (Dipl.)
- Subjects
Modellwahl ,Statistisches Modell ,Statistik ,ddc:510 ,Regressionsmodell ,Quantilfunktion - Abstract
Die Wahl eines geeigneten Modells ist in vielen statistischen Anwendungen von entscheidender Bedeutung. Eine Möglichkeit zur Lösung dieses Problems stellen sogenannte Informationskriterien wie zum Beispiel AIC und BIC dar. Eine Gemeinsamkeit der meisten dieser Kriterien besteht darin, dass unabhängig vom Ziel der Datenanalyse jedem zur Wahl stehenden Modell eine Kennzahl zugewiesen wird, anhand derer die Güte der Anpassung des Modells an die Daten oder die Nähe des Modells zum unbekannten datenerzeugenden Mechanismus beurteilt wird. Einen anderen Ansatz verfolgt das fokussierte Modellwahlkriterium (FIC), das explizit darauf abzielt, ein Modell zu wählen, mit dem ein spezieller Fokusparameter so präzise wie möglich geschätzt werden kann. In dieser Arbeit wird ein solches FIC für Quantilsregressionsmodelle hergeleitet. Darüber hinaus wird eine alternative Variante des FIC vorgeschlagen, die anders als das klassische FIC nicht auf der Annahme lokaler Alternativen basiert.
- Published
- 2017
28. Improving and validating data-driven genotypic interpretation systems for the selection of antiretroviral therapies
- Author
-
Pironti, Alejandro and Lengauer, Thomas
- Subjects
Multidrug-Resistenz ,drug resistance ,Antiretrovirale Substanz ,Resistenz ,antiretroviral therapy ,HIV ,Resistenzbestimmung ,HIV-Infektion ,Kombinationstherapie ,statistical learning ,ddc:004 ,ddc:620 ,Regressionsmodell ,right-censored data - Abstract
Infection with Human immunodeficiency vir type 1 (HIV-1) requires treatment with a combination of antiretroviral drugs. This combination of drugs must be selected under consideration of its prospects for attaining sustained therapeutic success. Genotypic therapy-success interpretation systems can be used for selecting a combination of antiretroviral compounds. However, a number of shortcomings of these systems have prevented them from reaching the bedside. In this work, I present and validate novel methods for deriving interpretable genotype interpretation systems that are trained on HIV-1 data from routine clinical practice. One method produces scores that are correlated with previous exposure of the virus to the drug and with drug resistance. A further, novel genotype interpretation system produces a prognostic score correlated with the time for which the antiretroviral therapy with a certain drug combination will remain effective. The methods presented in this work represent an important advance in techniques for the interpretation of viral genotypes. Validation of the methods shows that their performance is comparable or, most frequently, superior to that of previously available methods. The methods are interpretable and can be retrained without the need for expert intervention. Last but not least, long-term therapeutic success is considered by the methods such that their predictions are in line with the results of clinical studies. Eine Infektion mit dem Humanen Immunodefizienz-Virus Typ 1 (HIV-1) erfordert die Behandlung des Patienten mit einer Kombination von antiretroviralen Wirkstoffen. Die Auswahl dieser Wirkstoffkombination muss unter Berücksichtigung der Aussichten für einen lang anhaltenden Behandlungserfolg stattfinden. Bei der Auswahl von Wirkstoffkombinationen können Systeme zur Vorhersage des Behandlungserfolgs eingesetzt werden. Bisher verfügbare Systeme weisen jedoch mehrere Defizite auf, sodass sie in der klinischen Praxis kaum Verwendung finden. In dieser Arbeit werden neuartige Methoden zur Aufstellung von Systemen zur Genotypinterpretation präsentiert und validiert. Eine dieser Methoden bewertet einen HIV-1-Genotyp bezüglich der vorhergehenden viralen Wirkstoffexposition und der Wirkstoffresistenzen. Eine weitere Genotypinterpretationsmethode errechnet eine prognostische Zahl, welche mit der Zeit korreliert, die eine antiretrovirale Therapie effektiv sein wird. Diese Arbeit stellt eine wichtige Weiterentwicklung der Methoden zur Interpretation von viralen Genotypen dar. Zum Einen ist das Vorhersagemögen der Modelle dieser Arbeit vergleichbar oder sogar höher als diejenige von bisher verfügbaren Modellen. Zum Anderen sind die Modelle dieser Arbeit interpretierbar und können ohne Expertensupervision neu trainiert werden. Darüber hinaus berücksichtigen die Methoden den Langzeittherapieerfolg, sodass ihre Vorhersagen mit den Ergebnissen klinischer Studien übereinstimmen.
- Published
- 2016
- Full Text
- View/download PDF
29. Statistische Modellierung von Klimasimulationsergebnissen zur Berechnung der zugehörigen Strahlungswirkung
- Author
-
Koopmans, Sabrina
- Subjects
Institut für Physik der Atmosphäre ,Hauptkomponentenanalyse ,Erdsystem-Modellierung ,Variabilität ,Klimasimulation ,statistische Signifikanz ,Regressionsmodell ,Mittelwert ,Hypothesentest - Abstract
For many studies in climate science a major part of the experimental concept is the comparison of two or more simulations to answer the question: Is there a difference? Depending on the simulation setup and results different procedures have been developed and put to use over the last decades. Now more than ever due to the extensive production of huge datasets, more sophisticated question can be asked and need to be answered. This work will give an overview of the difficulties involved in providing answers, shortly reviews some of the existing methodology and proposes some method for further study. The main part consists of the application of three selected evaluation methods, univariate t-test, principal component analysis and regression models to a specified dataset, which will illustrate the strengths and weaknesses of each. Concluding this work, several recommendations will be given for a statistically sound evaluation strategy depending on the questions asked and datasets produced.
- Published
- 2016
- Full Text
- View/download PDF
30. Modeling of Gibbs energies of pure elements down to 0K using segmented regression
- Author
-
Roslyakova, Irina, Sundmann, Bo, Dette, Holger, Zhang, Lijun, and Steinbach, Ingo
- Subjects
Eisen ,Chrom ,Aluminium ,Regressionsmodell ,Thermodynamische Eigenschaft - Abstract
A novel thermodynamic modeling strategy of stable solid alloy phases is proposed based on segmented regression approach. The model considers several physical effects (e.g. electronic, vibrational etc.) and is valid from 0K up to the melting temperature. The preceding approach has been applied for several pure elements. Results show good agreement with experimental data at low and high temperatures. Since it is not a first attempt to propose a "universal" physical-based model down to 0K for the pure elements as an alternative to current SGTE description, we also compare the results to existing models. Analysis of the obtained results shows that the newly proposed model delivers more accurate description down to 0K for all studied pure elements according to several statistical tests., Discussion Paper / SFB823;34, 2016
- Published
- 2016
- Full Text
- View/download PDF
31. Trend analysis of climate indicators by regression methods
- Author
-
Westerlund, Elisabeth
- Subjects
regressionsmodell ,räknedata ,regressionsanalys - Abstract
The discussion about climate change and how it affects the earth has existed for years and is still ongoing. The European Climate & Assessment Project conveys data related to climate, which has been used in this thesis to investigate climate changes. The aim of this thesis was to investigate trends in time series for specific indicators and stations. The climate indicator Consecutive Summer Days was chosen and the stations Stockholm and Munich were investigated. The main focus has been on the statistics used in this thesis to investigate the aim of the study. Conclusions regarding an appropriate distribution for the data and independence in the explanatory variable were necessary to conclude with statistical methodology. To reach the conclusions the Negative Binomial Distribution was fitted. An assumption about independence in the explanatory variable was also made. Regression modelling could therefore be performed at data to investigate possible trends. The results from the study demonstrate an ascending trend in the chosen indicator in both Stockholm and Munich. This master thesis is a contribution to the climate research. The methodology used and the results gained can be used to support future studies within the climate research or other areas. Data samlas in inom en rad olika samhällsområden. Ett av dessa områden är klimat. Under de senaste åren har diskussionen om klimatförändringars existens och dess påverkan på vår jord varit högst aktuell och intresseväckande. European Climate & Assessment Project förmedlar data kring klimat och deras data har använts i detta arbete för att komma ett steg närmare en sanning kring klimatförändringar. Detta examensarbete är ett bidrag till klimatforskningen. Syftet var att undersöka trender i tidsserier för vald indikator och stationer. Indikatorn Consecutive Summer Days valdes och stationerna Stockholm och München undersöktes. Det största fokuset och tiden i arbetet har lagts på den statistik som använts för att undersöka syftet. För att kunna undersöka trender var slutsats kring lämplig fördelning för data samt oberoende i den förklarande variabeln nödvändigt att säkerställas med statistiska metoder. För att komma fram till slutsatsen anpassades den Negativa Binomialfördelningen. Ett antagande om oberoende i den förklarande variabeln kunde även göras. Regressionsmodeller kunde därmed anpassas på data för att undersöka eventuella trender. Resultaten visade en uppåtgående trend i den valda indikatorn i både Stockholm och München. Det var dock inte möjligt att dra en slutsats kring om denna trend är naturlig eller om den beror på människans konsumtion av jordens resurser. Det var inte heller möjligt att dra en generell slutsats kring klimatförändringar då arbetet enbart undersöker en indikator på två stationer. Metoden som använts och resultaten som genererats kan dock användas som ett stöd i framtida studier inom klimatforskning eller annat intressant område.
- Published
- 2015
32. Drying of Sawdust in Pneumatic Conveying : Practical Measurements and Modeling
- Author
-
Rosberg, Andreas
- Subjects
regressionsmodell ,sågspån ,torkning - Abstract
I Sverige är trädbränslen basen för förnyelsebar energi. Råmaterialet som används till pelletstillverkningen så som sågspån brukar ha en fukthalt på 50 procent. Att torka material som ska användas till att göra pellets är dyrt och en stor del av kostnaden kommer från den energi som används till torkningen. Torkning av hygroskopiska ämnen, som till exempel sågspån, kan delas in i tre steg. Det första torksteget karaktäriseras av att fukttransporten från materialet som ska torkas är konstant. I det andra torksteget börjar fukttransporten att minska då det uppstår torra ytor på materialet och i det tredje torksteget är materialets yta torrt och fukttransporten är som lägst och sker genom diffusion. Genom en kombination av en bandtork och en pneumatisk tork kan torkningen effektiviseras då den pneumatiska torken torkar sågspånet i det sista torksteget där bandtorken blir mindre effektiv. I en pneumatisk tork används uppvärmd luft för att torka sågspånet samtidigt som luften transporterar sågspånet genom torken. På Karlstads Universitet finns det en pneumatisk tork i laborationsskala för torkning av sågspån. I detta arbete gjordes en effektbalans över torken där lufttemperaturen var 150 °C. Effekten som gick åt till att torka sågspånet jämfördes med den avgivna effekten från den uppvärmda luften. Tre olika sorters sågspån användes. Dessa var färskt, uppfuktat samt pressat sågspån. Totalt genomfördes 36 stycken torkkörningar. Effektivitetsmåtten SMER och SPC användes för att jämföra hur torkningen av dessa tre sågspån varierade i effektivitet. En modell byggdes även i beräkningsprogrammet Excel som skulle användas för att beräkna utgående fukthalt hos sågspånet för att underlätta att planera framtida körningar i torken. Det beräknade luftflödet till torken var för lågt och ökades med 12 procent. Detta medför att endast en effektuträkning faller bort då effekten för torkning av sågspån skiljer sig mer än 15 procent från luftens avgivna effekt. SMER är som högst då lufthastigheten är 8 m/s och frekvensen på inmatningsskruven på torken är inställd på 13 Hz samt då lufthastigheten är 12 m/s och frekvensen på inmatningsskruven står på 26 Hz. SPC blir lägst vid en lufthastighet på 6 m/s för båda frekvenserna. Med hjälp av korrigeringsekvationer ger modellen en fukthalt ut på sågspånet som stämmer överens med praktiskt uträknade fukthalter med en noggrannhet på 0,8 procentenheter. Modellen fungerar mellan lufthastigheterna 6-14 m/s, då inmatningsskruven står på 13-26 Hz och startfukthalten hos sågspånet in i torken är 20 procent. Vid en startfukthalt på 20-50 procent hos sågspånet in i torken behövs korrigeringsekvationer som finns för lufthastigheterna 8 och 12 m/s samt vid ett materialflöde på 13 och 26 Hz. SMER för det färska sågspånet har tendenser till att vara lägre än för de andra sorterna. Då begränsat med data finns för torkning av pressat samt färskt sågspån behöver fler körningar göras för dessa sågspån. Om samma mönster upprepas kan det vara idé att undersöka energiflödena närmare vid pressning av sågspån för att se om denna process är mer energieffektiv än om sågspånet inte skulle ha förbehandlats. SPC blir lägre med lägre lufthastighet vilket beror på att med högre lufthastighet måste fläkten som skapar luftflödet jobba mer. Högre torkningstemperatur ger lägre SPC då tryckskillnaden över torken samtidigt blir lägre. Modellen fungerar bra och kan användas för att planera körningar som görs vid 150 °C ifall en fortsatt jämförelse vill göras mellan färskt, pressat samt uppfuktat sågspån. Wood fuels are the foundation for renewable energy in Sweden. The raw material that is used to produce pellets, such as sawdust, usually has a moisture content of 50 percent. Drying material that is used to make pellets is expensive and the energy that is used to dry pellets is a major part of the costs. Drying of hygroscopic substances like sawdust can be divided into three parts. Steady moisture transport from the material that is drying characterizes the first drying part. The second drying part starts when there is a reduced moisture transport due to dry spots occurring on the material and the third drying part is when the moisture transport is at the lowest and transports through diffusion because the surface of the material is dried out. By combining a packed moving bed and a pneumatic dryer the drying can be more efficient because at the last drying part the packed moving bed is less efficient and the pneumatic dryer is used instead. In a pneumatic dryer heated air is used to dry the sawdust at the same time as it transports the sawdust through the dryer. At Karlstads University there is a pneumatic dryer for drying of sawdust for laboratory use. In this thesis an effect balance on the dryer was made when the air temperature was 150 °C. The effect for drying sawdust and the effect that the heated air was emitting to the sawdust was compared. Three different kinds of sawdust were used: fresh, rewetted and pressed sawdust. In total 36 drying tests were made. The performance measurements SMER and SPC were used to compare how the performance changed when drying these three kinds of sawdust. A model to predict the outgoing moisture content of the sawdust was built in the calculation program Excel to simplify future tests of the dryer. The air flow that was calculated for the dryer was too low and was increased with 12 percent. By doing this only one effect balance was needed to be cut out when the effect difference for drying sawdust and the heated air was more than 15 percent. The highest SMER can be found when the air velocity is 8 m/s and the frequency of the feeder on the dryer is 13 Hz, and 12 m/s when the feeder has a frequency of 26 Hz. The lowest SPC can be found when the air velocity is 6 m/s for both frequencies. By using correction equations to the model the outgoing moisture content of the sawdust from practical measurements coincide with the result from the model with 0,8 percent accuracy. The model can be used when the air velocity is between 6-14 m/s, the feeder is at 13-26 Hz and when the initial moisture content of the sawdust being sent into the dryer is 20 percent. When the initial moisture content of the sawdust being sent into the dryer is 20-50 percent, correction equations are needed and available when the air velocity is 8 and 12 m/s, and for a material flow of 13 and 26 Hz. The SMER for fresh sawdust show tendencies of being lower than the SMER for the other two kinds of sawdust. More tests need to be done because of limited data of drying pressed and fresh sawdust. If the same pattern is repeated it may be of interest to study more about the energy flow when pressing sawdust to see if this process is more energy efficient than if the sawdust is not pretreated. The reason SPC is lower with lower air velocity is that the fan needs to work harder when the air flow is rising. SPC drops when the drying temperature is rising because the pressure difference over the fan is lowered. The model works well and can be used to plan tests at 150 °C in case further comparison between fresh, pressed and rewetted sawdust is wanted.
- Published
- 2015
33. Vorhersagemethoden in den Sozialwissenschaften
- Author
-
Ruderstorfer, Sandra Sabine
- Subjects
Sozialwissenschaften ,Prognose ,Modell ,Prognoseverfahren ,Stochastisches Modell ,Regressionsmodell - Abstract
Sandra Ruderstorfer Universität Linz, Univ., Masterarbeit, 2015
- Published
- 2015
34. Trendanalys av klimatdata med regressionsmetoder
- Author
-
Westerlund, Elisabeth and Westerlund, Elisabeth
- Abstract
The discussion about climate change and how it affects the earth has existed for years and is still ongoing. The European Climate & Assessment Project conveys data related to climate, which has been used in this thesis to investigate climate changes. The aim of this thesis was to investigate trends in time series for specific indicators and stations. The climate indicator Consecutive Summer Days was chosen and the stations Stockholm and Munich were investigated. The main focus has been on the statistics used in this thesis to investigate the aim of the study. Conclusions regarding an appropriate distribution for the data and independence in the explanatory variable were necessary to conclude with statistical methodology. To reach the conclusions the Negative Binomial Distribution was fitted. An assumption about independence in the explanatory variable was also made. Regression modelling could therefore be performed at data to investigate possible trends. The results from the study demonstrate an ascending trend in the chosen indicator in both Stockholm and Munich. This master thesis is a contribution to the climate research. The methodology used and the results gained can be used to support future studies within the climate research or other areas., Data samlas in inom en rad olika samhällsområden. Ett av dessa områden är klimat. Under de senaste åren har diskussionen om klimatförändringars existens och dess påverkan på vår jord varit högst aktuell och intresseväckande. European Climate & Assessment Project förmedlar data kring klimat och deras data har använts i detta arbete för att komma ett steg närmare en sanning kring klimatförändringar. Detta examensarbete är ett bidrag till klimatforskningen. Syftet var att undersöka trender i tidsserier för vald indikator och stationer. Indikatorn Consecutive Summer Days valdes och stationerna Stockholm och München undersöktes. Det största fokuset och tiden i arbetet har lagts på den statistik som använts för att undersöka syftet. För att kunna undersöka trender var slutsats kring lämplig fördelning för data samt oberoende i den förklarande variabeln nödvändigt att säkerställas med statistiska metoder. För att komma fram till slutsatsen anpassades den Negativa Binomialfördelningen. Ett antagande om oberoende i den förklarande variabeln kunde även göras. Regressionsmodeller kunde därmed anpassas på data för att undersöka eventuella trender. Resultaten visade en uppåtgående trend i den valda indikatorn i både Stockholm och München. Det var dock inte möjligt att dra en slutsats kring om denna trend är naturlig eller om den beror på människans konsumtion av jordens resurser. Det var inte heller möjligt att dra en generell slutsats kring klimatförändringar då arbetet enbart undersöker en indikator på två stationer. Metoden som använts och resultaten som genererats kan dock användas som ett stöd i framtida studier inom klimatforskning eller annat intressant område.
- Published
- 2015
35. Torkning av sågspån vid pneumatisk transport : Praktiska mätningar och modellering
- Author
-
Rosberg, Andreas and Rosberg, Andreas
- Abstract
I Sverige är trädbränslen basen för förnyelsebar energi. Råmaterialet som används till pelletstillverkningen så som sågspån brukar ha en fukthalt på 50 procent. Att torka material som ska användas till att göra pellets är dyrt och en stor del av kostnaden kommer från den energi som används till torkningen. Torkning av hygroskopiska ämnen, som till exempel sågspån, kan delas in i tre steg. Det första torksteget karaktäriseras av att fukttransporten från materialet som ska torkas är konstant. I det andra torksteget börjar fukttransporten att minska då det uppstår torra ytor på materialet och i det tredje torksteget är materialets yta torrt och fukttransporten är som lägst och sker genom diffusion. Genom en kombination av en bandtork och en pneumatisk tork kan torkningen effektiviseras då den pneumatiska torken torkar sågspånet i det sista torksteget där bandtorken blir mindre effektiv. I en pneumatisk tork används uppvärmd luft för att torka sågspånet samtidigt som luften transporterar sågspånet genom torken. På Karlstads Universitet finns det en pneumatisk tork i laborationsskala för torkning av sågspån. I detta arbete gjordes en effektbalans över torken där lufttemperaturen var 150 °C. Effekten som gick åt till att torka sågspånet jämfördes med den avgivna effekten från den uppvärmda luften. Tre olika sorters sågspån användes. Dessa var färskt, uppfuktat samt pressat sågspån. Totalt genomfördes 36 stycken torkkörningar. Effektivitetsmåtten SMER och SPC användes för att jämföra hur torkningen av dessa tre sågspån varierade i effektivitet. En modell byggdes även i beräkningsprogrammet Excel som skulle användas för att beräkna utgående fukthalt hos sågspånet för att underlätta att planera framtida körningar i torken. Det beräknade luftflödet till torken var för lågt och ökades med 12 procent. Detta medför att endast en effektuträkning faller bort då effekten för torkning av sågspån skiljer sig mer än 15 procent från luftens avgivna effekt. SMER är som högst då lufthast, Wood fuels are the foundation for renewable energy in Sweden. The raw material that is used to produce pellets, such as sawdust, usually has a moisture content of 50 percent. Drying material that is used to make pellets is expensive and the energy that is used to dry pellets is a major part of the costs. Drying of hygroscopic substances like sawdust can be divided into three parts. Steady moisture transport from the material that is drying characterizes the first drying part. The second drying part starts when there is a reduced moisture transport due to dry spots occurring on the material and the third drying part is when the moisture transport is at the lowest and transports through diffusion because the surface of the material is dried out. By combining a packed moving bed and a pneumatic dryer the drying can be more efficient because at the last drying part the packed moving bed is less efficient and the pneumatic dryer is used instead. In a pneumatic dryer heated air is used to dry the sawdust at the same time as it transports the sawdust through the dryer. At Karlstads University there is a pneumatic dryer for drying of sawdust for laboratory use. In this thesis an effect balance on the dryer was made when the air temperature was 150 °C. The effect for drying sawdust and the effect that the heated air was emitting to the sawdust was compared. Three different kinds of sawdust were used: fresh, rewetted and pressed sawdust. In total 36 drying tests were made. The performance measurements SMER and SPC were used to compare how the performance changed when drying these three kinds of sawdust. A model to predict the outgoing moisture content of the sawdust was built in the calculation program Excel to simplify future tests of the dryer. The air flow that was calculated for the dryer was too low and was increased with 12 percent. By doing this only one effect balance was needed to be cut out when the effect difference for drying sawdust and the heated air was more th
- Published
- 2015
36. Asfaltbeläggning på busshållplatser - Förändring av beläggningsskador
- Author
-
Ramadan, Amani and Ramadan, Amani
- Abstract
Ökandet av den svenska kollektivtrafiken medför att fler busshållplatser behöver byggas och allt flera befintliga busshållplatser måste underhållas. Svårigheter och diskussioner som dyker upp är planeringen av drift- och underhåll på busshållplatsernas vägbeläggningar samt val av egenskaper till dessa. Orsaken till svårigheterna är att beläggningar ofta får skador och defekter såsom spårbildning, sprickor i hjulspår och slaghål som kan uppkomma av olika faktorer, vilka påverkar beläggningar olika mycket. Exempel på sådana faktorer är bland annat trafikmängden, åldern, materialkvaliteten och beläggningstemperaturen på en beläggning. I denna studie har en regressionsmodell som beräknar hur 10 olika beläggningsskador på busshållplatser förändras under en tidsperiod tagits fram. De faktorer som valdes att undersökas och som ingår i modellen är åldern på beläggningen, aktuell trafikmängd, förekomsten av ränndal och brunnar på busshållplatsen, temperaturen då beläggningen lades samt förekomsten av polymermodifierat bindemedel i beläggningens slit- och bindlager. Modellen bygger på en okulär inventering som genomfördes på totalt 61 busshållplatser i Malmö stad under våren 2015. Fokus har lagts på busshållplatser som har en beläggning av asfalt. Orsaken till varför modellen skapades är för att planeringen av befintliga beläggningars drift- och underhåll ska optimeras och även för att egenskaper för framtida beläggningar ska väljas på ett effektivt sätt. Resultatet visar att den uppskattade regressionsmodellen som har skapats fungerar olika bra för olika skador. För att kontrollera hur bra modellen är beräknades bland annat förklaringsgraden och standardavvikelsen för varje skada. Beräkningarna gav en standardavvikelse som varierar mellan 12 procent och 55 procent samt ett relativt låg värde på förklaringsgraden, vilket tyder på att modellen förklarar skadorna ganska dåligt. En jämförelse gjordes även mellan värdena som den uppskattade modellen gav och värdena från inventeri, The increase of the Swedish public transport causes more bus stops to be built and more existing bus stops to be maintained. The difficulties and discussions that crops up associated with the increasing public transport is the planning of operation and maintenance of bus stop pavements surface and the choice of properties to them. The reason for the difficulties is that damages and defects, such as groove formation, longitudinal cracks and potholes, often occurs on the pavement surface. These damages occurs due to various factors, whom affect the pavement different. Example of such factors are the age, the bus traffic volume, material quality and the coating temperature. In this study has a model that computes how 10 different damages on the pavement surface changes over a period of time been created. The factors that has been taken into account when creating the model is the age, the bus traffic volume, the presence of a valley and wells on the bus stop, the coating temperature and the presence of polymer modified binders in the wearing- and binder layer. The model is based on an inventory of 61 bus stops that was conducted in spring 2015 in Malmo. The study is focused on bus stops that is made of asphalt. The reason why the model was created is to optimize the planning of operation and maintenance and also to streamline the selection of properties of future pavement surfaces. The results of this study show that the estimated model that has been created is various good and applies differently for each damage. The degree of explanation and the standard deviation among other things, was calculated to check how good the model is and how applicable it is to reality. The standard deviation varies between12 percent and 50 percent and according to the calculations the degree of explanation is relatively low value, which indicates that the model explains the damages rather bad. A comparison was made between the values that the model yielded and the values of the inventory
- Published
- 2015
37. Auswahl eines geeigneten Regressionsmodells für Hybridraketenantriebe aufgrund von experimentellen Ultraschall Messdaten
- Author
-
Merrem, Clemens Hans-Joachim
- Subjects
Regressionsmessung mittels Ultraschall ,Hybridrakete ,Regressionsmodell ,Abbrandsimulation - Published
- 2014
38. Erstellung von Prädiktionsmodellen für die Vorhersage des subjektiven Fahrtkomforts von PKW bei Einzelhindernisüberfahrten
- Author
-
Fischer-Von Rönn, Niklas
- Subjects
Einzelhindernis ,Regularisierung ,620 Ingenieurwissenschaften ,Künstliches Neuronales Netz ,Merkmalsauswahl ,Fahrkomfort ,Regressionsmodell ,Wavelet - Abstract
In der vorliegenden Arbeit wird eine Methode entwickelt, die es ermöglicht, den Fahrkomfort von PKW, basierend auf Messungen von Beschleunigungen und Luftschall in der Fahrerumgebung, vorherzusagen. Hierzu wurden zwischen 2008 und 2011 im Rahmen von Testfahrten in Zusammenarbeit mit der Audi AG, Magna Steyr Fahrzeugtechnik, dem Kompetenzzentrum das Virtuelle Fahrzeug und der Hochschule München entsprechende objektive und subjektive Daten erhoben. Für die Auflösung der komfortrelevanten Signalanteile in Zeit und Frequenz wird die kontinuierliche Wavelet-Transformation unter Verwendung von Gabor-Wavelets eingesetzt. Die Extrahierung aussagekräftiger Merkmale aus den transformierten Daten geschieht über eine eigene Methode, die auf der Approximation der sich ergebenden Wavelet-Tableaus durch ein parametriertes Muster beruht. Die dabei ermittelten Merkmale sind sowohl beschreibend in Hinblick auf die zugrunde liegenden Daten als auch robust vor dem Hintergrund kleinerer Störungen in der zeitlichen Ausrichtung der Tableaus. In Hinblick auf die Auswahl von Merkmalskombinationen für die Vorhersagemodelle wurden zwei multivariate Methoden entwickelt und erprobt. Als Vorhersagemodelle kommen schließlich künstliche neuronale Netze mit Feed-Forward-Struktur und spezielle lineare Modelle zum Einsatz. In beiden Fällen wird einer möglichen Überanpassung der Modelle an die Trainingsdaten unter Anderem durch Regularisierungs-Methoden im Zuge der Parameterfixierung entgegengewirkt.
- Published
- 2014
- Full Text
- View/download PDF
39. Regionala skillnader i arbetslöshet : En empirisk studie över Sveriges län 2002-2012
- Author
-
Nilsson, Viktor and Söderberg, Kenny
- Subjects
regressionsmodell ,regional ,variabler ,paneldata ,arbetslöshet - Abstract
Arbetslöshet är ett makroekonomiskt problem som genererar samhällsekonomiska kostnader och påverkar många människor i olika utsträckning. I Sverige finns betydande skillnader i regional arbetslöshet mellan länen vilket ger skäl till att undersöka vilka faktorer som påverkar den regionala arbetslöshetsnivån. Syftet med denna uppsats är att analysera följande variablers effekt på den regionala arbetslöshetsnivån i Sveriges län: Procentuell förändring i antal sysselsatta Andelen individer i arbetskraften av populationen Andelen utrikesfödda av populationen Utbildningsnivå Ålderssammansättning Befolkningsmängd per km2 Lönenivå För att uppfylla syftet har en regressionsmodell skapats som sedan skattats via paneldata där ovanstående variablers effekter analyserats. Slutsatsen av studien blev (givet vår modell) att en ökning av variablerna procentuell förändring i antal sysselsatta, andelen individer i arbetskraften av populationen, befolkningsmängd per km2 samt lönenivå minskar arbetslöshetsnivån ceteris paribus. Motsatt effekt visas upp av variablerna andelen utrikesfödda av populationen och utbildningsnivå medan variabeln ålderssammansättning är svår att uttala sig om. Det finns även omständigheter som pekar på att regressionsmodellen och vissa av variablerna behöver utvecklas för att med större säkerhet kunna uttala sig om variablernas effekter på den regionala arbetslöshetsnivån i Sveriges län.
- Published
- 2014
40. Regional differences in unemployment : An empirical study of the counties in Sweden 2002-2012
- Author
-
Nilsson, Viktor and Söderberg, Kenny
- Subjects
regressionsmodell ,regional ,variabler ,paneldata ,arbetslöshet - Abstract
Arbetslöshet är ett makroekonomiskt problem som genererar samhällsekonomiska kostnader och påverkar många människor i olika utsträckning. I Sverige finns betydande skillnader i regional arbetslöshet mellan länen vilket ger skäl till att undersöka vilka faktorer som påverkar den regionala arbetslöshetsnivån. Syftet med denna uppsats är att analysera följande variablers effekt på den regionala arbetslöshetsnivån i Sveriges län: Procentuell förändring i antal sysselsatta Andelen individer i arbetskraften av populationen Andelen utrikesfödda av populationen Utbildningsnivå Ålderssammansättning Befolkningsmängd per km2 Lönenivå För att uppfylla syftet har en regressionsmodell skapats som sedan skattats via paneldata där ovanstående variablers effekter analyserats. Slutsatsen av studien blev (givet vår modell) att en ökning av variablerna procentuell förändring i antal sysselsatta, andelen individer i arbetskraften av populationen, befolkningsmängd per km2 samt lönenivå minskar arbetslöshetsnivån ceteris paribus. Motsatt effekt visas upp av variablerna andelen utrikesfödda av populationen och utbildningsnivå medan variabeln ålderssammansättning är svår att uttala sig om. Det finns även omständigheter som pekar på att regressionsmodellen och vissa av variablerna behöver utvecklas för att med större säkerhet kunna uttala sig om variablernas effekter på den regionala arbetslöshetsnivån i Sveriges län.
- Published
- 2014
41. EMV und präventive Qualitätsmethodik
- Author
-
Hasselberg, Dennis, Classe, Alko, and Stuttinger, Norman
- Subjects
ddc:621,3 ,Störaussendung ,Hybridfahrzeug ,Dewey Decimal Classification::600 | Technik::620 | Ingenieurwissenschaften und Maschinenbau::621 | Angewandte Physik::621,3 | Elektrotechnik, Elektronik ,Dewey Decimal Classification::600 | Technik ,Messreihe ,statistische Versuchsplanung ,Regressionsanalyse ,Zielgröße ,Kraftfahrzeug ,Störstrom ,Schaltungssimulation ,Verifikation ,EMV-Labor ,Leitungssatz ,Benutzerfreundlichkeit ,Motorkomponente ,Regressionsmodell ,ddc:600 ,Risikobewertung ,elektromagnetische Verträglichkeit ,Elektrofahrzeug ,Konferenzschrift - Abstract
Aufgrund neuer gesetzlicher Anforderungen für Elektro- und Hybridfahrzeuge gewinnt die Störaussendung von, mittels Leistungs-PWM angesteuerter, Kraftfahrzeugaktuatorik, zunehmend an Bedeutung. Um die Einflussparameter und Stellhebel für eine grenzwertkonforme Auslegung dieser PWM-Signale zu identifizieren, kam in diesem Beitrag die präventive Qualitätsmethode "Statistische Versuchsplanung" (engl. "Design of Experiments", kurz "DoE") zum Einsatz. Die Untersuchung selbst wurde, um aufwändige Messreihen zu umgehen, mittels einer parametrisierten Schaltungssimulation durchgeführt. Mittels einer toolgestützten Versuchsplanerstellung wurden die optimalen Simulationsdurchläufe im Vorfeld ermittelt, um eine erhebliche Reduzierung des Simulationsaufwandes zu erreichen. Anschließend ergab eine Auswertung unter Zuhilfenahme der Regressionsanalyse ein Modell, das eine anschauliche Darstellung der Einflüsse der einzelnen Parameter (Leitungssatz, PWM-Quelle und Last) auf die Zielgröße (Störstrom) ermöglicht. So kann selbst Entwicklern, deren Schwerpunkt der fachlichen Ausbildung nicht in der EMV liegt, aufgrund der Benutzerfreundlichkeit einer fertigen DoE, auch ohne tiefgehende Einarbeitung, ein Werkzeug an die Hand gegeben werden, um selbstständig eine Risikobewertung zukünftiger Konzepte vorzunehmen. Zur Verifikation der DoE wurde exemplarisch eine, mit Leistungs-PWM angesteuerte, Motorkomponente im EMV-Labor vermessen und mit den Werten der Simulation und des Regressionsmodells verglichen.
- Published
- 2014
42. Die möglichen Bestimmungsfaktoren des Ölkürbisanbaus in Österreich : eine räumlich-ökonometrische Analyse
- Author
-
Niedermayr, Andreas
- Subjects
Ölkürbis ,Anbau ,oil pumpkin cultivation determinants spatial econometrics SAR-Tobit-model R ,Ölkürbisanbau Bestimmungsfaktoren Räumliche Ökonometrie SAR-Tobit-Modell R ,Regressionsmodell - Abstract
eingereicht von: Andreas Niedermayr Mit engl. Zsfassung Wien, Univ. für Bodenkultur, Masterarb., 2014
- Published
- 2014
43. LiDAR Data and Forest Stand Parameters: a good Combination? - Computing Biomass values with the help of LiDAR derived Tree Height and Field Acquisition derived Forest Stand Parameters of a Coniferous Forest Stand in the Bavarian Forest National Park, Germany
- Author
-
Bolkart, Maximilian
- Subjects
LiDAR ,Biomasse ,Regressionsmodell ,Duetschland - Published
- 2013
44. No longer confidential
- Author
-
Briesemeister, Sebastian, Rahnenführer, Jörg, and Kohlbacher, Oliver
- Subjects
Konfidenzschätzung ,Regressionsmodell ,Statistisches Verfahren ,Computersimulation - Abstract
Quantitative predictions in computational life sciences are often based on regression models. The advent of machine learning has led to highly accurate regression models that have gained widespread acceptance. While there are statistical methods available to estimate the global performance of regression models on a test or training dataset, it is often not clear how well this performance transfers to other datasets or how reliable an individual prediction is–a fact that often reduces a user’s trust into a computational method. In analogy to the concept of an experimental error, we sketch how estimators for individual prediction errors can be used to provide confidence intervals for individual predictions. Two novel statistical methods, named CONFINE and CONFIVE, can estimate the reliability of an individual prediction based on the local properties of nearby training data. The methods can be applied equally to linear and non-linear regression methods with very little computational overhead. We compare our confidence estimators with other existing confidence and applicability domain estimators on two biologically relevant problems (MHC–peptide binding prediction and quantitative structure-activity relationship (QSAR)). Our results suggest that the proposed confidence estimators perform comparable to or better than previously proposed estimation methods. Given a sufficient amount of training data, the estimators exhibit error estimates of high quality. In addition, we observed that the quality of estimated confidence intervals is predictable. We discuss how confidence estimation is influenced by noise, the number of features, and the dataset size. Estimating the confidence in individual prediction in terms of error intervals represents an important step from plain, non-informative predictions towards transparent and interpretable predictions that will help to improve the acceptance of computational methods in the biological community., PLoS one;7(11)
- Published
- 2012
45. The impact of habitat fragmentation by anthropogenic infrastructures on wolves (Canis lupus)
- Author
-
Eggermann, Julia and Biologie
- Subjects
Enzymimmunoassay ,Satelliten-DNS ,Regressionsmodell ,Radiotelemetrie ,Öko-Ethologie - Abstract
Mit verschiedensten Methoden untersuchte ich den Einfluss des Menschen auf den Wolf. Zunächst zeigte ich, dass die klassisch freilandbiologischen Methoden zur Erhebung von Wolfsvorkommen (Telemetrie, Schneekartieren und Transsekte) vergleichbare Ergebnisse liefern. Mit Hilfe dieser Methoden konnte ich die Hypothese stützen, dass Streifgebiete von Wölfen durch hohe Beutedichten und geringe anthropogene Einflüsse gekennzeichnet sind. Über Mikrosatellitenanalysen konnte ich des Weiteren zeigen, dass Hauptstraßen keine unüberwindbare Barriere für den genetischen Austausch darstellen. Stresshormonanalysen deckten jedoch auf, dass Wölfe in stärker anthropogen genutzten Gebieten auch signifikant stärker gestresst sind, was langfristig zur Schwächung einer Population führen kann. Schließlich zeigte ich über die Entwicklung von Modellen und eine anschließende Habitateignungsanalyse potentielle Wolfsgebiete, sowie Risikogebiete für Mensch-Wolf-Konflikte innerhalb Deutschlands auf.
- Published
- 2009
46. Application of generalized Poisson regression models to the prediction of tourist income
- Author
-
Mulyk, Michael
- Subjects
Bayes-Verfahren ,Zähldaten ,Poisson-Verteilung ,Regressionsmodell ,Maximum-Likelihood-Schätzung ,Software - Abstract
Michael Mulyk, Klagenfurt, Alpen-Adria-Univ., Dipl.-Arb., 2009
- Published
- 2009
47. Shape constraints in multivariate regression
- Author
-
Scheder, Regine and Mathematik
- Subjects
Statistik ,Regressionsmodell ,Nichtparametrische Regression ,Isotone Regression ,Quantilfunktion ,ddc:510 - Abstract
In der vorliegenden Arbeit werden Regressionsschätzer unter Strukturannahmen in höheren Dimensionen entwickelt. In vielen Anwendungsbeispielen müssen mehrere Einflussgrößen berücksichtig werden. Häufig ist auch eine Struktur der Regressionsfunktion bekannt. Im ersten Teil wird ein Schätzer für eine streng monotone Regressionsfunktion in mehreren Variablen eingeführt und analysiert. Der zweite Teil beschäftigt sich mit bedingten additiven Quantilsmodellen. Das asymptotische Verhalten der Schätzer wird untersucht. Zusätzlich wird mit einer Simulationsstudie das Verhalten für eine endliche Stichprobe überprüft.
- Published
- 2008
48. Utveckling och utvärdering av statistiska metoder för att öka träffsäkerheten hos lokala vindprognoser
- Author
-
Lager, Kristoffer
- Subjects
regressionsmodell ,Meteorology and Atmospheric Sciences ,Meteorologi och atmosfärforskning ,COAMPS ,Statistiska metoder ,modelljämförelse - Abstract
Wind is used as an energy source all over the world. To be able to use this effectively, there is a need for as good forecasts and forecast models as possible. One of these models is Coupled Ocean/Atmosphere Mesoscale Prediction System (COAMPS®) that is used to calculate short time forecasts. This model is used here to calculate wind speeds at two different areas in Västra Götaland, Bengtsfors and Vänersborg. There are also wind measurements with SODAR stations for these areas. The first part of this work is to investigate the difference between two model resolutions, 36 and 12 km, for the model results compared with the measurements. The comparison is done by calculating some different statistical values. The results of these parameters show that the difference between the two resolutions is fairly small and that the lower resolution gives a slightly better result. The second and major part of this work is to use two different regression models to adjust the result of the forecast models to the result of the measurements. These regression models will then be possible to use even when there are no measurements to compare with. The idea of these regression models is to find a way to describe the difference between the result of the forecast model and the SODAR measurements. This difference is then subtracted from the result of the forecast model so that you get an adjustment and more accurate result. The first regression model calculates the difference according to time of the day, the other model calculates the difference according to the wind speed. Furthermore, the measurements used are taken from 75 meters height above the ground. These are then compared to some different results from the forecast model, for example different model heights and different resolutions, and also the model results adjusted with the regression models. The comparison is done by calculating the same statistic values as before, both with and without an adjustment with the regression models, and also to look at histograms that show the distribution of the difference. It is shown that with the regression adjustment, there is a clear improvement of the statistical values compared to the original results of the forecasts. For example the value of the absolute mean difference is reduced with approximately 0.4-0.7 m/s with an adjustment of the regression model. The histograms clearly show that a more even distribution occurs after the adjustment with the regression models. From having a major part of the differences at 1-2 m/s to now having the major part at around 0 m/s and furthermore there is also generally a lower difference between the measurements and the results from the forecast model.
- Published
- 2008
49. Verkställande direktörers ersättning
- Author
-
Olsson, Gustav, Van Beirs, Fabian, Andersson, Fredrik, Olsson, Gustav, Van Beirs, Fabian, and Andersson, Fredrik
- Abstract
Title: Chief Executive Officer remuneration, impact on business performance in the industrial activity Seminar date: 2012-05-31 Course: FEKH95, Degree Project, Corporate Finance, 15 credits (15ECTS) Authors: Gustav Olsson, Fabian van Beirs, Fredrik Andersson Advisor: Maria Gårdängen Keywords: Chief Executive Officer, compensation, industrial companies, regression analysis, Sweden Purpose: The purpose of this study is to examine and analyze the total remuneration to the CEO of an industrial business company for the years 2001, 2005 and 2010 on the OMX Large and Mid Cap and whether there is a significant correlation between high compensation and strong corporate performance. Methodology: The method used in this study is deductive and based on a quantitative survey in the form of a multiple regression analysis. The collection of information consists of cross-section data for the studied years. Theoretical Perspectives: The authors have based the theory primarily on wage determination theories regarding principal-agent problems, "Pay-for-performance", "tournament theory", "corporate governance", and previous empirical research that examines the differences of wage measurement and performance variables in firms. Empirical foundation: The study is based on material from 29 Swedish industrial companies listed on NASDAQ OMX Large and Mid Cap, results from the regression analysis, as well as CEO compensation related to various performance measures. Conclusions: The results show a strong significant relationship between CEO compensation and the company's market capitalization, and to some extent, its net sales. The study also shows a weaker relationship between CEO variable compensation and profitability., Abstrakt Examensarbetets titel: Verkställande direktörers ersättning, inverkan på företagsprestation inom industriverksamhet Seminariedatum: 2012-05-31 Ämne/Kurs: FEKH95, Examensarbete på kandidatnivå, finansiering, 15 högskolepoäng (15ECTS) Författare: Gustav Olsson, Fabian van Beirs, Fredrik Andersson Handledare: Maria Gårdängen Nyckelord: Verkställande direktör, ersättning, industriföretag, regressionsmodell, Sverige Syfte: Syftet med uppsatsen är att behandla och analysera den totala ersättningen till VD inom industriverksamhetsbolag för åren 2001, 2005 och 2010 på OMX Large och Mid Cap och huruvida det finns ett signifikant samband mellan en hög ersättning och en stark företagsprestation. Metod: Metoden som används som i uppsatsen är deduktiv och utgår från en kvantitativ undersökning i form av en multipel regressionsanalys. Informationen har sammanställts i form av tvärsnittsdata för de olika årtalen. Teoretiska perspektiv: Författarna utgår främst från lönesättningsteorier angående ”Principal-agent-problem”, ”Pay-for- performance”, ”Tournament theory” och ”Corporate governance”. Även tidigare empirisk forskning som granskar olika lönemått och prestationsvariabler i företag används. Empiri: Studien baseras på material från 29 svenska industriföretag noterade på NASDAQ OMX Large och Mid Cap och resultat från regressionsanalysen samt VD-ersättningens samband med diverse prestationsmått. Slutsatser: Resultaten visar på ett starkt signifikant samband mellan VD-ersättning och företagets börsvärde samt till viss del även dess nettoomsättning. Studien tyder även på ett svagare uppmätbart samband mellan VD:s rörliga ersättning och lönsamheten.
- Published
- 2012
50. Vad påverkar marknadsvärdet på en skogsfastighet? : en statistisk analys av markvärdet
- Author
-
Högberg, Johanna and Högberg, Johanna
- Abstract
Skogen har sedan årtusenden tillbaka nyttjats av människan för sitt leverne. Allteftersom möjligheten att äga egen skog och att skogens ekonomiska betydelse har ökat har värderingen av skog förändrats. Avkastningsberäkning har länge legat till grund för värdering av skog, men idag räcker inte detta för att uppskatta marknadsvärdet på skogsfastigheter. Det är tydligt att det är fler bakomliggande faktorer än den skogliga avkastningen som spelar roll för prisbildningen. Huvudsyftet med denna studie var att öka kunskapen om prisbildningen på skogsfastigheter samt att undersöka och eventuellt utveckla värderingsgrunder. Detta har gjorts genom att undersöka några utvalda faktorers påverkan på markvärdet, en av marknadsvärdets komponenter. De egenskaper som undersöks är fastigheters storlek, form, ägosplittring som beskrivs genom antal ingående skiften, bonitet och den kapitaltäthet som råder i området fastigheten är belägen i, med avseende på medelinkomst, population och av stånd till närbelägen ort. De använda teoretiska och analytiska ramverk som använts är Rosens (1974) hedoniska prismodell där regressionsanalys använts som statistisk analysverktyg. Utifrån regressionen har en statistisks modell för markvärdet genreretas samt implicita priser som beskriver den marginella betalningsviljan för respektive egenskap. Studien resulterade i två prismodeller, en modell för sydligt belägna fastigheter och en modell för nordligt belägna fastigheter, där markvärdet per hektar beskrivs som en funktion av kapitaltäthet, storlek och ägosplittring. Resultatet visar att kapitaltätheten har positiv inverkan på markvärdet, en faktor som beskriver befolkningskoncentration och betalningsförmåga i ett område. Ägosplittring och storleken visar sig påverka markvärdet per ha negativt, där påverkan av storlek visar sig var större i de norra delarna av landet. Egenskaperna bonitet och fastighetens form exkluderades ur modellen då dessa inte visade på tydliga samband med markvärdet. Detta kan t, For thousands of years the forest has been used as a resource by humanity. As the economic value of forest land has increased and private ownership has become more common, the value of forest land has changed. Previous ways of measuring such as profit valuation has long been used for estimating forest land value, but nowadays these methods are not sufficient enough to provide a reasonable estimate of the market prices of forest estates. The main objective of this study was to increase the knowledge about pricing of forest estates and to examine and develop adequate bases of valuation for estimating of forest land value. A number of variables, representing characteristics of forest estates were studied to investigate their influence on the land value; size, shape, fragmentation, site productivity and the capital density, with respect to average income, population and distance to nearby town.. The theoretical and analytic framework used in this study is Rosen´s (1974) hedonic pricing model where regression analysis is employed as statistical method. Based on the results from the regression analysis, implicit prices for each characteristic were generated. The study resulted in two statistical models, one model for the southern located properties and one model for northern located properties, where land value per hectare is described as a function of capital density, size and fragmentation. The result shows that index of capital density has a positive impact on land value, a variable that describes the population and capital concentration in an area. Fragmentation and size of a property influence the land value per hectare negatively, were the influence of size is found to be greater in the northern parts of the country. The remaining characteristics, shape and site productivity do not seem to affect the pricing of forest estates regarding the statistical model. This implies that certain characteristics of a property may have little significance for the pricing of prope
- Published
- 2012
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.