As digitalization in medicine progresses and more data is captured electronically, the amount of data available increases rapidly. Despite the large amount of data available, the data for specific research questions is much smaller once filtered to match specific study criteria. This, combined with modern biomedicine requiring large numbers of patients, highlights the need to analyze data across institutions. The heterogeneity of modern medical institutions further complicates the analysis process within and across institutions and makes it difficult for researchers to extract meaningful information. The Medical Informatics Initiative (MII) was initiated by the German Ministry of Research and Education (BMBF) to tackle this problem and to harness the potential of digitalization in medicine. Data integration centers (DIC) form the heart of the MII. These organizational units established at each university hospital provide multiple services including harmonization of the data, technical infrastructure, and establishing of governance to support data sharing and use across university hospitals. The DIC implement the standardization and harmonization agreed on across the different MII task forces and committees, like the use of Fast Healthcare Interoperability Resources (FHIR) and specific medical terminologies. The DIC maintain software, which adheres to the agreed upon standards and harmonization rules and provide standardized research data repositories. Therefore, in contrast to a heterogenous hospital, software and data management can be created once and applied to all DIC, if the DIC have implemented the standardized application programming interfaces (APIs). This harmonization is the first step towards paving the way for cross-hospital data analysis. However, to make the data accessible to researchers, make it findable, allow researchers to select subsets of the large data pool for further analysis, allow them to build (federated) statistical or machine learning (ML) models as well as deploy them, additional software tools beyond the standard DIC tools specified above are necessary. Across multiple projects of the MII this thesis investigates how software tools can be designed, built, easily deployed, and integrated into DIC IT infrastructures to support local and federated analyses and statistical model development. It thus extends DIC infrastructures towards providing a cross-institutional research platform. It supports initial feasibility queries as well as data selection, extraction, analysis, and subsequent deployment of statistical models. All software components were conceptualized and implemented by the author of this thesis in collaboration with inter-disciplinary (partly across sites) teams and integrated with existing DIC infrastructures as well as evaluated with exemplary analyses. This thesis first investigated how ML models can be built on gene expression and other patient data to predict clinical outcomes. Different ML models were created, and their accuracy measured. While demonstrating how ML models could be applied to clinical data, the availability of data was found to be a limiting factor and the deployment or use of models remained elusive. This illustrated the need to make harmonized data available across institutions. To adhere to data protection laws, this thesis then investigated and extended DataSHIELD concepts and tools for federated privacy preserving analysis. A new Queue-Poll extension for DataSHIELD was designed and developed, distributed to multiple hospitals, and used for successive research projects to satisfy strict hospital firewall rules. To investigate training and deployment of ML and statistical models a prototype of KETOS, a platform for clinical decision support and machine learning as a service, was conceptualized and implemented. It allows researchers to create ML models based on standardized and harmonized data, while still providing maximum freedom in the model building process. It was conceptualized from the beginning with cross-hospital research in mind and achieved interoperability by relying on the data standardization of the DIC. In the framework of the MII and large research data repositories, a dataset for a specific analysis, model building, and later deployment usually needs to be extracted from the larger dataset requiring methods for data selection and extraction. This was addressed in two further subprojects of this thesis. The first focused on integrating large-throughput genomics data with non-genomic patient data in FHIR format. The second study created a method to select data from a large dataset (30 million FHIR resources) of FHIR formatted patient data, based on inter-criteria relationships. Having established first methods for data extraction, model analysis and deployment, to close the research lifecycle, a method was required to make data across hospitals findable. Therefore, it was investigated how cross-hospital feasibility queries can be created based on harmonized FHIR data and a platform conceptualized. Further, as part of the concept and implementation of the feasibility query platform, it was investigated how the necessary ontology for the user interface could be automatically generated using FHIR implementation guides, profiles, and a terminology server. Within the CODEX project the platform was implemented and distributed to 34 participating university hospitals. The platform performed well with large data volumes, searching through four mil. resources within 30 seconds. While the two attempts for data extraction investigated as part of this thesis were applicable to some data extraction problems, a more wholistic method for data extraction is still missing. To solve this, this thesis’ work on cohort selection of the feasibility query could be combined with a feature selection to create a cohort specific data extraction process. This thesis successfully demonstrates how software can be built, which leverages the data integration efforts of the MII to support large scale cross-hospital data sharing and analysis projects. The innovative software developed here was successfully integrated with the DIC infrastructure and highlights the importance of the standardization and harmonization efforts of the DIC and MII. All developed software was created to not only be applicable to one institution but created with cross-institutional research with the DIC at the core in mind, making a valuable contribution to the MII and the future of medical research infrastructures. Mit fortschreitender Digitalisierung der Medizin steigt die Menge der digitalen Daten rapide an. Nach Eingrenzung auf spezifische Forschungsfragen, verringern sich die verfügbaren Daten jedoch deutlich. Insbesondere im Kontext der heutigen Präzisionsmedizin führt dies zu der Anforderung, Patientendaten für die medizinische Forschung institutionsübergreifend auszuwerten. Die Heterogenität der klinischen Anwendungssysteme speziell über Krankenhäuser hinweg, erschwert die standortübergreifende Analyse weiter. Deshalb wurde vom Bundesministerium für Bildung und Forschung (BMBF) die Medizininformatikinitiative (MII) ins Leben gerufen. Das Herzstück der MII bilden Datenintegrationszentren (DIZ). Diese organisatorischen Einheiten stellen verschiedene Forschungs-IT-Services und technische Infrastruktur gemäß der übergreifend definierten MII-Datennutzungsprozesse und -Standards an jedem Universitätsklinikum bereit. Zum Zweck der deutschlandweiten Datenharmonisierung definierte die MII den sogenannten MII-Kerndatensatz in Form von HL7 FHIR-Profilen. Darauf basierend stellen Datenintegrationszentren standardisierte Datenspeicher bereit. Dies ermöglicht es, bestimmte Softwarelösungen gemäß den MIIVorgaben zu entwickeln und an DIZe zu verteilen, solange standardisierte Anwendungsschnittstellen implementiert wurden. Diese Standardisierung ist der erste Schritt in Richtung einer krankenhausübergreifende Datenanalyse. Um jedoch die Patientendaten grundsätzlich für die Forschung zugänglich zu machen, sie auffindbar zu machen, Teilkohorten für Analysen auswählbar zu machen, effiziente Softwaretools für (verteilte) Datenanalysen, sowie zur Entwicklung neuer statistischer Modelle mittels (verteiltem) maschinellem Lernen (ML) anzubieten und diese Modelle effizient produktiv anzuwenden, waren über die aufgeführten Standard-DIZ-Tools hinaus noch weitere Software-Tools erforderlich. Im Rahmen mehrerer MII-Projekte (MIRACUM, CODEX, ABIDE_MI) wurde in dieser Arbeit untersucht, wie Software-Tools auf standardisierten Datenstrukturen und generischer DIZ-Infrastruktur entwickelt und implementiert werden können bzw. bestehende DIZ-Infrastrukturen erweitert werden können, um eine möglichst ganzheitliche, institutionsübergreifende Forschungsplattform bereitzustellen. Diese unterstützt Machbarkeitsabfragen, Datenauswahl, -extraktion, -analyse, und den Einsatz von ML oder statistischen Modellen. Alle Softwarekomponenten wurden vom Autor dieser Dissertation in interdisziplinären (teilweise standortübergreifenden) Teams konzipiert, entwickelt, in die bestehende DIZ-Infrastruktur integriert, und anhand von Beispielanalysen evaluiert. In dieser Arbeit wurde zunächst untersucht, wie ML-Modelle mit Genexpressionsdaten sowie klinischen Patientendaten für klinische Vorhersagen erstellt werden können. Es wurden verschiedene ML-Modelle erstellt und ihre Genauigkeit gemessen. Obwohl in diesem Teilprojekt die potenzielle Anwendung von ML-Modellen aufgezeigt wurde, war die Verfügbarkeit größerer Datenmengen für das Training und die Optimierung der Modelle ein einschränkender Faktor. Der Einsatz der Modelle blieb aus. Dies verdeutlichte die Notwendigkeit, harmonisierte Daten einrichtungsübergreifend zur Verfügung zu stellen. Für die datenschutzgerechte, einrichtungsübergreifende Analyse von Daten wird jedoch Software benötigt, welche die Privatsphäre der Patienten wahrt. Zu diesem Zweck wurde die Nutzung und Erweiterung von DataSHIELD untersucht, um krankenhausübergreifende Datenanalysenetzwerke zu ermöglichen, welche die Privatsphäre wahren und die strikten IT-Sicherheitsvorgaben erfüllen. Eine Queue-Poll- Erweiterung für DataSHIELD wurde konzipiert, entwickelt, über mehrere Krankenhäuser verteilt, und für nachfolgende Forschungsarbeiten verwendet, um strikten Firewalls gerecht zu werden. Um den Einsatz von ML-Modellen weiter zu untersuchen, wurde KETOS, eine Plattform für klinische Entscheidungsunterstützung und maschinelles Lernen, geschaffen. Es wurde ein Prototyp dieser Plattform konzipiert und implementiert, die es Forscher*innen ermöglicht, ML-Modelle auf der Grundlage standardisierter und harmonisierter Daten zu erstellen und gleichzeitig ein Höchstmaß an Freiheit bei der Modellerstellung gewährleistet. KETOS wurde direkt für die krankenhaus-übergreifende Forschung konzipiert und erreichte die erforderliche Interoperabilität über die Standardisierung der DIZe. Im Rahmen der MII und speziell bei Verwendung großer Gesamtdatenspeicher muss ein Datensatz für eine bestimmte Analyse in der Regel aus dem größeren Datensatz extrahiert werden, was Methoden zur Datenauswahl und - extraktion erfordert. Dies wurde in zwei Teilprojekten dieser Arbeit behandelt. Das erste konzentrierte sich auf die Integration von Genomik-Daten mit nicht-genomischen Patientendaten. In einem weiteren Projekt wurde dann eine Methode zur Auswahl von Daten aus einem großen Datensatz (30 Millionen FHIR-Ressourcen) auf der Grundlage von Kriterienbeziehungen entwickelt. Nachdem erste Methoden zur Datenextraktion, Modellanalyse und Bereitstellung etabliert waren, wurde eine Methode benötigt, um Daten krankenhausübergreifend zu finden. Daher wurde untersucht, wie föderierte, krankenhausübergreifende Machbarkeitsabfragen auf Basis von FHIR-Daten erstellt werden können. Im Rahmen der Konzeption und Umsetzung dieser Machbarkeitsabfrage-Plattform wurde zudem untersucht, wie die notwendige Ontologie für die Benutzeroberfläche mit Hilfe von FHIR-Implementierungsleitfäden, Profilen und einem Terminologieserver automatisch generiert werden kann. Im Rahmen des CODEXProjekts wurde die Plattform an 34 Universitätskliniken verteilt. Die Plattform ermöglicht das Durchsuchen von 4 Mio. Ressourcen innerhalb von 30 Sekunden. Während die beiden Ansätze zur Datenextraktion dieser Arbeit auf einige Datenextraktionsprobleme anwendbar waren, fehlt noch eine ganzheitlichere Methode. Um dieses Problem zu lösen, könnten zukünftig die Erkenntnisse dieser Arbeit zur Kohortenauswahl der Machbarkeitsabfrage mit einer Merkmalsauswahl in einem kohortenspezifischen Datenextraktionsprozess kombiniert werden. Diese Arbeit hat erfolgreich gezeigt, wie Software entwickelt werden kann, welche unter Nutzung der Datenharmonisierungsvorgaben der MII große, standortübergreifende Datennutzungs- und -analyseprojekte ermöglicht. Die hier entwickelte innovative Software wurde erfolgreich in die DIZ-Infrastruktur integriert. Sie verdeutlicht, wie wichtig die Standardisierung und Harmonisierung von DIZ und MII ist. Die gesamte entwickelte Software wurde so konzipiert, dass sie nicht nur für eine Einrichtung anwendbar ist, sondern integriert in die DIZ-Infrastrukturen für die institutionenübergreifende Forschung genutzt werden kann. Somit leistet diese Arbeit einen wertvollen Beitrag zur MII und zur Zukunft medizinischer Forschungsinfrastrukturen.