The macroscopic behaviour of granular matter in contrast to fluids and solids is often insufficiently understood not least because poor visual accessibility hinders the analysis. Computer simulations are capable of revealing the internal dynamics not directly accessible in the experiment but are computationally extremely expensive since no unified model equations exist homogenizing the dynamics of the individual particles. Unfortunately, the time and length scales of relevant problems are quickly beyond the reach of today's simulation tools. This thesis aims to address these issues by providing models and algorithms efficiently harnessing the power of today's supercomputers and at the same time extending the reachable scales by hiding the collision micro-dynamics and improving the convergence rate of the iterative solver and time coherence of the solutions. To hide the collision micro-dynamics hard contact models are employed leading to non-smooth trajectories and discontinuous velocities of the particles. The convergence rate and time coherence are impeded by the non-uniqueness of the contact reactions. Hence, a new friction model is introduced that can be viewed as a regularization of the Coulomb friction model exhibiting unique one-contact solutions. Another regularization, stiffening contact compliances in multi-contact problems, identifies the contact reactions of weighted minimum norm as physically meaningful unique solutions. Finally, an iterative solver based on the non-smooth contact dynamics method is parallelized for distributed-memory architectures. The parallelization uses a sophisticated protocol supporting the processes in deciding robustly upon responsibilities such as contact treatment and position integration while minimizing communication overhead. The parallel efficiency is assessed in strong- and weak-scaling experiments on three clusters including Juqueen and SuperMUC, two of today's largest supercomputers. The simulations are of unprecedented scale: in the order of 10 billion non-spherical particles and contacts. Aside from scaling experiments the versatility is demonstrated using the examples of a large-scale horizontal shaker filled with sharp-edged granular matter and rapid granular channel flows. Though the limits of non-smooth granular matter simulations are pushed considerably, the dependence of the convergence rate of the non-smooth contact dynamics method on the number of unknowns remains an open problem. Das makroskopische Verhalten granularer Materie ist - im Gegensatz zu dem von Fluiden und Festkörpern - häufig nur unzureichend verstanden. Dies rührt nicht zuletzt daher, dass die Analyse durch die schlechte visuelle Zugänglichkeit erschwert wird. Computersimulationen vermögen die im Experiment nicht direkt zugängliche interne Dynamik preiszugeben, sind aber extrem rechenaufwendig, da keine allgemeingültigen Modellgleichungen existieren, welche die Dynamik der einzelnen Partikel homogenisieren. Allerdings liegen die Zeit- und Längenskalen relevanter Probleme schnell außerhalb der Erreichbarkeit heutiger Simulationsprogramme. Ziel der Arbeit ist es, diese Aspekte durch die Entwicklung von Modellen und Algorithmen anzugehen, welche die Rechenleistung heutiger Supercomputer nutzbar machen und zugleich die erreichbaren Skalen erweitern. Dies soll realisiert werden, indem die Mikrodynamik der Kollisionen ausgeblendet wird und die Konvergenzrate des iterativen Lösers sowie die zeitliche Kohärenz der Lösungen verbessert werden. Um die Mikrodynamik der Kollisionen auszublenden, werden harte Kontaktmodelle eingesetzt, welche auf nichtglatte Trajektorien und unstetige Geschwindigkeiten der Partikel führen. Konvergenzrate und zeitliche Kohärenz werden durch die Uneindeutigkeit der Kontaktreaktionen verschlechtert. Daher wird ein neues Reibungsmodell eingeführt, welches als Regularisierung der Coulombschen Reibung betrachtet werden kann und eindeutige Einkontaktlösungen aufweist. Eine weitere Regularisierung, welche Kontaktnachgiebigkeiten in Mehrkontaktproblemen verfestigt, identifiziert die Kontaktreaktion mit minimaler gewichteter Norm als physikalisch bedeutsame eindeutige Lösung. Abschließend wird ein iteratives Lösungsverfahren, welches auf der "non-smooth contact dynamics"-Methode basiert, für Architekturen mit verteiltem Speicher parallelisiert. Die Parallelisierung verwendet ein durchdachtes Protokoll, welches die Prozesse darin unterstützt, Zuständigkeiten - wie beispielsweise Kontaktbehandlung oder Positionsintegration - robust zu entscheiden bei gleichzeitiger Reduktion des Kommunikationsaufwandes. Die parallele Effizienz wird in starken und schwachen Skalierungsexperimenten auf drei Clustern - einschließlich Juqueen und SuperMUC, zwei der größten heutigen Supercomputer - ausgewertet. Die Größenordnung der Simulationen erreicht ein bislang ungekanntes Ausmaß: 10 Milliarden nicht-sphärische Partikel und Kontakte. Abgesehen von den Skalierungsexperimenten wird die Vielseitigkeit anhand eines großskaligen horizontalen Rüttlers demonstriert, welcher mit scharfkantiger granularer Materie gefüllt ist und anhand rapider granularer Kanalströmungen. Obwohl die Simulationsmöglichkeiten nichtglatter granularer Materie deutlich erweitert werden, bleibt die Abhängigkeit der Konvergenzrate der "non-smooth contact dynamics"-Methode von der Anzahl der Unbekannten ein ungelöstes Problem.