Recently, Device-to-Device (D2D) has been brought inside mobile (cellular) networks with the introduction of the LTE-D2D standard into the 5G ecosystem. This cellular D2D operates in the same operator's frequencies used for regular communications with access points (i.e., base stations). In D2D mode, terminals can communicate directly and do not need to go through a base station. However, D2D communications are authorized and controlled by operators to implement their requirements and policies. A notable example of D2D is data offloading, which helps in reducing traffic congestion in mobile networks. In this scenario, terminals collaborate using their D2D connections to carry data, usually over multiple D2D hops, using other terminals as relays and avoiding base stations. However, the latter still must decide on routing (e.g., which devices should be part of the path) and wireless resource allocation (which frequencies to use by devices). Also, base stations must manage interferences between D2D and cellular communication since they all share the same spectrum. Besides, there is also the energy issue in employing battery-constrained terminals as relays. Another concern, in offloading designs, is how they scale when terminals density increases, such as in crowded-platform scenarios. These scenarios include mobile users in waiting halls of airports and train stations, or stadiums. In such situations, the decision problems mentioned before must be solved rapidly. Doing so avoids long delays in communications that can affect user experience or limit responsiveness. In this thesis, we address the problem of optimizing routing and wireless resource allocation in multihop D2D systems with a focus on data offloading. Our proposals to solve the problem consider practical aspects of the LTE-D2D standard. Moreover, we also address the mentioned energy and scalability concerns. We propose three contributions to deal with these problems. In the first contribution, we propose a novel method (JRW-D2D) to solve jointly routing and resource allocation in the aim of offloading unicast flows inside one cell over the LTE-D2D relaying system. The proposal JRW-D2D is based on Integer Linear Programming (ILP) and gives good results in terms of reliability, latency, and acceptance ratio. In the second contribution, we present two methods to solve the same problem for both unicast and multicast traffic. In the first step, we introduce an optimal ILP-based method (JRW-D2D-MC) to solve routing and resource allocation jointly. Next, to address the scalability issue in JRW-D2D-MC, we propose another scalable method (JRW-D2D-CG) based on the Column-Generation technique. Finally, our third contribution considers the energy issue, where we put forward two energy-aware schemes to solve routing and resource allocation. Initially, we propose an ILP-based method for Energy-Efficient Joint Routing and Resource Allocation (JRRA-EE). In the next step, we highlight the non-scalability of JRRA-EE and introduce a novel parametric three-stage method called Heuristic Energy-aware Routing and Resource Allocation (HERRA). Both JRRA-EE and HERRA consider energy consumption using a state-of-the-art empirical model for LTE-D2D terminals. Moreover, we evaluate the performance of our contributions based on network simulations in NS-3, which we have extended to support the LTE-D2D standard., Récemment, D2D (Device-to-Device) a été intégré aux réseaux mobiles avec l'introduction de la norme LTE-D2D dans l'écosystème 5G. Ce D2D cellulaire fonctionne aux mêmes fréquences que l’opérateur utilisé pour les communications régulières avec les points d’accès (c.à.d. les stations de base). En mode D2D, les terminaux peuvent communiquer directement et n’ont pas besoin de passer par une station de base. Cependant, les communications D2D sont autorisées et contrôlées par les opérateurs pour mettre en œuvre leurs exigences et leurs politiques. Le délestage de données est un exemple notable de D2D, qui aide à réduire la congestion du trafic dans les réseaux mobiles. Dans ce scénario, les terminaux collaborent en utilisant leurs connexions D2D pour transporter les données, généralement sur plusieurs sauts D2D, en utilisant d'autres terminaux comme relais et en évitant les stations de base. Toutefois, ces derniers doivent décider du routage (par exemple, quels terminaux devraient faire partie du chemin) et de l’allocation de ressources sans fil (quelles fréquences à utiliser par les terminaux). De plus, les stations de base doivent gérer les interférences entre les communications, D2D et cellulaires, car elles partagent toutes le même spectre. En outre, il y a aussi le problème énergétique lié à l'utilisation de relais soumis aux contraintes de batterie. Un autre enjeu, dans ces conceptions de délestage, concerne la manière dont elles évoluent lorsque la densité des terminaux augmente (p. ex., dans les scénarios de plate-forme surpeuplée). Ces scénarios incluent des utilisateurs mobiles dans les halls d’attente des aéroports et des gares, ou des stades. Dans de telles situations, les problèmes de décision susmentionnés doivent être résolus rapidement. Cela évite de longs délais dans les communications qui peuvent affecter l'expérience utilisateur ou limiter la réactivité. Dans cette thèse, nous abordons le problème de l'optimisation du routage et de l'allocation de ressources sans fil dans les systèmes D2D multi-sauts en mettant l'accent sur le délestage de données. Nos propositions pour résoudre le problème prennent en compte les aspects pratiques de la norme LTE-D2D. De plus, nous répondons également aux enjeux mentionnés en matière d’énergie et d’évolutivité. Nous proposons trois contributions pour traiter ces problèmes. Dans la première contribution, nous proposons une nouvelle méthode (JRW-D2D) pour résoudre conjointement le routage et l’allocation de ressources afin de délester des flux unicast sur un système de relais LTE-D2D. La proposition JRW-D2D est basée sur la programmation linéaire en nombres entiers (ILP) et donne de bons résultats en termes de fiabilité, de latence et de taux d’acceptation. Dans la deuxième contribution, nous présentons deux méthodes pour résoudre le même problème pour les trafics unicast et multicast. Dans la première étape, nous présentons une méthode optimale basée sur ILP (JRW-D2D-MC) pour résoudre conjointement le routage et l’allocation de ressources. Ensuite, pour résoudre le problème de non-évolutivité de JRW-D2D-MC, nous proposons une autre méthode évolutive (JRW-D2D-CG) basée sur la génération de colonnes. Enfin, notre troisième contribution aborde la question de l’énergie, dans laquelle nous avons présenté deux systèmes axés sur l’énergie pour résoudre les problèmes de routage et d’allocation de ressources. Dans un premier temps, nous proposons une méthode (JRRA-EE) basée sur ILP. Dans l'étape suivante, nous mettons en évidence la non-évolutivité de JRRA-EE et présentons une nouvelle méthode paramétrique à trois étapes appelée (HERRA) et basée sur l’heuristique. Les deux méthodes JRRA-EE et HERRA considèrent la consommation d'énergie à l'aide d'un modèle empirique de pointe pour les terminaux LTE-D2D. De plus, nous évaluons la performance de nos contributions sur la base de simulations de réseau dans NS-3 que nous avons étendu pour prendre en charge la norme LTE-D2D.