This project explores several pipelines to accurately perform text classification in a very specific task, which consists on classifying Catalan and Spanish short texts with very informal language by kids and teenagers. The classification categories are the following abusive topics: aggression and violence, substances, sexuality and disorders (anxiety, depression or distress). We count on a small, highly unbalanced, supervised dataset of approximately 200.000 examples. We first added a robust preprocessing to our database and then we built and tested several pipelines, exploring vectorization (TF-IDF, Doc2Vec) and AI classification techniques (RF, SVM, BERT). The best one was the multilingual version of BERT with our proposed preprocessing without stemming. Another pipeline achieved similar results (surpassing BERT in one of the categories) with a much faster computing time, and that is using a BERT model for extracting embeddings of our short texts and classifying them using SVM. Este proyecto explora varios procesos para realizar con precisión clasificación de texto en una tarea muy específica, que consiste en clasificar textos breves en catalán y español con un lenguaje muy informal escritos por niños y adolescentes. Las categorías de clasificación son los siguientes temas abusivos: agresión y violencia, sustancias, sexualidad y trastornos (ansiedad, depresión o angustia). Contamos con un pequeño conjunto de datos supervisados altamente desequilibrados de aproximadamente 200,000 ejemplos. Primero agregamos un preprocesamiento robusto a nuestra base de datos y luego construimos y probamos varios procesos, explorando la vectorización (TF-IDF, Doc2Vec) y las técnicas de clasificación IA (RF, SVM, BERT). La mejor fue la versión multilingüe de BERT con nuestro preprocesamiento propuesto sin "stemming". Otro proceso logró resultados similares (superando BERT en una de las categorías) con un tiempo de cómputo mucho más rápido, y es la que usó un modelo BERT para extraer "embeddings" de nuestros textos cortos y clasificarlos usando SVM. Aquest projecte explora diversos processos per a realitzar una classificació de textos amb precisió en una tasca molt específica, que consisteix en classificar textos breus en català i castellà amb un llenguatge molt informal escrits per nens i adolescents. Les categories de classificació són les següents: agressió i violència, substàncies, sexualitat i trastorns (ansietat, depressió o angoixa). Comptem amb un petit conjunt de dades supervisat, molt desequilibrat, d'aproximadament 200.000 exemples. Primer vam afegir un preprocessament robust a la nostra base de dades i després vam crear i provar diversos processos, explorant tècniques de vectorització (TF-IDF, Doc2Vec) i de classificació IA (RF, SVM, BERT). El millor procés és la multilingüe de BERT amb la nostra proposta de preprocessament sense "stemming". Un altre procés va obtenir resultats similars (superant BERT en una de les categories) amb un temps de computació molt més ràpid, i és la que utilitza un model BERT per extreure "embeddings" dels nostres textos breus i classificar-los mitjançant SVM.