L'Institut Ramon Llull (IRL) és una institució pública que té com a principal objectiu promoure i donar a conèixer la llengua i cultura catalana. L'institut, entre d'altres activitats, emmagatzema dades d'artistes que han sol·licitat ajuts i subvencions. Quan es parla d'artistes, es fa referencia a qualsevol persona relacionada en l'àmbit cultural, ja siguin escriptors, traductors, actors, arquitectes, etc. Totes aquestes dades es troben públiques a les diferents webs de l'IRL, però no són gaire freqüentades ni populars en els cercadors. És per això que des de l'Institut s'ha decidit fer ús d'una eina de major abast, com és Wikidata. Wikidata és una plataforma d'accés i edició públics amb una estructuració de les dades segons grafs. Pertany al grup de Wikimedia Foundation i la pròpia Viquipèdia fa ús de Wikidata per obtenir un resum de les dades que mostra a l'usuari. L'objectiu del projecte és afegir i modificar les dades ja creades a Wikidata que estiguin relacionades amb dades d'artistes catalans que té l'IRL. A més, en aquest projecte es buscaran eines per a poder automatitzar aquest procés segons els estàndards de dades de Wikidata. És per això que s'han dut a terme dos processos per separat, amb dues eines diferents de neteja, transformació i carregament de les dades, per tal de poder-ne fer una comparació i valoració. S'han utilitzat eines com SQL, Python i OpenRefine per assolir aquests objectius. També s'ha fet una cerca exhaustiva d'altres fonts de dades que poguessin aportar noves dades, i se n'han pogut obtenir del Catàleg d'Autoritats de Noms i Títols de Catalunya (CANTIC). Això ha fet que la quantitat de dades hagi ampliat l'abast del projecte., The Institut Ramon Llull (IRL) is a public institution whose main objective is to promote and showcase the Catalan language and culture. Among other activities, the institute stores data on artists who have applied for grants and subsidies. When referring to artists, it encompasses any person related to the cultural areea, such as writers, translators, actors, architects, etc. All this data is publicly available on the various IRL websites, but they are not widely accessed or popular in search engines. Therefore, the Institut has decided to use a more comprehensive tool, such as Wikidata. Wikidata is a publicly accessible and editable platform that structures data in graphs. It belongs to the Wikimedia Foundation group, and Wikipedia itself uses Wikidata to provide data summaries to users. The objective of the project is to add and modify existing data on Wikidata that is related to Catalan artists, as compiled by the IRL. Additionally, the project seeks to find tools to automate this process according to Wikidata's data standards. To achieve these goals, two separate processes have been carried out using different data cleaning, transformation, and loading tools, including SQL, Python, and OpenRefine. An exhaustive search for other data sources that could provide new information has also been conducted, resulting in additional data from the Catàleg d'Autoritats de Noms i Títols de Catalunya (CANTIC). This increase in data has expanded the project's scope.