1. Becoming JILDA
- Author
-
Sucameli, Irene, Lenci, Alessandro, Magnini, Bernardo, Simi, Maria, and Speranza, Manuela
- Subjects
Twitter during Pandemic ,Automatic Sarcasm Detection ,Linguistic Ostracism in Social Networks ,AriEmozione ,COVID-19 ,Linguistics ,LAN000000 ,Quantitative Linguistic Investigations ,Fine-grained sentiment analysis ,Online Hate Speech ,Computational Linguistics ,DistilBERT ,Depression from Social Media ,Distributional Semantics ,Gender Bias ,CBX ,AEREST ,E3C Project ,Multilingual NLU ,TrAVaSI - Abstract
The difficulty in finding useful dialogic data to train a conversational agent is an open issue even nowadays, when chatbots and spoken dialogue systems are widely used. For this reason we decided to build JILDA, a novel data collection of chat-based dialogues, produced by Italian native speakers and related to the job-offer domain. JILDA is the first dialogue collection related to this domain for the Italian language. Because of its collection modalities, we believe that JILDA can be a useful resource not only for the Italian research community, but also for the international one. Negli ultimi anni l’utilizzo di chatbot e sistemi dialogici è diventato sempre più comune; tuttavia, il reperimento di dati di apprendimento adeguati per addestrare agenti conversazionali costituisce ancora una questione irrisolta. Per questo motivo abbiamo deciso di produrre JILDA, un nuovo dataset di dialoghi relativi al dominio della ricerca del lavoro e realizzati via chat da parlanti nativi italiani. JILDA costituisce la prima collezione di dialoghi relativi a questo dominio, in lingua italiana. Per gli aspetti metodologici e la modalità di raccolta dei dati, riteniamo che una simile risorsa possa essere utile ed interessante non solo per la comunità di ricerca italiana ma anche per quella internazionale.
- Published
- 2021