I dati sintetici sono uno dei tanti strumenti forniti dall’intelligenza artificiale. La loro generazione consiste nel partire da un dataset reale, avente una propria distribuzione di probabilità, per poi addestrare un modello di Machine Learning (o Deep Learning) in modo tale che apprenda tale distribuzione di probabilità nella maniera più accurata possibile ed infine, una volta terminato l’addestramento, estrarre campioni dalla distribuzione di probabilità appresa, dando vita così ai dati sintetici.

Al momento all’Innovation Lab stiamo conducendo uno studio su larga scala sull’utilizzo di ChatGPT per la generazione di dati sintetici che possano arricchire l’addestramento dei nostri modelli di classificazione testuale, in modo tale da poterne migliorare le prestazioni.