Kaggle Challenge - dataset per tutti i gusti

Area di interesse: tutte !

Kaggle è il sito di riferimento per data scientists, ricco di dataset e spunti interessanti ben categorizzati (per scaricare i dataset occorre registrarsi). Dategli un’occhiata perchè merita:

https://www.kaggle.com/datasets

Alcuni aree presenti tra le 1000:

Si può semplicemente usare il sito come fonte dati, oppure seguire le sfide proposte: prendendo per esempio le recensioni, si potrebbe scrivere un programmino rudimentale che cerca di capire se una recensione Amazon è positiva guardando se contiene le parole ‘bello/a’, ‘fantastico/a’, e poi confrontare i risultati con il numero di stelle che l’utente ha assegnato all’articolo per vedere quanto concordano.

Qua sotto riportiamo come prendere da Kaggle per esempio il CSV dei video trending di YouTube che contengono cose tipo i like, la descrizione, il numero di commenti etc :

youtube-892328

[ ]: