Business Oriented Challenge

spaziodati-34293

Sponsor: SpazioDati.

Gli enti pubblici come i comuni hanno costantemente bisogno che siano svolti diverse attività, come per esempio pavimentazione stradale, gestione impianti sportivi, manutenzione aree verdi, etc. A tal fine aprono bandi di gara per chiedere alle imprese di offrire questi servizi al prezzo più basso. In Italia ci sono circa 8000 comuni, e per un impresa monitorare tutti i bandi può richiedere un notevole sforzo. SpazioDati offre un servizio di ricerca di imprese chiamato Atoka, che permette di trovare aziende per partita IVA, settore e contenuti dei loro siti web. Per esempio, permette di capire rapidamente i prodotti e servizi venduti dalle aziende di un certo territorio. Tra i vari filtri, è possibile ricercare aziende che siano risultate vincitrici di bandi pubblici. SpazioDati ci chiede di aggiungere filtri riguardanti i bandi di gara, implementando funzionalità come estrazione di parole chiave, classificazione dei bandi, estrazione di date, importi e luoghi.

In Trentino sono disponibili su dati.trentino bandi di gara per vari comuni forniti da ComunWeb, negli esempi ci concentriamo su Trento. Per avere un’idea di cosa è disponibile, si può guardare l’interfaccia di ricerca sul sito del Comune di Trento, che permette di cercare per

  • titolo

  • servizi o ufficio di competenza

  • argomento

  • tipologia (lavori pubblici, servizi, forniture)

  • fase (aperto, in esame, aggiudicato)

  • data pubblicazione

Per i fini di questa challenge, ci limiteremo ad usare il dataset dei bandi di gara da dati.trentino.ti con un dataset di aziende trentine ricavato dal database di Atoka di SpazioDati. Il vostro compito sarà integrare i dataset ed estenderli ulteriormente con altre colonne come keywords e importo, implementando infine un prototipo di motore di ricerca che permetta di filtrare in base a tali colonne.

a. Analisi

Quante e quali aziende potrebbero essere interessate al nostro servizio ?

b. Ricerca base

Un primo approccio semplice potrebbe essere replicare la ricerca già presente sul sito del comune. Per iniziare, basterebbe creare delle funzioni python che permettono di specificare i vari argomenti di ricerca. Fatto ciò, se rimane tempo e se ne hanno le competenze, si potrebbe pensare di costruire una interfaccia HTML rudimentale.

c. Ricerca avanzata

Si potrebbe migliorare le funzionalità di ricerca permettendo di filtrare:

  • keyword

  • importo complessivo

  • sottocategorie (pavimentazioni, reti idrauliche …)

  • area geografica, comune

Per realizzare quanto sopra, si potrebbe effettuare analisi semantica del testo usando il servizio Dandelion di SpazioDati con l’API Entity Extraction (vedi esempio visuale e documentazione API)

Esempi di ricerca:

  • impresa edile vuole sapere quando esce un bando per lavori pubblici da almeno 2 milioni di euro in un certo territorio, filtrando se possibile tra lavori di pavimentazioni, reti idrauliche, impianto di illuminazione pubblica, etc. Esempio Lavori Pubblici - Area ex Michelin CIG n. 70813914B7

Dalla descrizione è possibile estrarre diverse parole chiave che identificano i lavori effettivamente richiesti ( pavimentazioni, reti idrauliche, impianto di illuminazione pubblica etc). Esempio estrazione su Dandelion (leggermente editato per stare nei limiti del sito). L’estrazione dell’importo complessivo può essere invece fatta con l’uso di regex Altre imprese potrebbero essere imprese di pulizie, servizi alla persona, etc…

d. Bandi simili

Dato un bando, un’impresa potrebbe voler cercare bandi simili, per esempio per capire quali sono stati i criteri di selezione e per individuare quanti e quali potenziali aziende concorrenti hanno partecipato al bando.

Dati bandi di gara

Dataset su dati.trentino: http://dati.trentino.it/dataset/bandi-di-gara-del-comune-di-trento

Esempi API per comune di Trento (per documentazione parametri query vedere documentazione ComunWeb):

JSON www.comune.trento.it/api/opendata/v2/content/search/classes+bando+offset+30

CSV: API: www.comune.trento.it/exportas/custom/csv_search?classes=bando

Dati Atoka

Questo dataset è fornito da SpazioDati tramite il servizio Atoka . Riportiamo qui un esempio dei dati (in verticale).

Per i dati completi chiedere a david.leoni@unitn.it

aziende-98232

[ ]: