Oppure copia e incolla questo link dove vuoi!

IF2018 – Soccer Data Challenge [Hackathon]

IF2018Dentro la Data Science applicata allo sport. Dal Fantacalcio alla previsione degli infortuni. All’IF2018 la Soccer Data Challenge: 11 team e una sfida lunga 30 ore per premiare la soluzione software più efficace ed elegante.

Nelle giornate di venerdì e sabato è andato in scena alla Camera di Commercio un Hackathon sul calcio. In questa Soccer Data Challenge i concorrenti hanno avuto a disposizione: oltre 500 mila record, un dataset contenente tutti gli eventi di gioco di ciascuna partita, ogni singolo tocco di palla del giocatore, il suo esito e la posizione sul campo nella quale è avvenuto per ciascuna gara del campionato e per ciascun giocatore, al fine di individuare quale fosse stato in campo il ruolo di un determinato giocatore durante la partita, riuscendo a distinguere, ad esempio, tra un’ala alla Perisic e un attaccante esterno alla Gomez, o tra un centravanti di riferimento e uno opportunista; e secondariamente produrre delle analisi sulla duttilità dei singoli giocatori e sugli stili di gioco delle squadre a seconda delle gare. Una sfida che dunque ha richiesto ai partecipanti non solo abilità informatiche, ma anche intuizione e conoscenze tattiche in ambito calcistico.

Soccer Data Challenge

Abbiamo chiesto a Paolo Cintia e Luca Pappalardo del CNR-ISTI di raccontarci del progetto SoBigData e del problema di gara.

Nella seconda giornata dell’evento abbiamo invece scambiato una chiacchierata con i membri della giuria della Soccer Data Challenge, a cominciare dal Prof. Paolo Ferragina del Dipartimento di Informatica – dove sono attivi degli indirizzi in Data Science e un master proprio in Big Data - che ha spiegato come attraverso lo studio di una grande mole di dati sul calcio e sugli allenamenti il progetto si ponga due importanti obiettivi:
Il primo è la prevenzione degli infortuni, attraverso anzitutto i dati sugli allenamenti, che si prevede di integrare con dati fisiologici dell’atleta. L’utilizzo di questi ultimi però – ha sottolineato la ricercatrice Anna Monreale – solleva un problema etico che non si limita al diritto alla privacy, ma coinvolge il nuovo regolamento GDPR, il quale prevede l’utilizzo di algoritmi “spiegabili”, in questo caso al giocatore stesso che magari si ritrova a dover saltare una gara perché l’algoritmo ha previsto per lui un alto rischio di infortunio.
Il secondo è lo sviluppo di un algoritmo che mira a prevedere la qualità della performance del giocatore basandosi su oltre 100 aspetti delle sue prestazioni precedenti. Tale algoritmo verrà ulteriormente affinato considerando tramite catene di Markov anche le interazioni con gli altri giocatori in campo, realizzando un modello dello stile di gioco di ciascuna squadra, da poter poi inserire su una piattaforma oper source accessibile ai match analyst, ai preparatori atletici o anche a chi fa il fantacalcio.

I dati vengono forniti da Wyscout, piattaforma che ha contribuito all’evoluzione dello scouting, passato dalla tradizionale osservazione allo stadio, all’invio di cassette, fino alla possibilità di rivedere con un click le singole giocate. Vlad Andersen ha sottolineato come in Italia si continui a utilizzare principalmente il video, poiché manca ancora una cultura diffusa sull’utilizzo dell’analisi dei dati. Nel mondo esistono 400 mila calciatori e non sarebbe possibile visionarli tutti, mentre i dati permettono di filtrare facilmente le caratteristiche che cerchi e di definire modelli predittivi quali gli Expected Goals. C’è un fattore culturale in questa ritrosia, ed è vero che il risultato nel calcio è intrinsecamente più legato alla fortuna, rispetto agli sport americani dove si ha una frequenza molto più alta di eventi rilevanti (tiri, variazione di punteggio), ma la direzione intrapresa in tutti i campionati principali è ormai quella di cercare più conclusioni pericolose e affidarsi meno alla fortuna.

Per concludere ci siamo trattenuti qualche minuto con Flavio Fusi, redattore della rivista L’Ultimo Uomo, per una chiacchierata sul rapporto tra tifosi e data analysis.

Federico Erittu per RadioEco

post di questa categoria

todays festival 4

TOdays Festival 2019 |...

TOdays Festival 2019 | Demography #431

viaggi 5

Viaggi infiniti questo...

Viaggi infiniti questo fine luglio: live, flamenco e jazz |atp #181

50790796_1878774345582404_5703688832189202432_n

Festival, Toscana Prid...

Festival, Toscana Pride: tanti concerti e non solo | ATP #180

arno

Arno vivo, Gioco del P...

Arno vivo, Gioco del Ponte, Ennio Morricone e tanto altro! |atp #179

ultimi post caricati

Sam Smith

Sam Smith, Stormzy, Gi...

Sam Smith, Stormzy, Giaime & molto altro | Demography #430

Spoon

Spoon, Ride, Jenny Hva...

Spoon, Ride, Jenny Hval |Demography #429

alessandro cortini

Alessandro Cortini, Ne...

Alessandro Cortini, New Order, Daymé | Demography #428

Margherita Vicario

Margherita Vicario, Ed...

Margherita Vicario, Ed Sheeran, Blood Orange e molto altro | Demography #427

Commenti