Oppure copia e incolla questo link dove vuoi!

IF2018 – Soccer Data Challenge [Hackathon]

IF2018Dentro la Data Science applicata allo sport. Dal Fantacalcio alla previsione degli infortuni. All’IF2018 la Soccer Data Challenge: 11 team e una sfida lunga 30 ore per premiare la soluzione software più efficace ed elegante.

Nelle giornate di venerdì e sabato è andato in scena alla Camera di Commercio un Hackathon sul calcio. In questa Soccer Data Challenge i concorrenti hanno avuto a disposizione: oltre 500 mila record, un dataset contenente tutti gli eventi di gioco di ciascuna partita, ogni singolo tocco di palla del giocatore, il suo esito e la posizione sul campo nella quale è avvenuto per ciascuna gara del campionato e per ciascun giocatore, al fine di individuare quale fosse stato in campo il ruolo di un determinato giocatore durante la partita, riuscendo a distinguere, ad esempio, tra un’ala alla Perisic e un attaccante esterno alla Gomez, o tra un centravanti di riferimento e uno opportunista; e secondariamente produrre delle analisi sulla duttilità dei singoli giocatori e sugli stili di gioco delle squadre a seconda delle gare. Una sfida che dunque ha richiesto ai partecipanti non solo abilità informatiche, ma anche intuizione e conoscenze tattiche in ambito calcistico.

Soccer Data Challenge

Abbiamo chiesto a Paolo Cintia e Luca Pappalardo del CNR-ISTI di raccontarci del progetto SoBigData e del problema di gara.

Nella seconda giornata dell’evento abbiamo invece scambiato una chiacchierata con i membri della giuria della Soccer Data Challenge, a cominciare dal Prof. Paolo Ferragina del Dipartimento di Informatica – dove sono attivi degli indirizzi in Data Science e un master proprio in Big Data - che ha spiegato come attraverso lo studio di una grande mole di dati sul calcio e sugli allenamenti il progetto si ponga due importanti obiettivi:
Il primo è la prevenzione degli infortuni, attraverso anzitutto i dati sugli allenamenti, che si prevede di integrare con dati fisiologici dell’atleta. L’utilizzo di questi ultimi però – ha sottolineato la ricercatrice Anna Monreale – solleva un problema etico che non si limita al diritto alla privacy, ma coinvolge il nuovo regolamento GDPR, il quale prevede l’utilizzo di algoritmi “spiegabili”, in questo caso al giocatore stesso che magari si ritrova a dover saltare una gara perché l’algoritmo ha previsto per lui un alto rischio di infortunio.
Il secondo è lo sviluppo di un algoritmo che mira a prevedere la qualità della performance del giocatore basandosi su oltre 100 aspetti delle sue prestazioni precedenti. Tale algoritmo verrà ulteriormente affinato considerando tramite catene di Markov anche le interazioni con gli altri giocatori in campo, realizzando un modello dello stile di gioco di ciascuna squadra, da poter poi inserire su una piattaforma oper source accessibile ai match analyst, ai preparatori atletici o anche a chi fa il fantacalcio.

I dati vengono forniti da Wyscout, piattaforma che ha contribuito all’evoluzione dello scouting, passato dalla tradizionale osservazione allo stadio, all’invio di cassette, fino alla possibilità di rivedere con un click le singole giocate. Vlad Andersen ha sottolineato come in Italia si continui a utilizzare principalmente il video, poiché manca ancora una cultura diffusa sull’utilizzo dell’analisi dei dati. Nel mondo esistono 400 mila calciatori e non sarebbe possibile visionarli tutti, mentre i dati permettono di filtrare facilmente le caratteristiche che cerchi e di definire modelli predittivi quali gli Expected Goals. C’è un fattore culturale in questa ritrosia, ed è vero che il risultato nel calcio è intrinsecamente più legato alla fortuna, rispetto agli sport americani dove si ha una frequenza molto più alta di eventi rilevanti (tiri, variazione di punteggio), ma la direzione intrapresa in tutti i campionati principali è ormai quella di cercare più conclusioni pericolose e affidarsi meno alla fortuna.

Per concludere ci siamo trattenuti qualche minuto con Flavio Fusi, redattore della rivista L’Ultimo Uomo, per una chiacchierata sul rapporto tra tifosi e data analysis.

Federico Erittu per RadioEco

post di questa categoria

daddygdep

DADDY G (Massive Attac...

DADDY G (Massive Attack) Dj set @Deposito Pontecorvo

48376785_2036344256401325_6492128945222189056_n

The Hacker al Deposito...

The Hacker al Deposito Pontecorvo e tanti altri | ATP #159

scarda

Scarda + La Stazione @...

Scarda + La Stazione @ Lumiere [report & intervista]

francesca michielin

Francesca Michielin li...

Francesca Michielin live al Reverse e tanti altri eventi| ATP #156

ultimi post caricati

Fable-art

Fable per videogiochi ...

Fable per videogiochi sottovalutati, nerdeco #52

Nkisi

Nkisi, Panda Bear, Lal...

Nkisi, Panda Bear, Lali Puna & more | Demography #331

Samsung

Apple e Samsung riesco...

Apple e Samsung riescono finalmente a collaborare – Tutto il tech della settimana #9

Lana Del Rey

Lana Del Rey, Beirut, ...

Lana Del Rey, Beirut, Stats & more | Demography #330

Commenti