Sports Analytics Challenge

Participe à un concours unique : révolutionne la pratique du football grâce à tes compétences scientifiques !

Translate this page

Les enjeux du challenge

Créer un algorithme permettant d’optimiser toutes les composantes d’une performance sportive avant, pendant et après match à partir d’un jeu de données que nous te proposerons !

Contexte de prédiction

Dans les ressources de ton espace de participation, tu trouveras un fichier avec une explication des bases de données. La procédure suivante sera appliquée plusieurs milliers de fois à ton algorithme :

  • Nous sélectionnons au hasard un match dans la base de données de test (fichiers F24 Opta de tous les matchs de la seconde partie de la saison Ligue 1 2016-2017).
  • Nous choisissons au hasard la première ou la seconde mi-temps pour ce match.
  • Nous choisissons au hasard 15 minutes de la mi-temps sélectionnée (tous les événements entre t et t+15 minutes avec t choisi au hasard).
  • Nous remplaçons tous les noms des équipes par "1" (à domicile) ou "0" (à l'extérieur). Dans les fichiers, cela signifie que nous remplaçons "team_id" par "1" ou "0".
  • Nous supprimons tous les identifiants de joueurs et écrivons "0" à la place, sauf pour un joueur choisi au hasard (ayant joué plus de 800 minutes sur la base d'apprentissage et n'ayant pas changé d'équipe au mercato). Nous écrivons "1" pour l'identifiant de ce joueur spécifique. Dans les fichiers, cela signifie que nous remplaçons "player_id" par "1" ou "0".
  • Nous supprimons toutes les informations sur la position (y, x) pour tous les événements, à l'exception des 10 derniers événements Opta dans les 15 minutes. Dans les fichiers, cela signifie que nous remplaçons "y" par "0" ou "x" par "0". De plus, lorsque Type ID=140, Type ID=141, qualifier_id=140 ou qualifier_id=141 apparait, nous remplaçons les valeurs par " ".
  • Nous allons également supprimer tout ce qui est écrit dans les fichiers F24 avant le premier événement Opta. Nous remplaçons aussi les valeurs de Event  timestamp, Event id, Q id et version par "".
  • Nous réduisons une partie de l'information des 10 derniers événements. Dans les fichiers, cela signifie que :
    - pour les 10 derniers événements, nous remplaçons "outcome" par " ".
    - pour les 10 derniers événements, nous nous débarrassons des informations sur qualifier_ID
     et nous remplaçons donc la "valeur" par " ".
    Ainsi, nous remplaçons tous les "qualifier_id" par " ".
Prêt à démarrer ?

Clique sur le bouton "Participer" pour accéder à ton espace de participation et découvrir l'ensemble des ressources disponibles.