Radio-Canada, faites-en une affaire personnelle!

L'Hackathon 2019 est maintenant ouvert, inscrivez-vous.

  
Vous trouverez ici des vidéos et des liens pour vous familiariser avec les différents services, API et données auxquels vous aurez accès pendant le week-end du Hackathon CBC/Radio-Canada 2019. Nous vous recommandons fortement d’en prendre connaissance.
 
Ne manquez pas notre séance de questions et réponses en direct le mardi 22 janvier de 19h à 21h (heure de l’Est) sur Slack (le lien sera accessible le 21 janvier). Des experts seront présents en ligne pour répondre à vos questions.

Allocation des crédits Microsoft et Amazon Web Services

Vous recevrez vos crédits AWS et MS le lundi 28 janvier via le site de l’événement. D’ici là, nous vous invitons à utiliser un compte gratuit chez Microsoft et Amazon Web Services.
Accessibilité

L’accessibilité des plateformes numériques est très importante pour CBC/Radio-Canada. Par conséquent, nous suggérons fortement aux équipes de présenter des prototypes minimalement conformes aux critères WCAG 2.0 AA. Consulter notre site pour plus d’informations.

Les données de Radio-Canada

 

 
Télécharger les nouveaux fichiers de données au format CSV.
 
Présentation de ReadJS (0:09)
Présentation de nBOX et du système de recommandation de contenus (4:17)
Présentation de SiteSearch + Neuro (10:45)
Exemple d’appel de Neuro et SiteSearch (13:40)
Les données de CBC

 
 
 
Présentation de ReadJS (0:34)
Présentation de nBOX / système de reco (4:09)
API de lecture des articles (Polopoly API) (9:02)
API d'agrégation de contenus (Aggregate API) (12:21)
API Audio (14:53)
 
Liens utiles: 
Aggregate API
 
 
Les services Microsoft 

 
 
Les services Amazon Web Services

 
Créer une machine virtuelle:

                  Vidéo - Créer une machine virtuelle
                  Plus d’informations
 
Créer une base de données:

                  Vidéo - Créer une base de données
 
Déployer une application sur le cloud: 
 
                  Plus d’informations
 
Survol des différents services d’intelligence artificielle:
 
 
                  En complément:
                  Consultez la base de connaissances AWS ici
                  YouTube AWS: ici

Questions/Réponses   Radio-Canada

 

Oui, Radio-Canada mettra à la disposition des participants des données de lecture pour une journée, tout comme CBC

Non, il n’y aura pas de données sur la consommation des vidéos. Par contre, il sera possible de déterminer si un contenu lu (dans les données de lecture) contient une vidéo.

Non il n'y a pas de rate limiting sur l'API, mais un appel sur un URL va être cacher pendant 2 min.

 

Non, les données de consommation disponibles (côté Radio-Canada) se résument à ce qui est récolté par ReadJS sur les articles de ici.radio-canada.ca. 

Comment se passe l’accessibilité à Radio-Canada? Un comité comprenant tous les corps de métier concernés, soit Design, Programmation, Intégration et Contenu éditorial, a été formé pour rédiger des normes, qui sont disponibles depuis septembre 2015 sur le site reperes.ici.ca, dans l’onglet programmation et intégration. On y retrouve les sections correspondant à chaque corps de métier. Les normes sont accompagnées d’astuces et de captures d’écran ainsi que de conseils sur la manière de les mettre en œuvre.

  • Pour les personnes qui ont un handicap visuel, il existe des lecteurs d’écran. Ce sont des logiciels que l’on peut télécharger dans un ordinateur et qui lisent le contenu des pages web.

  • Pour les personnes qui ont un handicap auditif, il y a les sous-titres qui permettent la lecture d’une transcription du contenu audio d’une vidéo.

  • Finalement, pour les personnes à mobilité réduite, il y a la navigation par tabulation. En utilisant la touche de tabulation, le curseur surligne des contenus que l’on peut alors sélectionner avec la touche « entrée ».

Nous n'utilisons pas d'algorithmes de classement pour la recherche.  Le résultat de la recherche est trié par ordre de date de publication du document.

`Q`est le terme de recherche. Le terme en question sera recherché dans le titre et le sommaire de l'article.  Il aura un peu plus de poids s’il est dans le titre que s’il est dans le sommaire. 

Non malheureusement, la recherche retourne seulement le contenu sommaire, mais il est possible d'aller charger l'article au complet avec l'API de neuro.
 

Non, malheureusement nous ne n'utilisons pas swagger pour cet API.

L'erreur 598 se produit car les serveurs pour le hackathon ne sont pas sollicités. Après plusieurs appels, pour "réveiller" les serveurs,  l'API répond. Les experts regarderont plus particulièrement quand on passe le client-key par querystring lors du hackathon.

 

Questions/Réponses   CBC

 

How does accessibility work at CBC? A Radio-Canada committee, comprising all the relevant trades, namely Design, Programming, Integration and Editorial Content, has been formed to draft standards, which are available on the French site reperes.ici.ca, in the”Programmation et intégration” tab. CBC translated these norms and you can find them here. There are sections corresponding to each type of work. The standards come with tips and screenshots and tips on how to implement them.

For people with visual disabilities, there are screen readers. These are software that can be downloaded onto a computer and that reads the content of web pages.

For people with a hearing impairment, there are subtitles that allow playing a transcript of the audio content of a video.

Finally, for people with reduced mobility, there is tabulation. By using the tab key, the cursor highlights content that can then be selected with the "enter" key

Not for Aggregate API. You can use all endpoints listed in the API documentation, i.e. swagger documentation. But please avoid more than a few requests per second though.

The read data is currently only for written articles. Some of these articles have embedded video, but the read event does not guarantee that the user has watched the video.
Internally we also train a model using data from video watches (on those embedded videos) but it's not being made available for the hackathon yet. I can ask about it though. Wouldn't be too much effort for me to make an anonymized dataset in the same format as the read data. It just depends on data ownership and the like
.

 

If you're referring to the "cxense" search, for Aggregate API it's sorted by date. It doesn't look at the body. Just the headline/title/categories, to search in the article's body.

Cxense would indeed be your best bet. I'll ask the team that owns this product and provide an answer for that on the Agorize platform. However, Aggregate API has a proxy to Cxense: see endpoint "/proxied-content/web-search-results". 

Questions/Réponses  Microsoft

 

Vous pouvez utiliser tous les services Azure. La seule restriction est au niveau des produits de tiers party dans le marketplace. Tout ce qui est ici est disponible essentiellement: ici

Oui, il y aura des experts Microsoft à Montréal et à Toronto. Ils seront aussi disponibles à travers la plateforme Agorize pour ceux qui le souhaitent.

Questions/Réponses  Amazon Web Services

 

The amount of credits per team remains to be finalized but there should be enough for you to run through the weekend. Unfortunately, given the structure of the accounts under AWS Organizations, you will not be able to add your own credits

Questions/Réponses  Générales

 

Comme Radio-Canada est une entreprise Canadienne, nous travaillons dans les deux langues. Il serait donc avantageux pour l'équipe de produire un prototype qui peut fonctionner en anglais et en français. Ce qui est recherché est principalement le support du multilinguisme. On ne s’attend pas nécessairement à ce que le prototype fonctionne dans les deux langues. Si c’est le cas, c’est des points de plus pour vous.

16 équipes au total sont sélectionnées pour la finale, 8 à Toronto et 8 à Montréal. L'évènement se déroulera en simultané dans les deux villes.

Oui, il possible de remporter deux prix. Le prix étudiant est dédié à l'équipe dont tous les membres étaient inscrits dans un établissement d'enseignement au moment de l'inscription.