×

Résumé

À l’aide de Machine Learning for Kids, les participants auront la possibilité d’ajouter des données et de commencer à entraîner votre machine. Dans cette activité, nous vous recommandons d’inclure jusqu’à huit étiquettes pour entraîner les données sous-jacentes; par exemple, il pourrait s’agir d’un texte de science-fiction et de Fantasy (p. ex., The laser whizzed ou the Dragon bellowed [le laser sifflait ou le Dragon beugla]). Par la suite, les participants pourront ajouter un exemple de texte sous ces étiquettes avant d’entraîner la machine.

Une fois que le modèle a été formé, les participants devront copier et coller l’élément de remplacement de code dans un éditeur de texte. De là, ils le modifieront légèrement pour le rendre plus efficace avant de saisir de nouvelles lignes de texte et d’observer le modèle procéder au classement sous les étiquettes.

L’activité peut être adaptée selon diverses options de classification de texte, et elle fonctionne toujours si vous souhaitez utiliser un nombre différent d’étiquettes. Gardez à l’esprit que plus vous saisissez de données ou d’étiquettes, plus il faudra de temps à la machine pour s’entraîner.

Cette activité a été créee par Science Venture, un membre de réseau Actua, 2019.

Procédure

Préparation

  • Pour effectuer cette activité, vous devrez créer des comptes afin d’accéder à toutes les ressources nécessaires. Pour cette activité, aucun des comptes auxquels vous serez invité à vous inscrire n’est payant, et ils peuvent tous être utilisés pour cette leçon.
  • Suivez les instructions à télécharger pour configurer votre compte Lite gratuit sur le Cloud IBM. Une fois que cela est fait, vous aurez les clés API nécessaires pour vous connecter à Machine Learning for Kids (MLK).
  • Configurez cinq comptes étudiants avec différentes paires de catégories dans chaque compte. Pour réinitialiser tous les mots de passe des participants et mettre le même pour tous, vous trouverez un bouton au bas de la page de gestion de compte étudiant.
    • Voici des exemples d’étiquettes que vous pouvez utiliser dans chaque compte;
    • Sci-Fi ou fantasy, critiques de films positives ou négatives, salutations ou adieux, langage familier ou formel

Introduction : Comprendre la signification dans la voix

  1. Dans cette activité, nous commençons par présenter aux participants comment « pensent » les machines et l’intelligence artificielle. Lorsque vous recherchez « chien » sur Google, vous obtenez des photos de chiens, mais si vous recherchez « triste », vous pouvez obtenir la photo d’un chien triste. Donc, comment Google et les autres moteurs attribuent-ils des mot-clés aux images? Aujourd’hui, nous ferons une courte activité pour voir si nous pouvons le découvrir!
  2. Assurez-vous d’avoir imprimé ou écrit les cinq ensembles de quatre mot-clés et que les cinq images correspondantes sont prêtes à être présentées en classe.
    • D’abord, récapitulez les informations données aux participants à l’étape 1. Ensuite, dites-leur qu’une fois qu’ils auront vu les quatre mots, ils auront deux minutes pour esquisser ce que la photo devrait être, à leur avis.
    • Une fois les deux minutes écoulées, donnez au groupe le temps de partager leurs croquis et d’en rire un peu.
    • Ensuite, demandez à certains des participants de dire ce qui les a amenés à faire ce dessin.
    • Montrez ensuite l’image réelle à la classe et laissez trente secondes aux participants pour y réfléchir. Demandez-leur de s’exprimer sur la correspondance entre les mots et l’image et de dire s’ils auraient fait un choix différent de celui de Google.
    • Répétez ce processus pour n’importe quel nombre de mots-clés et de photos. On vous encourage à créer votre configuration de cartes en fonction de votre propre groupe, mais vous trouverez des exemples à l’annexe A.
  3. Lorsqu’un ordinateur essaie de classer le texte en fonction de facteurs tels que la nuance émotionnelle, le choix des mots et la grammaire, il peut souvent faire des choix auxquels nous n’aurions pas nécessairement pensé. Cette activité permet de constater que les images ne sont toutes pas étiquetées de la manière que nous pensons, malgré le fait que Google nous donne des résultats qui correspondent à nos recherches.

Activité 1 : Introduction à la programmation python

  1. Tout d’abord, demandez aux participants de choisir un modèle et de se connecter au compte approprié. Dites-leur d’ajouter quelques lignes de texte à leur modèle (en formation). Dites aux participants de s’assurer d’ajouter le même nombre d’exemples dans chaque catégorie. Si une catégorie a plus d’exemples que l’autre, l’ordinateur commencera à privilégier la catégorie ayant le plus d’exemples.
  2. Chaque fois qu’ils mettent le fichier de test à l’épreuve, les participants doivent noter la moyenne de tous les niveaux de confiance et la quantité de données d’entraînement au moment du test. De cette façon, ils peuvent voir le niveau de confiance augmenter à mesure que la quantité de données augmente.
  3. Une fois que chaque catégorie possède au moins cinq exemples de chaque côté, il est temps qu’une personne de chaque compte forme le modèle, sous « Learn & test » (apprentissage et test). Il faut bien s’appliquer à cette étape. Chaque fois que le modèle est en formation, personne ne peut exécuter de lignes de test. Donc, si trop de participants le font, ou qu’un participant le fait trop souvent, il semblera que le programme ne fonctionne pas.
  4. Sous « Make », vous verrez l’écran ci-dessus. Demandez aux participants de copier-coller le code python dans un bloc-note++ ou un éditeur de texte similaire. Demandez-leur de l’enregistrer sous « cat1cat2.py »; cat1 et cat2 peuvent être remplacés par les catégories pertinentes, p. ex. « Scififantasy.py ». Tout d’abord, demandez-leur d’exécuter le code seulement en changeant « le texte que vous souhaitez tester ». Une fois qu’ils ont ouvert une ligne de commande et qu’ils se trouvent dans le bon répertoire, ils peuvent exécuter le programme en entrant « python scififantasy.py ». Le résultat sera celui que l’ordinateur suppose, c’est-à-dire la catégorie à laquelle appartient le texte et le niveau de confiance.

Activité 2 : Aider l’ordinateur à apprendre

  1. Après avoir testé certaines des lignes de code, voici le moment de faire un contrôle avec le groupe dans son ensemble.
    • Qu’ont-ils remarqué avec les lignes de test? Le modèle classe-t-il les lignes de test de la manière attendue? La confiance est-elle élevée ou faible?
  2. Dites au groupe de reprendre l’ajout de données d’entraînement pendant un certain temps (5 ou 10 minutes au maximum). Ensuite, demandez aux mêmes participants du début de l’exercice d’appuyer sur le bouton « train model » (modèle en formation) sous « Learn and Test ». Maintenant, demandez-leur d’exécuter de nouveau leurs programmes Python pour voir si les niveaux de confiance ont changé.

Notez qu’il leur faut seulement copier le code python à partir du site Web après la première formation de l’ensemble, car la clé API donnée est un lien vers votre projet et restera à jour chaque fois que le modèle est formé.

Réflexion & compte rendu

Demandez aux participants de dire comment cela change leur façon de voir les ordinateurs. En quoi ce processus nous profite-t-il et existe-t-il une meilleure façon d’interpréter le texte avec une IA? Demandez aux participants de se tourner vers leur voisin, et pendant 30 secondes, de dire ce qu’ils feraient autrement s’ils avaient une autre occasion.

Prolongements & modifications

Prolongement

  • Au lieu de coder en dur dans les lignes de test chaque fois, demandons au programme de saisir des données. Par exemple, testLine = entrée (« entrez le texte de test »), puis remplacez « le texte que vous souhaitez tester » par testLine. Maintenant, quand ils exécutent le programme, il leur sera demandé d’entrer les données.
  • Pour améliorer davantage le programme, placez l’ensemble de texte inférieur dans une boucle afin que le programme continue à demander de nouvelles lignes de test jusqu’à ce qu’une chaîne vide soit entrée.
  • Voici l’extrait de code pour ouvrir le fichier, mettre les lignes dans une liste, supprimer les sauts de ligne/espaces blancs, puis tester chaque ligne et imprimer le résultat sur la console.
    • Test à partir d’un fichier et autres défis – testFile = open (« scififantasyLines.txt », « r ») – testLines = testFile.readlines () – pour la ligne dans testLines : – testLine = line.rstrip () #needed pour supprimer le caractère de nouvelle ligne.

Modifications

  • Si vous entraînez les modèles au préalable avec le minimum de données, vous pouvez demander aux participants de commencer les tests à l’aide de la programmation python. Cela fonctionne bien si vous souhaitez éviter plusieurs cycles de formation, et vous obtenez toujours l’avantage de voir le modèle s’améliorer après que les participants ont ajouté des données de formation.
  • Soit que les participants proposent un ensemble de données de test, soit que les instructeurs écrivent un ensemble de données de test au préalable. Pour l’exemple de science-fiction et de fantaisie, on a utilisé scififantasyLines.txt comme nom de fichier de test.
  • Si vous voulez éviter la programmation python, vous pouvez dire aux participants d’essayer des lignes de test sur la page « Learn and Test » à la place. Attention à bien préciser que le bouton « Train model » ne doit être enfoncé que par une seule personne, à des moments précis (une fois après que la quantité minimale de données d’entraînement soit entrée, et une autre fois après qu’ils ont fait un autre cycle d’entraînement).
Ce site utilise des cookies pour vous garantir la meilleure expérience utilisateur. En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies.
Acceptez