Quatre jours pour apprendre YOLOv5 et comprendre comment une IA voit le monde en temps reel.
L'idee vient d'une partie de Valorant, soyons honnetes. Mais l'objectif reel etait de comprendre concretement comment fonctionne la detection d'objets en temps reel : comment un modele de deep learning peut identifier et localiser des elements visuels dans un flux video, image par image.
Project Athena V1 est un projet personnel d'apprentissage base sur YOLOv5 (You Only Look Once) et OpenCV. Pas de backend web, pas de base de donnees : juste Python, PyTorch, et le probleme fondamental de "comment une machine voit-elle ?"
Note : ce projet a ete developpe dans un cadre strictement educatif. L'utilisation de bots dans les jeux competitifs est contraire aux CGU des editeurs et ce n'est pas l'usage qui m'interessait.
La pipeline de detection suit une logique simple mais couteuse en calcul : capturer l'ecran, passer l'image dans le modele, recuperer les bounding boxes des objets detectes, filtrer par seuil de confiance.
Screenshot toutes les N ms, resize a la resolution attendue par YOLOv5, conversion BGR/RGB pour OpenCV.
Passage de l'image dans le modele pre-entraine sur GPU. Retourne les coordonnees et scores de confiance de chaque objet detecte.
Selection de la cible prioritaire par seuil de confiance et distance au centre. Logique de decision simple basee sur la position relative.
Quatre jours pour passer de "je n'ai jamais touche a PyTorch" a "j'ai un pipeline de detection d'objets qui tourne en temps reel". C'est dense. Le plus difficile n'etait pas le modele lui-meme (YOLOv5 vient avec ses poids pre-entraines) mais l'optimisation des performances : reduire la latence entre la capture et l'affichage des resultats sans sacrifier la precision.
Ce projet m'a ouvert une porte sur le monde de l'IA appliquee a la vision. Les techniques de detection d'objets ont des applications serieuses dans la sante, l'industrie, la robotique. Comprendre les mecaniques de base ici m'a donne un point de depart pour explorer ces domaines.