L’optimisation des pratiques d’investigation numérique par apprentissage automatique : Le défi des objets connectés

Les objets connectés, communément appelés aussi Internet des objets (Internet of Things, IoT) permettent de créer des environnements intelligents offrant un vaste choix de services, allant des véhicules intelligents, aux maisons intelligentes, pour ne nommer que ces deux-là. Ces environnements sont utilisés par la majorité de la population puisqu’ils améliorent l’efficacité, le confort et la sécurité des activités du quotidien. Les interactions entre les utilisateurs et l’IoT créent un important volume de données hétérogènes qui, une fois analysé, pourrait faciliter la mise en évidence de preuves cruciales dans le cadre d’investigations numériques. Toutefois, la collecte des traces numériques générées et emmagasinées par ce type d’appareil est plus complexe que pour les disques durs d'ordinateurs, où l'intégralité du contenu peut être récupérée plus facilement. De plus, les normes internationales, comme « ISO/IEC 27043:2015 – Principes et processus d’enquête sur les incidents » ne sont pas adaptées aux défis que représentent le traitement des traces issues des objets connectés, notamment sur le plan de la diversité et de la sécurité des données, de même que les protocoles de communications qu’ils utilisent.

image numérique 2

Afin de contribuer au développement de procédures uniformisées pour l’acquisition de données sur ce type d’appareils, les auteurs suggèrent un certain nombre de solutions découlant d'articles publiés entre 2018 et 2023, où des chercheurs ont utilisé les techniques d’apprentissage automatique dans le domaine des investigations forensiques numériques. L’apprentissage automatique, qui constitue une forme d’intelligence artificielle, permet à une machine d’effectuer des tâches qu’elle a apprises en s’entraînant sur un ensemble de données cohérentes, notamment dans le but de détecter des traces d’intérêt, d’anticiper des activités criminelles et d’automatiser les procédures d’enquêtes. Cette technique permet donc de développer des outils pouvant bénéficier aux enquêteurs en minimisant les efforts et le temps qu’il leur est nécessaire de consacrer pour trier et de grandes quantités de données diversifiées.

Pour citer un exemple de cas où l’apprentissage automatique s’avère utile, les auteurs citent une étude réalisée par Ngejane, Eloff, Sefara et Marivate (2021), où l’on démontre que l’analyse automatisée de textes permet de détecter des discussions en ligne impliquant des prédateurs sexuels. Cette solution permet de trier ces traces pertinentes à travers le volume grandissant de traces numériques générées par le biais de conversations en ligne.

Cependant, ce genre de technique présente certaines limites, dont le manque d’intelligibilité et de données adéquates pour l’entraînement, ce qui peut mener à des modèles moins performants. Les auteurs soulèvent la pertinence de simuler des résultats afin de comparer les différentes techniques et d’aborder ces manquements.

Les environnements intelligents détiennent des traces numériques jusqu’à présent inexploitées. L’apprentissage automatique exerce une influence substantielle sur la forensique numérique et son utilisation peut améliorer l’efficacité globale des investigations en trouvant des tendances et des modèles, des similitudes, des anomalies et d’autres caractéristiques dans les preuves numériques. C’est en appliquant les solutions présentées dans cet article que les chercheurs ainsi que les enquêteurs pourront améliorer les techniques d’apprentissage automatique en fonction des besoins opérationnels.

En utilisant davantage l’apprentissage automatique, non seulement les enquêteurs pourront produire des pistes et résoudre des crimes en moins de temps et avec moins de ressources ce qui permettra de réduire largement le coût des investigations, mais également, ils pourront acquérir la capacité de reconnaitre des activités criminelles et d’apprendre quand, où et comment un crime s’est produit. Toutefois, il est crucial d’adapter les pratiques actuelles afin de prendre en compte les particularités que présentent les objets connectés et d’assurer la bonne conduite d’acquisition et d’analyse des traces numériques pour mener efficacement à terme les enquêtes impliquant ce type d’appareils.


Par Élisabeth Charette (octobre 2024)


Tageldin, L., & Venter, H. (2024). Machine-Learning Forensics: State of the Art in the Use of Machine-Learning Techniques for Digital Forensic Investigations within Smart Environments. Applied Sciences, 13(18), 10169.





S'inscrire pour recevoir les nouvelles du LAB404 et les synthèses de recherche

* requis

Énoncé de confidentialité