Une étude de cas sur le modèle de reconnaissance faciale

Ensemble de données vidéo anti-usurpation d'identité pour les modèles d'IA de détection de fraude

Découvrez comment Shaip a fourni 25,000 XNUMX ensembles de données vidéo anti-usurpation d'identité de haute qualité comprenant des scénarios d'attaque réels et répétés pour former des modèles d'IA pour la détection des fraudes.

Collecte de données vidéo anti-usurpation d'identité

Résumé du projet

Shaip s'est associé à une société leader dans le domaine de la sécurité de l'IA pour fournir un ensemble de données vidéo anti-usurpation d'identité de haute qualité et prêt à l'emploi, conçu pour améliorer la formation des modèles d'IA pour la détection des fraudes. L'ensemble de données comprenait 25,000 XNUMX vidéos capturant des scénarios d'attaque réels et répétés, garantissant des données de formation robustes pour les modèles anti-usurpation d'identité.

Chacun de la participants 12,500 a contribué à deux vidéos, une attaque réelle et une attaque en rediffusion, enregistrées à Résolution 720p ou supérieure avec une fréquence d'images de 26 FPS et plus.

L’objectif du projet était de fournir des ensembles de données authentiques et diversifiés cela permettrait aux modèles d’IA de distinguer efficacement les vidéos biométriques réelles et falsifiées, réduisant ainsi les risques de fraude dans les systèmes d’authentification biométrique.

Collecte de données vidéo anti-usurpation d'identité

Principales statistiques

25,000 nombre total de vidéos (12,500 de vraies vidéos, 12,500 (vidéos d'attaque en rediffusion)

12,500 SÉJOUR MÉMORABLE
participants

5 groupes ethniques
représenté dans l'ensemble de données

Livraison échelonnée : 4 lots de 6,250 vidéos chacune

Attributs des métadonnées : 12 paramètres clés pour une meilleure utilisabilité des ensembles de données

Portée de l'ensemble de données biométriques anti-usurpation d'identité

Conservation des données : Le projet s'est concentré sur la fourniture d'ensembles de données vidéo anti-usurpation d'identité de haute qualité composés de vidéos d'attaques réelles et en différéLes principaux aspects comprenaient :

  • participants 12,500 contribuant deux vidéos chacune (1 vrai, 1 falsifié).
  • Diversité des appareils d'enregistrement pour améliorer l’adaptabilité du modèle.
  • Représentation ethnique équilibrée pour assurer l’inclusivité des ensembles de données.

Collecte de métadonnées : Chaque vidéo était accompagnée de 12 attributs de métadonnées pour améliorer la convivialité des ensembles de données.

Défis liés à la collecte de données vidéo

Assurer une représentation égale

Maintenir une distribution équilibrée des données en termes d'ethnicité tout en recherchant des vidéos de haute qualité.

Contrôle de qualité

S'assurer que chaque participant contribue à une vidéo d'attaque réelle et à une vidéo d'attaque en rediffusion pour maintenir l'intégrité de l'ensemble de données.

Cohérence technique

Adhérant à des directives strictes en matière de FPS (≥ 26), de résolution (≥ 720p) et de précision de l'horodatage (+/- 0.5 ms).

Comment nous l'avons résolu

Shaip a fourni un ensemble de données structuré et de haute qualité pour répondre aux exigences du projet. La solution comprenait :

Conservation et contrôle de la qualité des ensembles de données

  • Vidéos 25,000 collectés à travers Phases 4 pour assurer un flux de données stable et structuré, en évitant les goulots d'étranglement.
  • Processus de validation rigoureux pour assurer le respect des FPS, résolution et précision des métadonnéesChaque vidéo a subi plusieurs contrôles de qualité avant l’acceptation finale.
  • Balisage complet des métadonnées avec 12 attributs:
  • ID/Nom du fichier
  • Type d'attaque (réelle/reprise)
  • ID de personne
  • Résolution du vidéo
  • Durée de la vidéo
  • Ethnicité du sujet
  • Genre du sujet
  • Si la vidéo est originale ou falsifiée
  • Nom/modèle de l'appareil
  • Personne qui parle ou non
  • Horodatage Heure de début
  • Horodatage Heure de fin
  • Répartition équilibrée des groupes ethniques : L'ensemble de données a été soigneusement organisé pour maintenir une représentation ethnique équilibrée. La répartition comprend les populations hispaniques (33 %), sud-asiatiques (21 %), caucasiennes (20 %), africaines (15 %) et est-asiatiques et moyen-orientales (chacune représentant jusqu'à 6 %).
  • Aucune entrée en double pour maintenir l’unicité de l’ensemble de données et éviter les biais dans la formation de l’IA.
  • Sélection de participants issus de la diversité ethnique pour créer un ensemble de données qui reflète les variations des utilisateurs du monde réel, améliorant ainsi l'adaptabilité et l'équité du modèle d'IA.
  • Variation du dispositif d'enregistrement inclus plusieurs modèles de smartphones, caméras et conditions d'éclairage pour améliorer la robustesse du modèle face à différents paramètres environnementaux.

Résultat

L'ensemble de données vidéo anti-usurpation d'identité de haute qualité et diversifié fourni par Shaip a permis au client de former des modèles d'IA pour différencier avec précision les vidéos réelles et falsifiées dans divers scénarios d'authentification biométrique. L'ensemble de données a contribué à :

Détection améliorée des fraudes

Performances de l’IA améliorées dans la détection des attaques biométriques frauduleuses.

Données de formation diverses

Renforcement de la capacité du modèle à reconnaître les attaques par relecture à travers différentes ethnies, appareils et conditions environnementales.

Évolutivité

L’ensemble de données sert de base aux futures améliorations et extensions du modèle anti-usurpation d’identité.

L'ensemble de données de Shaip a joué un rôle déterminant dans l'amélioration de nos modèles anti-usurpation d'identité basés sur l'IA. La diversité, la qualité et la structure des métadonnées ont fourni une base solide pour améliorer la détection des fraudes dans les systèmes d'authentification biométrique.

Or-5 étoiles