Les biais

Sommaire

Le type d’analyses statistiques à effectuer dépend de la question de recherche donc nous n’allons pas ici entrer dans le détail des différentes analyses, mais simplement mentionner des points à garder en tête pour vos analyses.

Non-indépendance des données

La non-indépendance des données est rarement prise en compte dans les analyses statistiques faites sur les données issues de suivis acoustiques passifs. Pourtant, il y a souvent autocorrélation temporelle et spatiale entre les enregistrements issus de ces études, due au fait qu’un même enregistreur produise différents enregistrements et que plusieurs enregistreurs peuvent être présents sur un même site.

Il faut aussi garder en tête que chaque vocalisation ne correspond pas à un individu différent, et il est souvent difficile de déterminer quelles vocalisations sont produites par le même individu.

Probabilité de détection

De la même manière, les vocalisations enregistrées ne correspondent pas à la totalité des vocalisations émises sur le site. Il est donc intéressant de prendre en compte dans vos modèles la probabilité de détection, qui dépend à la fois de la probabilité qu’un individu ou une espèce vocalise et de la probabilité que cette vocalisation soit enregistrée par le dispositif. Pour augmenter cette dernière, il est important d’avoir un protocole qui optimise la distribution temporelle et spatiale des enregistrements. L’habitat (densité de végétation, bruit de fond…) va aussi affecter la probabilité de détection.

Faux positifs

La probabilité de détection permet de prendre en compte les faux négatifs (l’espèce est présente mais pas détectée), mais l’analyse des vocalisations peut également produire des faux positifs en cas d’erreur d’identification (l’espèce est détectée sur un enregistrement alors qu’elle n’est pas présente).
L’enjeu des faux positifs est d’autant plus important que l’utilisation d’algorithmes d’intelligence artificielle pour identifier les vocalisation est très susceptible d’occasionner des erreurs d’identification.
La validation manuelle permet de limiter ce risque, mais même une faible proportion de faux-positifs peut biaiser les résultats (Clare et al., 2018).