L'apprentissage automatique peut être utilisé pour suivre les poussées d'intérêt dans les sujets de santé sur les tableaux de commentaires en ligne populaires, comme Reddit, selon une nouvelle étude menée pendant l'épidémie de COVID-19 par des chercheurs de la Perelman School of Medicine de l'Université de Pennsylvanie (Penn Medicine ).
Ces informations pourraient aider les responsables de la santé publique à mieux comprendre et répondre aux préoccupations et aux priorités du public, et à endiguer la propagation de la désinformation. Cette étude a été publiée aujourd'hui au Journal of General Internal Medicine.
Les priorités de santé publique ne sont pas toujours alignées sur les priorités de la communauté, et le succès des efforts de santé publique dépend souvent d'un plan pour répondre aux préoccupations de la communauté. Avoir une source comme Reddit qui est directement liée aux pensées des gens pourrait s'avérer inestimable dans l'élaboration de plans qui rencontrent les gens là où ils se trouvent. «
Daniel Stokes, chercheur associé au Center for Emergency Care Policy et au Center for Digital Health de Penn Medicine.
Les chercheurs ont choisi d'évaluer les discussions sur Reddit, car il s'agit de l'un des sites les plus populaires sur Internet, en plus d'être relativement non filtré et à jour.
Par exemple, les chercheurs ont déclaré que la surveillance en temps réel de Reddit aurait pu permettre une réponse plus agile lors d'une vague de questions sur la sécurité de la sortie à la mi-mars.
Les Centers for Disease Control and Prevention (CDC) n'ont pas publié de directives officielles pour profiter en toute sécurité des parcs et des activités de plein air avant début avril.
Stokes et ses collègues chercheurs pensent que s'il y avait eu plus de surveillance des activités de discussion en ligne, les directives auraient pu être publiées plus près du pic d'intérêt.
En tant que conduit directement aux pensées de certaines personnes, Reddit est également précieux car c'est l'endroit où une partie de l ' »infodémie » – le fléau de la désinformation sur COVID-19 – s'est propagée.
Les exemples incluent la croyance d'une affiche de Reddit qu'un remède naturel comme la racine de réglisse pourrait empêcher l'infection au COVID-19, ou la pensée d'un autre que le virus a été créé par l'homme. Ici aussi, une réponse rapide et personnalisée des responsables de la santé publique pourrait conduire à un discours plus factuel et plus productif.
Pour identifier les poussées d'intérêt auprès du public, les chercheurs de l'étude ont collecté près de 95000 publications du 3 au 31 mars 2020 sur le fil COVID-19 le plus populaire sur Reddit, r / Coronavirus.
Ils ont identifié 50 sujets de discussion différents grâce à une technique d'apprentissage automatique du traitement du langage naturel. Ensuite, 10 de ces sujets ont été jugés les plus liés à trois domaines d'intérêt de l'étude: la réponse aux mesures de santé publique, le sentiment de la gravité de la pandémie et son impact sur la vie quotidienne.
En suivant l'évolution de la popularité de ces sujets au jour le jour, l'équipe a pu démontrer comment les domaines d'intérêt refluaient et évoluaient.
Par exemple, le lavage des mains a atteint un pic tôt, entre le 3 et le 6 mars, tandis que les inquiétudes concernant les finances personnelles ont été discutées environ 50% de plus fin mars par rapport au début.
L'analyse a également montré que certains sujets populaires au début du mois restaient en tête ou avaient fait leur retour plus tard dans le mois. Ce fut le cas pour le port du masque.
« Le CDC n'a pas fait ses recommandations sur le port de masques en public avant début avril, il est donc intéressant de voir que les masques étaient largement débattus avant cette recommandation », a déclaré Stokes. « C'était peut-être un signe que beaucoup de gens étaient prêts pour ces directives plus tôt. »
À l'avenir, l'équipe continuera de suivre et d'analyser les publications sur ce sujet spécifique à COVID-19. Un autre effort du Penn's Center for Digital Health, dirigé par Raina Merchant, MD, professeur agrégé de médecine d'urgence, a été de collecter des données similaires via Twitter et de les cartographier à travers les États-Unis.
« Nous visons à incorporer les contributions de plusieurs sources numériques qui nous permettraient non seulement de suivre le sentiment du public et sa perception du virus, mais également de suivre, en temps réel, l'émergence de nouvelles épidémies », a déclaré Merchant, qui est également le auteur principal de cette Journal of General Internal Medicine étude.
Stokes et Merchant espèrent que des informations comme celle-ci seront prises en compte par les responsables de la santé publique dans leurs efforts pour mieux lutter contre la propagation de la désinformation qui a accompagné l'épidémie de COVID-19.
« Le succès de nos efforts de santé publique dépend de l'adhésion du public », a déclaré Stokes. « Les premières comparaisons avec la grippe sur Reddit ont peut-être indiqué une lacune dans la compréhension du public de la gravité de la pandémie. Reconnaître ces lacunes peut être utile pour développer des campagnes ciblées pour les fermer. »
La source:
École de médecine de l'Université de Pennsylvanie