R Language
Analyser les tweets avec R
Recherche…
Introduction
(Facultatif) Chaque sujet a un focus. Dites aux lecteurs ce qu'ils vont trouver ici et laissez les futurs contributeurs savoir ce qui leur appartient.
Télécharger les tweets
La première chose à faire est de télécharger des tweets. Vous devez configurer votre compte tweeter. Beaucoup d'informations peuvent être trouvées sur Internet sur la façon de le faire. Les deux liens suivants ont été utiles pour ma configuration (dernière vérification en mai 2017)
En particulier, j'ai trouvé les deux liens suivants utiles (dernière vérification en mai 2017):
R Bibliothèques
Vous aurez besoin des paquets R suivants
library("devtools")
library("twitteR")
library("ROAuth")
Supposons que vous ayez vos clés Vous devez exécuter le code suivant
api_key <- XXXXXXXXXXXXXXXXXXXXXX
api_secret <- XXXXXXXXXXXXXXXXXXXXXX
access_token <- XXXXXXXXXXXXXXXXXXXXXX
access_token_secret <- XXXXXXXXXXXXXXXXXXXXXX
setup_twitter_oauth(api_key,api_secret)
Changez XXXXXXXXXXXXXXXXXXXXXX
à vos clés (si vous avez configuré votre compte tweeter, vous savez quelles sont les clés que je veux dire).
Supposons maintenant que nous voulons télécharger des tweets sur le café. Le code suivant le fera
search.string <- "#coffee"
no.of.tweets <- 1000
c_tweets <- searchTwitter(search.string, n=no.of.tweets, lang="en")
Vous obtiendrez 1000 tweets sur "café".
Récupère le texte des tweets
Maintenant, nous devons accéder au texte des tweets. Nous le faisons donc de cette façon (nous devons également nettoyer les tweets à partir de caractères spéciaux dont nous n’avons pas besoin pour l’instant, comme les émoticônes avec la fonction sapply).
coffee_tweets = sapply(c_tweets, function(t) t$getText())
coffee_tweets <- sapply(coffee_tweets,function(row) iconv(row, "latin1", "ASCII", sub=""))
et vous pouvez vérifier vos tweets avec la fonction head
.
head(coffee_tweets)