R Language
Анализ твитов с R
Поиск…
Вступление
(Необязательно). В каждой теме основное внимание уделяется. Расскажите читателям, что они найдут здесь, и пусть будущие участники узнают, что принадлежит.
Загрузить твиты
Первое, что вам нужно сделать, это скачать твиты. Вам необходимо настроить свой счет в твитере. В Интернете можно найти много информации о том, как это сделать. Следующие две ссылки были полезны для моей установки (последний проверен в мае 2017 года)
В частности, я нашел следующие полезные ссылки (последний проверен в мае 2017 года):
Библиотеки R
Вам понадобятся следующие пакеты R
library("devtools")
library("twitteR")
library("ROAuth")
Предположим, что у вас есть ключи. Вам нужно запустить следующий код
api_key <- XXXXXXXXXXXXXXXXXXXXXX
api_secret <- XXXXXXXXXXXXXXXXXXXXXX
access_token <- XXXXXXXXXXXXXXXXXXXXXX
access_token_secret <- XXXXXXXXXXXXXXXXXXXXXX
setup_twitter_oauth(api_key,api_secret)
Измените XXXXXXXXXXXXXXXXXXXXXX
на свои ключи (если у вас есть настройка вашего счета в твитере, вы знаете, какие ключи я имею в виду).
Предположим теперь, что мы хотим скачать твиты на кофе. Следующий код будет делать это
search.string <- "#coffee"
no.of.tweets <- 1000
c_tweets <- searchTwitter(search.string, n=no.of.tweets, lang="en")
Вы получите 1000 твитов на «кофе».
Получить текст твитов
Теперь нам нужно получить доступ к тексту твитов. Таким образом, мы делаем это таким образом (нам также нужно очистить твиты от специальных символов, которые на данный момент нам не нужны, например, смайлики с функцией sapply.)
coffee_tweets = sapply(c_tweets, function(t) t$getText())
coffee_tweets <- sapply(coffee_tweets,function(row) iconv(row, "latin1", "ASCII", sub=""))
и вы можете проверить свои твиты с помощью функции head
.
head(coffee_tweets)