Drop #3 – Tweepy e Pandas: Primeiras Impressões

Twitter_logo_blue

Esta semana eu tentei construir um post interessante para amanhã( 04 de setembro), talvez, quem saiba, eu consiga. E os culpados desta semana, ou seja, me deram um trabalho enorme para aprender e ler sua documentação, esses são : Pandas e Tweepy.

Pandas é um dos melhores packages para manipulação de dados para Python, standard mesmo e bem amplo, além de possuir uma documentação extensa, muito boa e cheia de tutoriais. Segue o link da documentação: http://pandas.pydata.org/pandas-docs/stable/index.html para quem quiser aprender um pouco mais sobre esse package.

Tweepy, já é um package,  que ao contrário do Pandas, bem restrito. Se limita a ser uma camada de abstração entre a API e o seu código em python, desta forma é muito mais fácil utilizar a API do twitter para obter dados e gravá-los.
O tweepy possui poucos exemplos online e estes são poucos diversificados.

Um pouco mais sobre o Pandas:

pandas não, infelizmente o pandas não possui este olhar para você enquanto você o programa.

Mas vamos nessa, o pandas possui dois tipos principais de dados básicos e que se bem utilizados trazem extremas vantagens : Series e Dataframes. O primeiro, é isto mesmo, uma série, se assemelha fortemente aos dictionary de várias outras linguagens, todo objeto possui uma key própria. Já o Dataframe é algo fantástico, funciona como uma tabela/planilha de um banco relacional, com colunas como id’s e linhas como registros. E este, possui métodos fantásticos!!! Como o Dataframe.to_csv, isso mesmo, o panda possui um método bem simples para serializar todos os dados em um arquivo csv. Para mim, esta é uma dádiva que não encontrei em R, por exemplo(mas com certeza existe um package que conserta isto).

Já o tweepy:

Fora o que já falei sobre o tweepy, o que eu posso dizer é que ele abstrai as diferentes APIs do twitter de forma bem legal. Por exemplo, com o mesmo objeto, eu posso acessar a minha timeline ( que está conectada ao meu app criado no https://dev.twitter.com/) ou acessar a Streaming API que me permite acessar todos os tweets do mundo, e utilizando um simples dictionary, eu posso filtrar somente twitter que possuem certas palavras (“Sport”, por exemplo.).

 

Espero que vocês tenham gostado deste drop e que tenha despertado a curiosidade para procurar mais.

 

 

 

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s