DataScience – Episódio 8 – TUDO PRONTO #SQN

Agora vai!, o projeto está andando com tudo (ou quando o vento sopra hehe) mas o projeto de mineração do qual faço parte na cadeira de “Sistemas de Suporte à Decisão e Mineração de Dados” está ficando bem legal e com um foco interessante, o mais legal são as decisões que conseguimos ter a partir dos dados do especialista ( graças ao Raul, integrante do grupo e que fez iniciação científica no Centro de Ciências Biológicas e ajudou bastante nas tomadas de decisões).

Mas vamos a parte interessante: finalmente começamos o esboço do artigo!, contudo, um integrante do time não conseguiu reportar suas atividades a tempo, ele estava responsável pelos gráficos e estatísticas do dataset, então perdemos um pouco de qualidade na entrega, que era composta de abstract, introdução e a pré-análise dos dados.

Porém o desafio da semana está neste tipo de variável categórica: uma categórica rankeada. Basicamente ela categoriza a variação do uso de uma substância entre 4 categorias: “Aumentou”, “manteve-se”, “diminuiu”, “não é usada”, como transformar tais valores em números de forma à haver ganho de informação? Esta é a pergunta machucando minha cabeça, se alguém tiver alguma ideia sobre como responder esta pergunta de forma satisfatória, estou agradecendo haha.

Uma das coisas interessantes que eu espero conseguir postar no blog será a série “#ResenhaDoDia” que trará estatísticas legais sobre assuntos às vezes sérios e outras vezes totalmente banais e eu discutirei a forma de pré-processamento dos tipos de variáveis envolvidas.

 

 

DataScience – Episódio 7 – Como coletar o que quero?

Então você tem um problema e quer procurar dados onde talvez estes problemas sejam resolvidos? (Ex:”Como classificar um mal motorista” // Dados do CTTU) contudo, nem sempre os dados são de fácil acesso, até mesmo se utilizarmos o primeiro item da lista de lugares para procurar:

GOOGLE

O google é uma das fontes mais simples de dados existentes, isto é fato. Contudo, achar algumas fontes de dados pode ser extremamente complicado e difícil pois estamos recebendo os resultados de uma máquina que nem sempre interpreta da melhor forma o que você quer.

Quora

Além de possuir a interação entre os usuários, o Quora permite que você faça questões mais elaboradas e específicas do que aquelas que você faria no pequeno campo de texto do Google, por exemplo, além de existir muitos colaboradores(Data scientists) de grandes empresas como Facebook, Linkedin dentro do Quora.

Estes posts serão  atualizados semanalmente , assim espero, desculpem a falta de notícias , infelizmente minha negociação para conseguir dados da prefeitura do Recife referentes aos dados do SINAN (Sistemas de Agravos e Notificações) não funcionou e não consegui os dados internos.