Postagens

Mostrando postagens de abril, 2023

Regressão

Imagem
Esse é  projeto 4 do curso ciência de dados impressionador, nele fomos apresentados a uma base de dados do scikit learn de casas na califórnia onde tinhamos que com modelos de regressão achar um que melhor prevesse os preços.  Github com o projeto Usamos 4 modelos: Regressão linear simples - que fizemos um for para fazer a regressão de todas as possiveis duplas de colunas. Regressão linear multipla - fizemos a regressão usando todas as colunas. Árvore de regressão - que faz uma regressão baseada em uma árvore de decisão SVR - que significa suport vector regression  em que podemos basicamente pegar os pontos que estão mais no extremo dos dados de duas classes diferentes que estão mais próximos, e usar esses pontos para determinar um hiperplano capaz de separar essas classes                                    1                     ...

Projeto machine learning perceptron

Imagem
O intuito desse projeto diferente dos outros é mostrar meus primeiro passos em machine learning e o que eu pude aprender. Link para o repositório do Github Esse é o terceiro projeto do curso ciência de dados impressionador no qual usei o dataset iris, que é bem conhecido. Mesmo com meu conhecimento atual sabendo que o perceptron pode não ser o melhor modelo de classificação acabamos usando ele para iniciar os estudos na área de aprendizado de máquina. Um pouco sobre o perceptron: ele é um modelo de classificação sendo um modelo linear, o que significa que ele é bom quando os dados são lineramente separaveis, alem de ser de facil visualização pois se tivermos em apenas 2 dimensões o que significa 2 variaveis, podemos escrever ele com uma equação de reta y = ax+ b. Nesse caso tambem diminui o target para facilitar ainda mais a visualização Onde o wn é adquirido pela função coef e o w0 pela função intercept: aqui o coef é 1.5 e 2.2 e o intercepet é -5 usando o random state 42 x_perc = np...

Projeto Apresentação executiva

Imagem
 Olá, hoje venho mostrar meu segundo projeto do curso ciência de dados impressionador, o intuito dessa é apresentar os dados novamente. Caso queiram ver o código com toda parte de tratamento vou disponibilizar o link para esse  repositório no Github .  A base de dados desse projeto foi pega do Kaggle caso queiram reproduzir está no arquivo READ.me Ao receber a base de dados foi proposto algumas perguntas que são:  1.Como foi a venda nesse periodo? 2.Qual foi a categoria mais vendida? 3.Qual foi o item mais vendido? 1. Primeiramente vamos analisar a venda por ano, de 2015 para 2016 tivemos um queda de aproximadamente 4,25% sendo a única queda nesse meio tempo, após essa pequena diminuição entrou numa cresente de vendas de aumentando 57,16 % aproximadamente do pior ano de vendas. Após olhar ano a ano, decidimos olhar mês a mês a maioria segue um padrão crescente apesar de certas variações.  Tem meses com alguns outliers como vemos em maio que tenho um pico no ano ...

Projeto de engajamento de Instagram

Imagem
 Como prometido vim compartilhar meu progresso na área de Data Science, fiz meu primeiro projeto do curso ciência de dados impressionador, que era sobre análise de engajamento do instagram, foi feito a partir de uma base que o próprio curso disponibilizou. Segue Link do repositório do github:  Repositório O intuito desse post não é explicar o código mas sim fazer um storytelling dele. Partindo desse pressuposto, as partes de limpar, adequar, melhorar a base não farão parte desse post especifico que tem como foco somente a análise. Então vamos lá. Para começar  iremos analisar as tags que tem mais curtidas e comentários. (Essa tabela está em ordem decrescente de curtidas) Conseguimos dividir em 3 grupos aqui as mais efetivas (Promoções, Datas comemorativas e Trends), as com efetividade normal (Sem Tag, Influenciadores e novos produtos) e as com efetividade a baixo do esperado (Dicas de como usar, produtos e loja). Podemos ver que os comentários que apesar de não estarem em...

Primeiro Post

Olá, meu nome é Vinicius Valiati Costa e tenho 21 anos. Meu objetivo é me tornar um cientista de dados e este blog é onde compartilharei o que estou aprendendo e praticarei meu storytelling. Vou me esforçar para transformar a linguagem complexa em algo acessível para todos. Atualmente, estou no último período do curso de Administração na PUC-PR e também estou fazendo uma especialização em Ciência de Dados e Big Data na UFPR, além de um curso de Inteligência Artificial Aplicada. Tenho três frentes de portfólio planejadas: no LinkedIn, postarei um breve resumo da minha jornada; no GitHub, disponibilizarei todo o código que utilizar; e aqui, neste blog, farei uma apresentação detalhada do que estou aprendendo e praticando. Assim, espero me tornar um cientista de dados completo e dedicado. Atenciosamente, Vinicius Valiati Costa - Futuro Cientista de Dados.