{"id":1428,"date":"2026-02-12T18:47:39","date_gmt":"2026-02-13T02:47:39","guid":{"rendered":"https:\/\/www.carlos-souza.com\/?p=1428"},"modified":"2026-02-12T18:48:33","modified_gmt":"2026-02-13T02:48:33","slug":"estrategia-e-engenharia-o-ciclo-de-vida-de-um-projeto-de-machine-learning-em-series-temporais","status":"publish","type":"post","link":"https:\/\/www.carlos-souza.com\/en\/estrategia-e-engenharia-o-ciclo-de-vida-de-um-projeto-de-machine-learning-em-series-temporais\/","title":{"rendered":"Estrat\u00e9gia e Engenharia: O Ciclo de Vida de um Projeto de Machine Learning em S\u00e9ries Temporais"},"content":{"rendered":"<p><strong>Nota Editorial:<\/strong>\u00a0<em>Este conte\u00fado foi publicado originalmente em 20 de maio de 2020, na plataforma Medium (Data Hackers). Esta \u00e9 uma vers\u00e3o revisada e expandida para este blog, que detalha a arquitetura t\u00e9cnica e os marcos de desenvolvimento de um projeto de intelig\u00eancia artificial, dividido em quatro partes fundamentais.<\/em><\/p>\n\n\n\n<p>Na interse\u00e7\u00e3o entre a ci\u00eancia de dados e a an\u00e1lise do comportamento social, a capacidade de prever fluxos de informa\u00e7\u00e3o \u00e9 um dos desafios mais desafiadores. Neste projeto, utilizei o volume de acessos \u00e0s p\u00e1ginas da Wikip\u00e9dia como laborat\u00f3rio para demonstrar como o\u00a0<em>Machine Learning<\/em>\u00a0pode decifrar padr\u00f5es temporais e antecipar tend\u00eancias de interesse p\u00fablico.<\/p>\n\n\n\n<p>Para al\u00e9m dos c\u00f3digos, o objetivo central foi documentar o rigoroso processo de constru\u00e7\u00e3o de um modelo preditivo, estruturado em quatro artigos t\u00e9cnicos que detalham desde a concep\u00e7\u00e3o do problema at\u00e9 a valida\u00e7\u00e3o dos resultados.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">1. A Justificativa: Por que este problema importa?<\/h2>\n\n\n\n<p>Um erro comum em projetos de IA \u00e9 iniciar o desenvolvimento sem uma pergunta de neg\u00f3cio ou de pesquisa que sustente o esfor\u00e7o. O primeiro passo deste projeto foi identificar um tema de relev\u00e2ncia estat\u00edstica e social que justificasse a cria\u00e7\u00e3o de um modelo complexo.<\/p>\n\n\n\n<p>Ao analisar o volume de tr\u00e1fego digital, n\u00e3o estamos apenas olhando para n\u00fameros; estamos medindo a aten\u00e7\u00e3o da sociedade. Identificar um tema &#8220;quente&#8221; o suficiente para gerar dados ruidosos, mas com padr\u00f5es latentes, \u00e9 o que valida o investimento em infraestrutura e no tempo de modelagem.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">2. O Roadmap: Do Dado Bruto ao Insight<\/h2>\n\n\n\n<p>O desenvolvimento seguiu o ciclo de vida completo de um projeto de ci\u00eancia de dados:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Defini\u00e7\u00e3o do Problema:<\/strong>\u00a0Transformar a incerteza sobre o futuro em uma pergunta matem\u00e1tica clara.<\/li>\n\n\n\n<li><strong>Coleta e Limpeza:<\/strong>\u00a0O tratamento de dados reais, muitas vezes inconsistentes ou incompletos, para garantir que o algoritmo n\u00e3o aprenda com &#8220;ru\u00eddo&#8221;.<\/li>\n\n\n\n<li><strong>Modelagem e An\u00e1lise:<\/strong>\u00a0A escolha criteriosa de algoritmos que respeitam a natureza sequencial dos dados.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">3. A Estrat\u00e9gia do Baseline: Onde come\u00e7amos?<\/h2>\n\n\n\n<p>Um modelo de IA n\u00e3o deve ser avaliado isoladamente, mas sim em compara\u00e7\u00e3o com um ponto de refer\u00eancia. Por isso, foquei no desenvolvimento de um\u00a0<strong>baseline<\/strong>\u00a0\u2014 um modelo inicial simples (frequentemente baseado em estat\u00edstica cl\u00e1ssica) que serve como marco zero.<\/p>\n\n\n\n<p>A evolu\u00e7\u00e3o do projeto consistiu em superar sistematicamente essa base, provando que a complexidade adicional do&nbsp;<em>Machine Learning<\/em>&nbsp;de fato agregava precis\u00e3o superior \u00e0 m\u00e9dia hist\u00f3rica ou a modelos ing\u00eanuos.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">4. A Grande Mudan\u00e7a: S\u00e9ries Temporais como Aprendizado Supervisionado<\/h2>\n\n\n\n<p>O ponto de inflex\u00e3o t\u00e9cnica deste trabalho foi a transforma\u00e7\u00e3o do problema de s\u00e9rie temporal em um&nbsp;<strong>modelo supervisionado<\/strong>. Mas o que isso implica na pr\u00e1tica?<\/p>\n\n\n\n<p>Ao criar vari\u00e1veis de atraso (<em>lags<\/em>) e janelas m\u00f3veis, reestruturamos o tempo como um conjunto de caracter\u00edsticas (<em>features<\/em>). Isso permite que utilizemos algoritmos poderosos de regress\u00e3o para prever o pr\u00f3ximo ponto com base em um contexto hist\u00f3rico rico. Essa abordagem n\u00e3o apenas melhora a acur\u00e1cia, mas permite que o modelo entenda correla\u00e7\u00f5es que m\u00e9todos lineares ignorariam.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Guia de Leitura: A S\u00e9rie em 4 Partes<\/h3>\n\n\n\n<p>Para facilitar o acompanhamento do racioc\u00ednio e da implementa\u00e7\u00e3o t\u00e9cnica, o projeto est\u00e1 dividido em:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><a href=\"https:\/\/medium.com\/data-hackers\/s%C3%A9ries-temporais-com-machine-learning-parte-1-e8fa62b82d48\" target=\"_blank\" rel=\"noopener\"><strong>Parte 1 &#8211; Conceitos e Contexto<\/strong><\/a><strong>:<\/strong>\u00a0Fundamentos e a import\u00e2ncia da escolha do tema.<\/li>\n\n\n\n<li><a href=\"https:\/\/medium.com\/data-hackers\/s%C3%A9ries-temporais-com-machine-learning-parte-2-75e161b7d78e\" target=\"_blank\" rel=\"noopener\"><strong>Parte 2 &#8211; Explora\u00e7\u00e3o e Baseline<\/strong><\/a><strong>:<\/strong>\u00a0An\u00e1lise estat\u00edstica e a defini\u00e7\u00e3o do primeiro benchmark.<\/li>\n\n\n\n<li><a href=\"https:\/\/medium.com\/data-hackers\/s%C3%A9ries-temporais-com-machine-learning-parte-3-d7397690185b\" target=\"_blank\" rel=\"noopener\"><strong>Parte 3 &#8211; Engenharia de Atributos<\/strong><\/a><strong>:<\/strong>\u00a0A transforma\u00e7\u00e3o para o modelo supervisionado.<\/li>\n\n\n\n<li><a href=\"https:\/\/medium.com\/data-hackers\/s%C3%A9ries-temporais-com-machine-learning-parte-4-6beb3efb2e99\" target=\"_blank\" rel=\"noopener\"><strong>Parte 4 &#8211; Modelagem e Resultados<\/strong><\/a><strong>:<\/strong>\u00a0Avalia\u00e7\u00e3o final, erros cometidos e o que os dados nos dizem.<\/li>\n<\/ol>\n\n\n\n<h3 class=\"wp-block-heading\">Laborat\u00f3rio Pr\u00e1tico<\/h3>\n\n\n\n<p>Todo o c\u00f3digo-fonte, incluindo os scripts de limpeza, tratamento de dados e os modelos finais, est\u00e1 dispon\u00edvel para consulta e contribui\u00e7\u00e3o no meu reposit\u00f3rio:<\/p>\n\n\n\n<p>\ud83d\udd17&nbsp;<strong>Projeto no GitHub:<\/strong>&nbsp;<a href=\"https:\/\/github.com\/SouzaCadu\/Time-Series\" target=\"_blank\" rel=\"noopener\">Time-Series Project &#8211; SouzaCadu<\/a><\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Conclus\u00e3o<\/h3>\n\n\n\n<p>Entender a din\u00e2mica do tempo \u00e9 fundamental para qualquer cientista pol\u00edtico que lida com dados. Este projeto \u00e9 uma demonstra\u00e7\u00e3o de que, com o m\u00e9todo correto, a Intelig\u00eancia Artificial pode ser uma ferramenta poderosa para trazer clareza \u00e0 volatilidade dos fen\u00f4menos sociais.<\/p>\n\n\n\n<p><strong>Como voc\u00ea enxerga a aplica\u00e7\u00e3o dessa &#8220;vis\u00e3o de futuro&#8221; nas pol\u00edticas p\u00fablicas?<\/strong>&nbsp;Deixe suas impress\u00f5es nos coment\u00e1rios.<\/p>\n\n\n\n<p><\/p>","protected":false},"excerpt":{"rendered":"<p>Nota Editorial:\u00a0Este conte\u00fado foi publicado originalmente em 20 de maio de 2020, na plataforma Medium (Data Hackers). Esta \u00e9 uma vers\u00e3o revisada e expandida para este blog, que detalha a arquitetura t\u00e9cnica e os marcos de desenvolvimento de um projeto de intelig\u00eancia artificial, dividido em quatro partes fundamentais. Na interse\u00e7\u00e3o entre a ci\u00eancia de dados [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1431,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_themeisle_gutenberg_block_has_review":false,"jnews-multi-image_gallery":[],"jnews_single_post":[],"jnews_primary_category":[],"jnews_override_bookmark_settings":[],"jnews_social_meta":[],"jnews_override_counter":[],"footnotes":""},"categories":[62,73],"tags":[],"class_list":["post-1428","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-fundamentos-tutoriais","category-ia-machine-learning"],"acf":[],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/posts\/1428","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/comments?post=1428"}],"version-history":[{"count":2,"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/posts\/1428\/revisions"}],"predecessor-version":[{"id":1430,"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/posts\/1428\/revisions\/1430"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/media\/1431"}],"wp:attachment":[{"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/media?parent=1428"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/categories?post=1428"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.carlos-souza.com\/en\/wp-json\/wp\/v2\/tags?post=1428"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}