Solução para interpretação de informações
A maioria de nós utiliza mais de um sentido ao mesmo tempo para compreensão e interação com o mundo, o ambiente a nossa volta e de forma naturalmente intuitiva e automática, sem se preocupar com “medidas”. Esse processo foi incorporado em nós, seres humanos, ao longo da evolução e pode ser utilizado como analogia para o entendimento das Análises Multivariadas ou MVAs.
Hoje em dia, à medida que os sistemas se tornam cada vez mais complexos, somos levados à necessidade de coletar dados cada vez maiores, mais complexos e abstratos para o nosso senso comum, por exemplo: dados matemáticos, químicos, qualidade de produtos, processos, finanças, etc. Em nosso atual estágio evolutivo não possuímos ainda a capacidade natural de avaliar dados tão complexos de maneira clara e objetiva com a mesma facilidade que reconhecemos o ambiente eo mundo a nossa volta.
O que é MVA – Análise Multivariada?
Essencialmente, a análise multivariada é uma ferramenta para encontrar comportamento de padrões e relações entre diversas variáveis simultaneamente. Isso nos permite prever o efeito que a mudança de uma variável terá sobre outras variáveis bem como sobre a resposta final, usualmente um parâmetro de qualidade ou econômico.
Na análise multivariada usamos a informação de várias fontes simultaneamente para obter um “mapa” sobre o comportamento do sistema que está sendo estudado e analisado. A análise multivariada (MVA) tem ampla aplicação para tratamento de dados, incluindo dados instrumentais, diagnósticos médicos, dados sensoriais, dados econômicos, dados de marketing ou até mesmo o desempenho de uma equipe de esportes.
A MVA nos concede um meio de encontrar correlações nos dados e fornece ferramentas para visualizar as relações entre as variáveis de controle e as variáveis de resposta. Presente em diversas ciências humanas, a Análise Multivariada ganhou diferentes nomes. Quando aplicada na economia, é conhecida como Econometria, na psicologia de Pscicometria, na química de Quimiometria.
Assim, a Análise Multivariada oferece diversas vantagens sobre outras formas de análise o que confere maior assertividade nos processos decisórios. Esse tipo de análise já vem sendo amplamente utilizada em muitas indústrias, e sua aplicação vai desde a análise de matérias- primas até a descoberta de novos medicamentos; da prévia avaliação da composição de mistura de gasolina até a previsão de tendências no mercado financeiro, entre outras.
Pode ser utilizada para medição de conjuntos com muitas variáveis de entrada ou para investigar as tendências dos dados de séries temporais, proporcionando uma compreensão mais objetiva de um problema, que resultam em economia de recursos e de tempo.
Quimiometria
Os métodos utilizados em quimiometria foram inicialmente desenvolvidos em outras disciplinas, principalmente na economia e na psicologia sendo, posteriormente, aplicados a pesquisas voltadas para o tratamento de dados químicos, gerando uma nova área dentro da química analítica.
Isso se deu após a segunda metade dos anos 60, com o surgimento de métodos instrumentais computadorizados para a análise química, o que promoveu a geração de uma grande quantidade de dados.
Até este período, os químicos baseavam suas decisões em uma pequena quantidade de dados que, na maioria das vezes eram obtidos de forma lenta e dispendiosa. A partir dos anos 60, com a grande quantidade de dados de obtenção rápida e com menor esforço, foi preciso analisar todos esses dados e extrair maior quantidade de informações relevantes.
Foi então, criada a quimiometria. Um exemplo importante do sucesso da utilização da quimiometria são as análises realizadas na região do infravermelho próximo (NIR), as quais, sem a utilização de modelos de calibração multivariada não apresentariam possibilidades para determinações quantitativas.
Quimiometria em quatro divisões
- Pré-processamento de sinais analíticos: maior eficiência na interpretação de técnicas analíticas e exclusão de interferentes e dados anômalos;
- Análise exploratória: maximiza a extração de dados e facilita a classificação de informações em um conjunto muito grande de variáveis;
- Calibração multivariada: simplifica operações e funções que correlacione diversas respostas instrumentais com a propriedade de interesse;
- Planejamento e otimização de experimentos (DoE): estudo da influência das variáveis que afetam o sistema, a extensão desta influência e como são as interações entre elas, visando melhorar o processo de modo geral.
Visão geral dos modelos aplicados em Análise Multivariada (MVA)
Pré-processamento de sinais analíticos
- Centragem na Média
- Escalamento pela Variância
- Auto-escalamento
- Alisamento
- Primeira Derivada
- Segunda Derivada
- Correção de Espalhamento
- Multiplicativo (MSC)
- Transformação Padrão de Variação (SNV)
- Correção Ortogonal de Sinal (OSC)
Análise exploratória
- Análise de Componentes Principais (PCA)
- Análise de Agrupamentos Hierárquicos (HCA)
- Modelagem Independente Flexível por Analogia de Classe (SIMCA)
- Mínimos Quadrados Parciais para Análise Discriminante (PLS-DA)
Calibração multivariada
- Mínimos Quadrados Parciais (PLS)
- Regressão de Componentes Principais (PCR)
- Máquinas de Vetores de Suporte por Mínimos Quadrados (LS-SVM)
- Mínimos Quadrados Parciais Multimodo (NPLS)
- Mínimos Quadrados Parciais por Intervalos (iPLS)
- Regressão Multivariada de Curvas (MCR)
- Análise de Fatores Paralelos (PARAFAC)
Planejamento e otimização de experimentos
- Planejamentos Fatoriais Completos
- Planejamentos Fatoriais Fracionados
- Planejamento de Misturas
- Plackett-Burman
- D-optimal
Na prática
MVAs podem ser utilizados das seguintes maneiras:
- Reconhecimento de padrões, proporcionando uma compreensão dos valores importantes e relações subjacentes em dados;
- Obter uma percepção mais profunda de informações que nos permite modelar e visualizar dados complexos para análise mais criteriosa;
- Previsão de comportamento e melhorar a previsão de resultados prováveis usando ferramentas de previsão.
Análise Multivariada versus Análise Univariada (estatística clássica)
A maioria das pessoas já ouviu falar da média, mediana, desvio padrão, distribuição normal univariada, etc. Estes são nomes da estatística clássica ou univariada. Estatística univariada pode ser útil, mas é limitada por olhar para uma única variável de cada vez.
Na realidade, em muitos casos há mais de uma variável envolvida, de modo que a análise univariada pode levar a resultados incompletos. Muitas vezes, é necessário provar, observar, estudar ou medir mais de uma variável simultaneamente para entender um processo ou um conjunto de amostras, que muitas vezes pode ter centenas ou milhares de informações.
- Apenas com a análise multivariada falhas podem ser previstas e detectadas com maior índice de assertividade;
- Os limites da análise univariada são muito restritos para que sejam detectados problemas em situações onde existam muitas variáveis em questão;
- Muitas vezes, variáveis estudadas de maneira univariada não apresentam correlação significativa, gerando respostas falhas e duvidosas;
- Não é possível prever o melhor comportamento de um processo sem analisar todas as variáveis simultaneamente para obter as suas correlações.