A SIMILITUDE DAS ANÁLISES ESTATÍSTICAS
Por Afonso Celso Candeira Valois*.
Por definição, a estatística é uma parte aplicada da matemática em estudos, levantamentos e análises de dados oriundos de observações.
Para o caso da análise estatística empírica de dados experimentais obtidos em condições de campo envolvendo plantas, por exemplo, inicialmente duas devem ser considerados: a casualização dos tratamentos a serem levados em conta e a repetição no espaço e no tempo, com o fito de controlar, especialmente, as variações de solo e clima.
Em seguida, o experimentador deve escolher qual o delineamento experimental mais adequado a ser empregado, dependendo do número de tratamentos e finalidade dos ensaios ou mesmo do determinado experimento, sendo o mais comum, o delineamento de blocos ao acaso, completamente casualizados, esquema fatorial (muito em pesquisas de nutrição de plantas), bem como o delineamento em lattice e box, muito usados em esquemas de genética, quando o número de tratamentos for muito elevado (mas o experimentador deve ter o cuidado para não serem formados subgrupos ao acaso, para não mascarar os resultados). Após a coleta e tabulação dos dados experimentais, os mesmos são conduzidos para o escritório, visando às devidas análises e conclusões.
Geralmente é utilizada a análise de variância, também chamada de ANOVA ou mesmo ANAVA, quando uma tabela é elaborada identificando os tratamentos, interações, resíduo, graus de liberdade, soma de quadrados, quadrado médio e o teste de comparação entre medias, onde o teste de Tukey, Duncan, etc., são os principais para a escolha dos melhores tratamentos. Deve-se ainda considerar que se o experimento envolver a genética, a referida tabela deve incluir a esperança dos quadrados médios (E-QM), para o cálculo da variância genética aditiva (a que mais interessa ao melhorista por passar de pai para filho), além da variância dominante e epistática.
Geralmente, os tratamentos são selecionados no nível de 5% de probabilidade (a intensidade de seleção i é de 2,06), levando em conta o uso de tabelas já preparadas (deve-se ainda levar em consideração que se a pesquisa envolver seres humanos, então a probabilidade não deve ser inferior a 10% por motivos óbvios, que neste caso, a intensidade de seleção i é de 1,76, portanto mais branda).
Outros testes podem ainda ser utilizados, como o teste T, de Student, e o do emérito professor Brieger, que eu tive a grande sorte de assistir a um dos seus seminários na USP/ESALQ.
Além disso, existem muitos outros esquemas experimentais, como o de Sakai, que aliás, eu apliquei na determinação de parâmetros genéticos de seringueira e cacau, cujos artigos estão publicados na Revista PAB, onde não se usa testes de progênies, e apenas o desenho em condições de campo, através de métodos especiais de variação do tamanho das parcelas experimentais.
Na ANOVA, um parâmetro fundamental é o grau de liberdade (gl), cujo não deve ser inferior a 12 para o efeito residual, para não influir negativamente na análise estatística dos dados, pois geralmente é ditado pela curva normal, onde quanto maior for o número de observações, mais facilmente será traçada. Normalmente essa curva pode ser linear ou quadrática, ou mesmo seguir o modelo aritmético ou exponencial, muito explorados em pesquisas de resistência de plantas a doenças fúngicas, por exemplo.
Mas qual é o significado do grau de liberdade (n-1)?
O grau de liberdade corresponde ao número total de observações menos o número de restrições impostas na análise dos dados. Em termos práticos, na análise de observações, o grau de liberdade associado ao desvio padrão é n-1, quando se impõe a restrição de que a soma dos desvios em relação à média é nula.
Nunca em uma ANOVA, o gl residual deve ser inferior a 12, conforme já assinalado acima, sendo que para evitar esse erro experimental, o pesquisador deve considerar o número de tiramentos e número de repetições de maneira adequada, para evitar esse erro oculto que não pode ser corrigido pela análise estatística.
Nas condições do experimento, as parcelas de campo podem ter bordaduras simples ou duplas no formato retangular ou quadrático (este é o preferido se o esquema envolver à contagem de insetos), sendo fundamental que sejam com o mesmo número de plantas, caso haja a perda de genótipos ao longo da condução.
Também nunca se deve efetuar as análises estatísticas com números inteiros para promover a aproximação entre os valores, incidindo na boa construção da curva normal. Assim, se forem dados advindos de contagem, a correção pode ser pela raiz quadrada de n+1, ou mesmo pelo arc. seno de raiz quadrada de P%, se for o caso. Assim, todos os números terão casas decimais.
Dentro dessa visão holística do emprego da estatística experimental e genética, se pode ainda estimar o coeficiente de herdabilidade no sentido amplo e no sentido restrito, onde a variância genética aditiva é de especial interesse, como também o tamanho efetivo da população, além de outros empregos.
Vale ainda destacar a formação de compostos sintéticos de milho e outros, onde se considera os caracteres agronômicos, a heterose, a média alta, a variância genética aditiva e o grau de homogeneidade das gerações de intercruzamento.
Com essa visão estratégica e holística tive a sorte de sintetizar o Composto Manaus, pelo intercruzamento de seis variedades de milho, nas condições ecológicas de Manaus (AM), pesquisa inédita na região, extremamente aplicada nos seus fins. A simples utilização da ANOVA nos diversos ciclos de geração identificou o estádio em que o composto estava homogeneizado, onde neste caso foi na quarta geração.
Tenho que acrescentar com gratidão e dever o quanto foram fundamentais os notáveis ensinamentos nessa feliz trajetória, advindos dos ilustres mestres e saudosos, Virgílio Ferreira Libonati (EAA, atual UFRA), Dirce Pacca Brito e Alberto Penteado (UFRRj e IPEACS, atual Embrapa Agroecologia), Roland Vencovskl, José Branco de Miranda Filho, Almiro Blumenschein e Ernesto Paterniani (USP/ESALQ), a quem rendo as minhas homenagens “in memoriam”.
Vale ainda homenagear o eminente Professor Frederico Pimentel Gomes, do Departamento de Matemática da USP/ESALQ, nobre autor do excelente livro didático de estatística experimental, que se tornou um verdadeiro Vade Mecum! da literatura obrigatória dos métodos estatísticos ligados à agricultura e pecuária do Brasil.
Certa vez, recém formado em engenharia agronômica em dezembro de 1967, muito animado com a estatística experimental e genética, em março de 1968 fui contratado pelo então EPE, depois DNPEA, atual Embrapa, começando por um bem aplicado treinamento em Institutos do EPE e na CEPLAC/CEPEC. Um dos Institutos do EPE foi o IPEACO, atual Embrapa Milho e Sorgo, localizado em Sete Lagoas (MG), que posteriormente eu ajudei na criação e localização. Nesse treinamento em Sete Lagoas, no IPEACO, visitei a sala de um pesquisador com arroz, maranhense como eu, sendo que sobre a sua mesa de trabalho estava um exemplar do livro do Professor Pimentel Gomes acima citado, com a capa desgastada, dando o sinal de uso intenso.
Eu estou me referindo ao Dr. Ericson Pires Coqueiro, atual pesquisador aposentado da Embrapa, meu grande amigo. que de Sete Lagoas veio para Brasília (DF), com lotação no Cenargen (sigla charmosa) e depois na sede da Embrapa, onde foi chefe do Departamento de recursos humanos e chefe do gabinete da presidência da Embrapa. Essa citação do amigo Coqueiro é para atestar que um pesquisador, interessado em estatística experimental, pode ter uma trajetória de realce e motivadora de jovens pesquisadores em início da carreira, como foi o meu humilde caso. Parabéns ao Coqueiro!
Existem muitas outras aplicações da matemática na estatística experimental, onde pode-se destacar a Fitopatometria, cujos ensinamentos básicos me foram oferecidos pelos excelentes Professores do Departamento de Fitopatologia da USP/ESALQ, Dr. Armando Bergamim e Dr. Mentem, em um competente e puxado curso de férias sobre doenças de plantas, naquele Departamento.
Os conhecimentos básicos e aplicados me valeram algumas publicações de realce e reconhecimento, inclusive pelo saudoso e eminente Dr. Norman Borlaug, norte-americano, Prêmio Nobel da Paz de 1970, o pai da revolução verde. Estou me referindo ao tema Resistência Genética de Plantas a Doenças.
Nessas pesquisas tomei como referência a seringueira (Hevea spp), gênero de plantas extremamente didático, onde se pode encontrar praticamente todas as formas de resistência genética de plantas a doenças fúngicas, como: Vertical, Horizontal e Escape, Hipersensibilidade, Completa, Parcial e Imunidade.
No geral, todos esses eventos podem ser qualificados e quantificados através de fórmulas matemáticas especiais doadas Fitopatometria, incluindo o cálculo da meia vida de patógenos.
Afora isso, a determinação do tamanho efetivo da população, emprego dos delineamentos I e II na predição de parâmetros em análises de genética quantitativa são também relevantes.
Ressalto ainda que os professores do Departamento de Genética da USP/ESALQ citados acima, foram fundamentais como meus orientadores e coorientadores na dissertação de mestrado e tese de doutorado, onde a genética quantitativa e qualitativa foram de excelência para os estudos de heterose em milho e comparação quantitativa entre quatro esquemas de seleção. Os artigos estão publicados na Revista PAB, além honrosa citação em livro publicado por universidade norte-americana.
Os bons ensinamentos não só na ESALQ, como também na EAA, também foram primordiais para que eu selecionasse diversos clones de seringueira para resistência a doenças e pragas (insetos) e produção de borracha, além da seleção de genótipos de guaraná, juta, estévia e outros, onde a estatística experimental e o método quantitativo e qualitativo foram essenciais na confirmação dos resultados longevos obtidos. Trata-se da aplicação da ciência em evidência.
Além disso, destaco ainda a bela participação dos professores doutores Mary O’Connell e Melvin Oliver, da NMSU (Estados Unidos da América do Norte), que foram meus distinguidos orientadores nas pesquisas desenvolvidas naquela universidade, no treinamento de pós-doutorado, na duplicação do número de cromossomos da estévia e na fusão de protoplastos entre tomate-jurubeba e tomate-cubiu, para a obtenção de cibridos resistentes a Ralstonia solanacearum, bactéria causadora da famosa e limitante murcha bacteriana das solanáceas.
Os resultados das pesquisas envolvendo a estévia foram tão importantes quê receberam menção especial na Rede de Televisão NBC, divulgadas no âmbito nacional naquele país.
Mas na visão holística, não se deve olvidar que atualmente existem diversos programas de computador que dispensam muitos dos métodos de ANOVA aqui explicados.
No entanto, é de bom alvitre que um pesquisador consciente deve se esforçar para melhor compreender os resultados por ele mesmo obtidos “ficando com os pés no chão”, para calcular e concluir sobre os seus próprios resultados experimentais, onde por exemplo, muitas das vezes ele tem que lançar mão de fórmulas e modelos matemáticos complementares e auxiliares, como a esperança dos quadrados médios acima referida.
Ao finalizar este singelo texto, um pouco longo, peço desculpas por eventuais erros de digitação, ao mesmo tempo que espero receber comentários.
Ainda aproveito para citar que muitas vezes as pessoas interessadas ficam em dúvida sobre o emprego das palavras variância e variabilidade genética, mas acreditem, a primeira é apenas a medição matemática da segunda!
Calcular “no dedo”, com o auxílio de máquinas de calcular, os valores complementares de interesse, inverter matrizes, formular sistemas de equações com variâncias e covariâncias genéticas e fenotípicas, estimar os coeficientes de correlação e determinação, predizer a resposta correlacionada entre caracteres agronômicos e usar artifícios de cálculos compatíveis, são outras técnicas disponíveis, com objetivos e metas factíveis na estatística experimental e predição de parâmetros genéticos.
Em adição, rogo a Deus que nos ajude não só na compreensão das análises estatísticas e genéticas, mas também quanto ao sublime significado da “ecologia do coração”, que se compõe do descanso, contemplação, compaixão e ternura (Angelus, 18/07/21).
* Afonso Celso Candeira Valois. Engenheiro Agrônomo, mestre em Genética e doutor em Genética. Pós-doutorado na Universidade do Estado do Novo México (EUA) em genética e biotecnologia de plantas. Pesquisador aposentado da Embrapa.