Docs – Gerasena

Recomendação para Valores Iniciais e Limites de Penalty, Threshold, Quantidade de IAs, e GT no Gerasena

Introdução

Ao desenvolver modelos de IA para sistemas complexos, como o Gerasena, a escolha dos hiper parâmetros corretos é fundamental para obter bons resultados. Entre os parâmetros mais críticos estão o penalty, o threshold, a quantidade de IAs (Qtd I.A’s), e o GT (Generalized Time). Estes parâmetros ajudam a balancear a precisão do modelo com a diversidade das previsões, permitindo que o modelo seja ao mesmo tempo preciso e capaz de gerar variações úteis nas saídas. Neste documento, vamos explorar recomendações para valores iniciais desses parâmetros, além de limites sugeridos para ajuste.

1. Penalty: Diversificando as Previsões

O que é o Penalty?

O penalty é um valor adicional na função de perda personalizada que penaliza o modelo quando suas previsões para diferentes saídas são muito semelhantes. Isso é feito para garantir que o modelo produza previsões diversificadas, evitando resultados repetitivos que podem não ser úteis em contextos como a geração de combinações para loterias.

Recomendações para Valor Inicial

Valor Inicial Sugerido:0.1
- Justificativa: Um valor inicial de 0.1 é pequeno o suficiente para permitir que o modelo priorize a precisão, mas também grande o bastante para começar a introduzir alguma diversidade nas previsões.

Limites e Ajustes

Ajuste para Cima:
- Se as previsões do modelo continuarem muito similares, aumentando o penalty para valores como 0.5 ou 1.0 pode incentivar o modelo a diversificar mais.
Ajuste para Baixo:
- Se o modelo começar a perder precisão ou se as previsões se tornarem muito dispersas, reduzir o penalty para algo como 0.05 pode ajudar a recuperar a precisão enquanto ainda promove alguma diversidade.
Limite Máximo:1.0
- Justificativa: Valores maiores que 1.0 podem começar a dominar a função de perda, prejudicando a capacidade do modelo de fazer previsões precisas. Em geral, o ideal é manter o penalty abaixo desse valor.

2. Threshold: Filtrando as Melhores Previsões

O que é o Threshold?

O threshold é usado para determinar quais previsões do modelo são suficientemente “boas” para serem consideradas na saída final. Especificamente, ele filtra os números previstos com base em quão frequentemente eles aparecem nas previsões, garantindo que apenas os números mais prováveis sejam selecionados.

Recomendações para Valor Inicial

Valor Inicial Sugerido:0.005 a 0.01
- Justificativa: Um threshold de 0.005 a 0.01 permite que números que aparecem em pelo menos 0,5% a 1% das previsões sejam considerados. Este é um bom ponto de partida para garantir que apenas os números mais prováveis sejam selecionados, enquanto ainda mantém uma boa diversidade.

Limites e Ajustes

Ajuste para Cima:
- Se o modelo estiver gerando muitos números como candidatos “top”, aumentar o threshold para valores como 0.02 ou 0.03 pode ajudar a filtrar ainda mais as previsões, focando nos números mais fortemente previstos.
Ajuste para Baixo:
- Se o conjunto de números selecionados for muito pequeno, diminuir o threshold para algo como 0.001 pode permitir a inclusão de mais números, aumentando a diversidade.
Limite Máximo:0.03
- Justificativa: Valores maiores que 0.03 podem começar a excluir muitos números, deixando poucas opções para a seleção final. Isso pode reduzir a eficácia do modelo, especialmente em cenários onde é necessária maior variação.

3. Qtd I.A’s: Controlando o Número de Tentativas do HyperModel

O que é a Qtd I.A’s?

A quantidade de IAs (Qtd I.A’s) refere-se ao número máximo de tentativas (Max Trials) que o HyperModel faz durante a busca pelos melhores hiperparâmetros. Esse parâmetro foi renomeado para ser mais fácil de entender para leigos. Controlar o número de tentativas pode impactar tanto a qualidade das previsões quanto o tempo de treinamento.

Recomendações para Valor Inicial

Valor Inicial Sugerido:4
- Justificativa: Um valor inicial de 4 tentativas permite ao modelo explorar uma variedade razoável de combinações de hiperparâmetros sem aumentar significativamente o tempo de treinamento.

Limites e Ajustes

Ajuste para Cima:
- Se você desejar uma exploração mais abrangente dos hiperparâmetros, pode aumentar a quantidade de IAs para 6 ou 8. Isso pode potencialmente levar a melhores resultados, mas também aumentará o tempo de treinamento.
Ajuste para Baixo:
- Se o tempo de processamento for uma preocupação ou se os recursos de computação forem limitados, reduzir a quantidade de IAs para 2 ou 3 ainda pode produzir resultados aceitáveis.
Limite Máximo:>8
- Justificativa: Usar mais de 8 tentativas pode começar a gerar retornos decrescentes em termos de melhoria na qualidade das previsões, além de aumentar significativamente o tempo de processamento.

4. GT (Generalized Time): Espaguetização da Singularidade do Torus

O que é o GT?

O GT (Generalized Time) é um parâmetro que influencia o vetor final resultante da espaguetização da singularidade do torus pelo algoritmo GRSBA. Esse processo complexo impacta a forma como as previsões são geradas, afetando tanto a precisão quanto a robustez dos resultados.

Recomendações para Valor Inicial

Valor Inicial Sugerido:0.49
- Justificativa: Um valor de 0.49 permite um bom equilíbrio na manipulação do vetor resultante, ajudando o modelo a capturar padrões sem exagerar na sensibilidade à espaguetização.

Limites e Ajustes

Ajuste para Cima:
- Se você precisar de um modelo que capture mais nuances no vetor final, aumentar o GT para 0.6 ou 0.7 pode ajudar a capturar padrões mais complexos.
Ajuste para Baixo:
- Se o modelo estiver superestimando os padrões, reduzir o GT para 0.3 ou 0.4 pode estabilizar as previsões.
Limite Máximo:2.0
- Justificativa: Valores muito altos de GT podem causar uma distorção excessiva no vetor final, potencialmente reduzindo a precisão das previsões.

Conclusão

A configuração dos valores de penalty, threshold, quantidade de IAs, e GT no Gerasena é um processo de equilíbrio entre precisão e diversidade. Começar com valores moderados e ajustar com base nos resultados do modelo é a melhor abordagem para encontrar o ponto ideal para seu contexto específico. Lembre-se, não existe uma configuração única para todos os casos; a experimentação e a observação dos resultados são fundamentais para otimizar o desempenho do modelo.