|
Treinando e Configurando o filtro Bayesian no MailEnable Profissional |
|
|
|
|
Escrito por Danilo Acquaviva (Administrador)
|
|
29-Out-2007 |
|
Aprenda a treinar e configurar os recursos do filtro Bayesian no MailEnable Professional para acabar de uma vez com os spam's.
O Filtro Bayesian O Filtro Baysian é formado por 2 filas de mensagens ( boas e más ) criando um dicionário de palavras que controla a frequência de tokens ( palavras ou frases ) dentro das mensagens. Este dicionário permite que o MailEnable analise as mensagens prevendo uma probabilidade das mensagens serem spams, cada mensagem pode ter seus tokens comparados com o dicionário. Por exemplo, se o token "FREE" ocorrer demais em e-mails de spam, mas raramente em e-mails pessoais e uma nova mensagem contiver o token "FREE" nela, esta será considerada spam. Como múltiplos tokens são usados, a exatidão do filtro é incerta. Se um email normal contiver o token "FREE" mas também o token "mailenable", que pode aparecer somente em e-mails pessoais, então o segundo irá parar o e-mail que foi marcado como spam.
A efetividade aproximada disso é deteminada tendo bons exemplos de spams e não-spams. O processo de compilação de um dicionário de exemplos de spams e não-spams é chamado de 'treinamento'.
O MailEnable possue quatro opções para a configuração do filtro Bayesian:
1. Auto-treinamento. 2. Usando o dicionário padrão. 3. Treinamento manual via utilitário de linha de comando e scripts. 4. Uma combinação de ambos: manual e auto-treinamento.
Configurando o auto-treinamento do filtro Bayesian
As seguintes linhas abaixo são os passos no processo de configuração do auto-treinamento do filtro Bayesian para o MailEnable.
1. Configurar auto-treinamento para o filtro. 2. Configurar coleção de spam's para o treinamento. 3. Configurar coleção de cobaias para o treinamento. 4. Criar um filtro Bayesian global. 5. Testar o filtro Bayesian.
Passo 1: Configurar auto-treinamento para o filtro.
O filtro Bayesian pode ser auto-treinado usando 'bons' e-mails(cobaias) e 'maus' e-mails (spams). O recurso de auto-treinamento pode ser ativado em Servers > Localhost > Filters > MailEnable Bayesian Filter > Properties > Auto-training tab.
Configuração: Enable auto-training
Marque esta opção para ativar o auto-treinamento. Enquanto o Filtro Bayesian está no modo auto treinamento, as funções para atualizar manualmente o dicionário usando o utilitário de comando "mespamcmd.exe" não funcionarão. Isso é porque quando o auto-treinamento está rodando, novos acréscimos ao dicionário são armazenados na memória, e não são escritos no HD até que o serviço MTA esteja parado. Um filtro global com o critério "Bayesian filter spam probability' precisará ser configurado para o auto-treinamento poder trabalhar. Se um filtro não for configurado com um critério Bayesian, então o auto-treinamento não irá ocorrer.
Configuração: Opções ( Processar conteúdo HTML nas Mensagens)
Se essa opção for selecionada e a mensagem contiver HTML, então o HTML será analisado como se fosse uma mensagem de texto. Os Tokens irão portanto também incluir dados das mensagens HTML. Ele marca o filtro mais provável para detectar o HTML como spam porque os tokens/palavras do HTML de mensagens "más" podem ser usados para calcular a probabilidade de spam.
Configuração: Spam Honeypot Email Addresses ( Edit address list )
Define os endereços de e-mail que não serão recebidos como e-mail válidos para exemplo.
Configuração: HamAddresses ( Edit address list )
Define as "cobaias" ou endereços e-mails legítimos para exemplo.
Passo 2: Coletando spams para o auto-treinamento
Definindo os endereços "honey pot", exemplos de e-mails de spam podem ser coletados. Endereços "Honey Pot" são endereços que são designados para coletar spam.
Colete spams com a criação de um endereço "catchall". Configure um endeço de correio (
Este endereço de e-mail está protegido contra spam bots, pelo que o Javascript terá de estar activado para poder visualizar o endereço de email
) como um endereço "catchall". Este endereço irá coletar todos os e-mails enviados para um domínios que não tem uma mapeação para a caixa de entrada. A maioria de e-mails nesta caixa de correio serão spams, pois os spammers frequentemente enviam para endereços inválidos de um determinado domínio.
Se um treinamento manual está sendo usado junto com o auto-treinamento, os e-mails coletados aqui não deverão ser usados para o processo de treinamento manual. Também, como uma "catchall" irá coletar uma porção de e-mails a caixa de correio precisará ser limpa frequentemente.
Passo 3: Coletando 'cobaias' para o auto-treinamento
E-mails desejáveis ou legítimos são comumentes referidos como uma 'cobaia'. A opção de endereços cobaias sobre as configurações de auto-treinamento são importantes para mostrar ao programa de administração quais são os e-mails válidos. Ele é o melhor exemplo de uma variedade de endereços válidos com o objetivo de pegar um exemplo decente de mensagens.
Passo 4: Criando um filtro Bayesian global:
Um filtro global precisa ser criado na ordem para as mensagens que passam sobre o servidor sejam checadas pelo filtro Bayesian e uma apropriada ação seja tomada. O critério do filtro pode especificar o nível da probabilidade de spams e ações subsequentes para que algumas mensagens serem denominadas spams. O seguinte exemplo irá remover mensagens com acima de 95% de probabilidade de serem spams.
1. Criar um novo filtro chamado "Bayesian" aqui: Messaging Manager -> Clique direito em filtros -> Novo Filtro.
2. Defina o critério " Quando uma mensagem tiver uma certa probabilidade de spams -> 95% "
3. Defina a ação a ser executada quando uma mensagem spam for detectada. Isso deverá ser normalmente como "Adicionar um prefixo no assunto" e usar "spam" ou "junk" como prefixo.
Passo 5: Testando o Filtro Bayesian:
Para assegurar que o filtro Bayesian está funcionando corretamente ( o filtro Bayesian é usado no dicionário e ações designadas são completadas quando mensagens são entregues ao sistema ) é recomendado os seguintes testes:
O METray mostra as instâncias onde o filtro Bayesian tem escaneado e detectado o spam. Quando o METray está aberto, ative a "Visualização de estatística desde que os serviços foram restartados". A seção que detalha como muitos "Bayesian Scans" foram completados junto com o "Bayesian Detections" irá mostrar como muitos e-mails são checados e como muitos são detectados como spam desde que o serviço MTA foi iniciado pela última vez.
Os logs do filtro irão também mostrar qualquer detecção Bayesian. Os logs são acessados via: MailEnable Administration program > Servers > Localhost > Filters > MailEnable Message Filter > Logs > Filters. Se qualquer mensagem foi detectada e acionada pelo filtro Bayesian então uma linha nos logs será mostrada conforme a seguinte:
[Date-Time] [Message ID] SMTP Bayesian COPY_TO_QUARANTINE,DELETE [SMTP:
Este endereço de e-mail está protegido contra spam bots, pelo que o Javascript terá de estar activado para poder visualizar o endereço de email
] [IP_Address of sender]
|
|
Atualizado em ( 29-Out-2007 )
|