Comunidade Brasileira SWsoft - Parallels - Treinando e Configurando o filtro Bayesian no MailEnable Profissional Comunidade Brasileira SWsoft - Parallels
Comunidade Brasileira SWsoft - Parallels




Principal arrow Artigos | Dicas arrow MailEnable arrow Treinando e Configurando o filtro Bayesian no MailEnable Profissional
Flash de Notícias
Para fazer o download de nossos manuais e conferir nossos Vídeos-Tutoriais cadastre-se em nossa comunidade!!
 

Treinando e Configurando o filtro Bayesian no MailEnable Profissional PDF Imprimir E-mail
Escrito por Danilo Acquaviva (Administrador)   
29-Out-2007
Aprenda a treinar e configurar os recursos do filtro Bayesian no MailEnable Professional para acabar de uma vez com os spam's.

O Filtro Bayesian 

O Filtro Baysian é formado por 2 filas de mensagens ( boas e más ) criando um dicionário de palavras que controla a frequência de tokens ( palavras ou frases ) dentro das mensagens. Este dicionário permite que o MailEnable analise as mensagens prevendo uma probabilidade das mensagens serem spams, cada mensagem pode ter seus tokens comparados com o dicionário. Por exemplo, se o token "FREE" ocorrer demais em e-mails de spam, mas raramente em e-mails pessoais e uma nova mensagem contiver o token "FREE" nela, esta será considerada spam. Como múltiplos tokens são usados, a exatidão do filtro é incerta. Se um email normal contiver o token "FREE" mas também o token "mailenable", que pode aparecer somente em e-mails pessoais, então o segundo  irá parar o e-mail que foi marcado como spam.

A efetividade aproximada disso é deteminada tendo bons exemplos de spams e não-spams. O processo de compilação de um dicionário de exemplos de spams e não-spams é chamado de 'treinamento'.

O MailEnable possue quatro opções para a configuração do filtro Bayesian:

1. Auto-treinamento.
2. Usando o dicionário padrão.
3. Treinamento manual via utilitário de linha de comando e scripts.
4. Uma combinação de ambos: manual e auto-treinamento.

Configurando o auto-treinamento do filtro Bayesian

As seguintes linhas abaixo são os passos no processo de configuração do auto-treinamento do filtro Bayesian para o MailEnable.

1. Configurar auto-treinamento para o filtro.
2. Configurar coleção de spam's para o treinamento.
3. Configurar coleção de cobaias para o treinamento.
4. Criar um filtro Bayesian global.
5. Testar o filtro Bayesian.

Passo 1: Configurar auto-treinamento para o filtro.

O filtro Bayesian pode ser auto-treinado usando 'bons' e-mails(cobaias) e 'maus' e-mails (spams). O recurso de auto-treinamento pode ser ativado em Servers > Localhost > Filters > MailEnable Bayesian Filter > Properties > Auto-training tab.

Configuração: Enable auto-training

Marque esta opção para ativar o auto-treinamento. Enquanto o Filtro Bayesian está no modo auto treinamento, as funções para atualizar manualmente o dicionário usando o utilitário de comando "mespamcmd.exe" não funcionarão. Isso é porque quando o auto-treinamento está rodando, novos acréscimos ao dicionário são armazenados na memória, e não são escritos no HD até que o serviço MTA esteja parado. Um filtro global com o critério "Bayesian filter spam probability' precisará ser configurado para o auto-treinamento poder trabalhar. Se um filtro não for configurado com um critério Bayesian, então o auto-treinamento não irá ocorrer.

Configuração: Opções ( Processar conteúdo HTML nas Mensagens)


Se essa opção for selecionada e a mensagem contiver HTML, então o HTML será analisado como se fosse uma mensagem de texto. Os Tokens irão portanto também incluir dados das mensagens HTML. Ele marca o filtro mais provável para detectar o HTML como spam porque os tokens/palavras do HTML de mensagens "más" podem ser usados para calcular a probabilidade de spam.

Configuração: Spam Honeypot Email Addresses ( Edit address list )

Define os endereços de e-mail que não serão recebidos como e-mail válidos para exemplo.

Configuração: HamAddresses ( Edit address list )

Define as "cobaias" ou endereços e-mails legítimos para exemplo.

Passo 2: Coletando spams para o auto-treinamento

Definindo os endereços "honey pot", exemplos de e-mails de spam podem ser coletados. Endereços "Honey Pot" são endereços que são designados para coletar spam.

Colete spams com a criação de um endereço "catchall". Configure um endeço de correio ( Este endereço de e-mail está protegido contra spam bots, pelo que o Javascript terá de estar activado para poder visualizar o endereço de email ) como um endereço "catchall". Este endereço irá coletar todos os e-mails enviados para um domínios que não tem uma mapeação para a caixa de entrada. A maioria de e-mails nesta caixa de correio serão spams, pois os spammers frequentemente enviam para endereços inválidos de um determinado domínio.

Se um treinamento manual está sendo usado junto com o auto-treinamento, os e-mails coletados aqui não deverão ser usados para o processo de treinamento manual. Também, como uma "catchall" irá coletar uma porção de e-mails a caixa de correio precisará ser limpa frequentemente.

Passo 3: Coletando 'cobaias' para o auto-treinamento

E-mails desejáveis ou legítimos são comumentes referidos como uma 'cobaia'. A opção de endereços cobaias sobre as configurações de auto-treinamento são importantes para mostrar ao programa de administração quais são os e-mails válidos. Ele é o melhor exemplo de uma variedade de endereços válidos com o objetivo de pegar um exemplo decente de mensagens.

Passo 4: Criando um filtro Bayesian global:


Um filtro global precisa ser criado na ordem para as mensagens que passam sobre o servidor sejam checadas pelo filtro Bayesian e uma apropriada ação seja tomada. O critério do filtro pode especificar o nível da probabilidade de spams e ações subsequentes para que algumas mensagens serem denominadas spams. O seguinte exemplo irá remover mensagens com acima de 95% de probabilidade de serem spams.

1. Criar um novo filtro chamado "Bayesian" aqui: Messaging Manager -> Clique direito em filtros -> Novo Filtro.

2. Defina o critério " Quando uma mensagem tiver uma certa probabilidade de spams -> 95% "

3. Defina a ação a ser executada quando uma mensagem spam for detectada. Isso deverá ser normalmente como "Adicionar um prefixo no assunto" e usar "spam" ou "junk" como prefixo.

Passo 5: Testando o Filtro Bayesian:

Para assegurar que o filtro Bayesian está funcionando corretamente ( o filtro Bayesian é usado no dicionário e ações designadas são completadas quando mensagens são entregues ao sistema ) é recomendado os seguintes testes:


O METray mostra as instâncias onde o filtro Bayesian tem escaneado e detectado o spam. Quando o METray está aberto, ative  a "Visualização de estatística desde que os serviços foram restartados". A seção que detalha como muitos "Bayesian Scans" foram completados junto com o "Bayesian Detections" irá mostrar como muitos e-mails são checados e como muitos são detectados como spam desde que o serviço MTA foi iniciado pela última vez.

Os logs do filtro irão também mostrar qualquer detecção Bayesian. Os logs são acessados via: MailEnable
Administration program > Servers > Localhost > Filters > MailEnable Message Filter > Logs >
Filters. Se qualquer mensagem foi detectada e acionada pelo filtro Bayesian então uma linha nos logs será mostrada conforme a seguinte:

[Date-Time] [Message ID] SMTP Bayesian COPY_TO_QUARANTINE,DELETE
[SMTP: Este endereço de e-mail está protegido contra spam bots, pelo que o Javascript terá de estar activado para poder visualizar o endereço de email ]        [IP_Address of sender]








Atualizado em ( 29-Out-2007 )
 
Próximo >
Usuários On-line
Temos 12 visitantes on-line

Últimas Notícias

Popular

Mambo Template Supplied by Netshine Software Limited