A maioria dos servidores de e-mail armazena e-mails em "Mail Folders" ou "Mail Dirs" "Mail Folders" significa que cada pasta / categoria tem todos os emails armazenados nela, um depois do outro. "Mail Dir" significa que cada pasta é, na verdade, um diretório com cada mensagem de correio representada como um único arquivo nesse diretório.
Você está correto em dizer que se você pegar este arquivo de mensagens (o que na verdade significa Mail Folders ou Mail Dirs, você pode escrever um script para importá-lo em seu banco de dados.
No que diz respeito à identificação das pastas / diretórios de e-mail, isso não é algo para você fazer, é algo para o "postmaster" em seu domínio para avisá-lo, já que eles podem estar em qualquer lugar. Lugares comuns (em sistemas Unix) incluem / var / spool / mail e ~ mail - mas isso é arbitrário.
Uma alternativa para obter a pasta / dir de e-mail seria instruir o servidor a fornecê-lo a você. Dependendo do seu cenário, se você tiver todos os e-mails armazenados na sua caixa de entrada e seu provedor usar o protocolo "POP3", você poderá criar um script para extrair cada mensagem e processá-la. O POP3 é um protocolo bastante simples de falar. Você pode fazer algo parecido com o IMAP - que lhe dará acesso a todos os arquivos -, mas que é muito mais difícil de usar e exigirá, em parte, uma estrutura / biblioteca para ajudá-lo.
As mensagens de correio são bem simples -
Eles consistem em um cabeçalho, separados por duas linhas e o corpo. Você pode analisar o cabeçalho para obter o de, para, assunto, data da mensagem etc. O corpo pode ser texto ou pode ser dividido em várias seções, cada tipicamente Base64 codificado (mas há alternativas para isto) - por exemplo se você recebe um e-mail com HTML e texto, ou e-mails ou anexos no e-mail.