Треба дещо пояснити:
Підписи "вичищалися" так:
1) обробка скриптом щодо дублікатів
2) вичитка "вручну". Усі підписи псевдонімами було видалено
3) обробка залишку скриптом - перевірка email адрес
Підписи без email адрес, або з невалідними чи неіснуючими адресами - видалені. Треба розуміти, що цей лист має формально відповідати закону про звернення громадян.
Принцип фільтраціі дуже простий - скрипт вичитує email адресу, перевіряє існування MX запису для доменного ім'я, якщо MX існує - пробує зв'язатися з першим (найбільш пріорітетним) оштовим сервером та починає сеанс доставки листа до адресата.
Якщо без помилок проходить послідовність:
helo mail.letter.org.ua
mail from: admin<at>letter.org.ua
rcpt to: .......
То адреса вважається валідною та підпис приймається.
При помилці на будь-якому етапі - відбраковується.
Скрипт перевірки адрес запускався десь до 10 разів (зрозуміло. по відбракованим записам)
На жаль, кількасот адрес, що могли бути зараховані, не пройшли перевірки по одній з наступних причин:
- MX запису для домену не існує або він некоректний
- вказаний в MX хост не приймає з'єднання на tcp порт 25
- з якихось причин у процесі з'єднання або сеансу зв'язку з'єднання розривалося по таймауту (кожного разу). Досить поширена причина
- спрацьовувала система захисту від спаму на серверах-адресатах.
Дуже поширена причина. Зі своєї сторони я зробив усе, що міг, щоб такого було як можна меньше (пошта admin<at>letter.org.ua реально існує, я навіть виключив захист по RBL зі свого боку).
До того ж часу було обмаль і я завважив за краще викинути лишку,
ніж пропустити неіснуючу адресу.