[掲示板に戻る] [HTML化ログ 大目次へ][ツリー一覧0040番へ]
[ 20808 ] 迷惑メール(spam)撲滅私的調査会 HTML化ログ
Date: 2005 May 21 18:19:38
記事No.20808/タイトル:サイトからのアドレス収集2004/03編
投稿日:2005/05/21(Sat) 18:19:38 / 投稿者:管理人
★ツリー/親記事[20808]
-レス記事[20809][21131]

ID-code:w6SZ3BprNCg

以下の投稿は一年前にantispam-jメーリングリストで
行ったものです。
−−−−−−−−−−−−−−−−−−−−−
 高崎@私的調査会です。
MLからのメアド収集の話が出たついでに
Webサイトなどからのメアド収集について気が付いたことを書きます。

 他の方で述ていた方もおられますが、
結論を先に言うと
「サイトでのメアド記述の際、
エンティティ表記をするだけでも
ロボット収集対策に結構効果がある模様」
というものです。

 以下はその根拠となる報告です。
−−−−−−

 私は以前からメインで使っているbiglobeに加えて
独自ドメインのメアドを昨年中頃から使い始めたのですが、
このアドレスは私のサイトの連絡先としても
たしか昨年秋くらいから公開しています。
http://www2g.biglobe.ne.jp/~stakasa/other/lianxi.html

 上のページで独自ドメインのメアドを書き加えた際に細工しました。
細工は2つありまして

−−−
細工1.「xxx@独自ドメイン」のメアドは見かけは
「xxx@独自ドメイン」
(見れば分かりますが伏せ字ではなく本当にxxx)だが
mailtoすなわち実際にクリックして送る先は
「my_lianxi@独自ドメイン」が出るようにした。

細工2.表記の際にはbiglobeのメアドも含めて、
上の独自ドメインのメアドも全て16進数化などにしたもの
(いわゆるエンティティ表記?)で記述し、
ソースで書いてある記述そのままではメアドにならないようにした。
すなわちここ1,2年で広まり始めた手法。
http://www2g.biglobe.ne.jp/~stakasa/spam/spam-FAQ01.html#ziwei
−−−

 で、その結果なんですがその後、
上の連絡先ページで記述したメアド先には
日本語spamも英文spamもほとんど届いていないことに気が付きました。

 唯一一通は以下の日本語spamでした。
なお、この宛先は見た目上の
「xxx@独自ドメイン」
ではなく、mailtoの
「my_lianxi@独自ドメイン」
でした。

−−−−
Return-Path: <kashukana@hotmail.com>
Received: (qmail 25090 invoked
by alias);
2 Feb 2004 21:09:58 +0900
Received: from unknown (HELO hotmail.com) (64.4.47.61)
by 126.local.digirock.jp
with SMTP;
2 Feb 2004 21:09:58 +0900
Received: from mail pickup service
by hotmail.com
with Microsoft SMTPSVC;
Mon, 2 Feb 2004 04:09:55 -0800
Received: from 218.152.165.2
by by9fd.bay9.hotmail.msn.com
with HTTP;
Mon, 02 Feb 2004 12:09:55 GMT
X-Originating-IP: [218.152.165.2]
X-Originating-Email: [kashukana@hotmail.com]
X-Sender: kashukana@hotmail.com
From: 伊藤 彩花 <kashukana@hotmail.com>
To: arigatougozaimasu@love.love
Bcc:
Subject: チョコより甘ったるい私?!(笑)
Date: Mon, 02 Feb 2004 21:09:55 +0900
Mime-Version: 1.0
Status: RO
X-UIDL: 1075723798.25097.s37.xrea.com
Content-Type: text/html; charset=iso-2022-jp
Message-ID: <BAY9-F61aAvNq1T2hIc000299bb@hotmail.com>
X-OriginalArrivalTime: 02 Feb 2004 12:09:55.0636 (UTC) FILETIME=[7865B740:01C3E985]
−−−−

 一方で、
独自ドメインのメアドは各種掲示板での投稿の際に
責任明示としてしばしば記述している、名乗っているのですが
それで使ったメアドにはそれなりにspamが届くようになっています。
すなわち
(日本語spam)
http://antispam.stakasaki.net/shouhai-fenxi.html#030103
(英文spam)
http://antispam.stakasaki.net/shouhai-fenxi.html#030102
で示した緑の棒グラフのspamは
ほとんどがいくつかの掲示板で名乗ったメアドに
届いたものです。

 この際にちょっと興味深いのは、一般の多くの掲示板では
メアドを記述するとmailtoのリンクが張られますが、
私のantispam掲示板
http://www2g.biglobe.ne.jp/~stakasa/nospam_bbs/wforum.html
では少しは収集対策になるかと思いまして
mailtoのリンクを張らないようにしたのですけれども
このようにして公開された
「my_antispam_bbs@独自ドメイン」
にもかなり多く来ています。

 さて、連絡先として新しくエンティティ生成して書いたメアドに
あまり来ていないということは、
同じくエンティティ生成で書いている以前からのbiglobeアドレスにも
そのルートでは来ていないということになります。
しかし
(日本語spam)
http://antispam.stakasaki.net/shouhai-fenxi.html#030103
(英文spam)
http://antispam.stakasaki.net/shouhai-fenxi.html#030102
の水色のグラフは、そのアドレスに届いているspamですので
これはすなわち以前に「普通に」公開していたときに収集され、
リスト化されたものが
そのまま使われているという結論になりましょうか?

 あるいはこのbiglobeアドレスはMLでも多用していますので
そのルートで収集されている可能性も考えられなくはないですが
収集の効率性からあまりMLからの収集されていないのではあるまいか、
という推測を私がしていることは前に述べました。

 すなわち以上をまとめますと以下のような結論になります。
−−−
1■ウェブ上にいわゆるエンティティ生成でメアドを
記述する効果は現在のところそれなりにある模様

2■mailtoでリンクを張っていなくても、
それに関係なくメアドは収集されており、
これは掲示板を中心として現在でも収集が続いている模様

3■しかし今から公開を止めても、
過去に一度リストに入ったメアドはなかなか抜かれず
そのメアドにはspamは届き続ける模様
−−−

 ちなみに拾われにくくする方法として
Javascriptで表記する方法もありますけど
jsを切っている人もいるかもしれないので
個人的にはあまりそれは採用したくないのですが
エンティティ表記はそれによって不自由になるユーザは
あまりいないのではないでしょうか?

 その割には上のようにある程度(現在のところは)
効果があるような感じですので、
特に今後、メールアドレスをサイトなどで
連絡先として公開しようとなさっている方は
エンティティ表記になさることをお勧めします。

 また、掲示板をお持ちの管理者の方は、出来たら掲示板を改良し、
公開されたメアドもエンティティ表記になるようにした方が
訪問者には親切でありましょう。

 まあ無論、そのうちそれを見越して収集するロボットなども
出てくるでしょうから、
あくまで「現在のところは」というものですけどね。


記事No.20809/タイトル:サイトからのアドレス収集2005/05
投稿日:2005/05/21(Sat) 18:21:33 / 投稿者:管理人
★ツリー/親記事[20808]+前記事[20808]

ID-code:w6SZ3BprNCg

で、最近、事後報告として以下のものを投稿しました。

−−−−−−−−−−−−−−−−−−−−−
 高崎@私的調査会です。最近気が付いたことですが。

 一年前、「サイトからのアドレス収集」というタイトルで
以下の投稿を行いました。

http://groups.yahoo.co.jp/group/antispam-j/message/6790

 その中の結論の一つとして

> 1■ウェブ上にいわゆるエンティティ生成でメアドを
> 記述する効果は現在のところそれなりにある模様

ということを書いていたのですが、今年に入ってから
エンティティ作成表記していたメールアドレスにも
日本語spamが随分来るようになりました。
(エンティティ表記については
http://www2g.biglobe.ne.jp/~stakasa/spam/spam-FAQ01.html#ziwei
などを参照のこと)

 私が現在受け取っている日本語spamは月に総計1000〜2000通ほど
http://antispam.stakasaki.net/shouhai-fenxi.html#030103
ですが、上記のメアドに昨月には両者とも60通程度の日本語スパムが届きました。

 なお、エンティティ表記の際、
http://stakasaki.net/mail.htm
を見て頂くと分かるように
「xxx@独自ドメイン」のメアドは、見かけは「xxx@独自ドメイン」
(伏せ字ではなく本当にxxx)
ですが、mailtoすなわち実際にクリックして送る先は
「my_lianxi@独自ドメイン」が出るようにしているのですけど
spamはxxxとmy_lianxiの両方にほぼ均等に着始めた感じです。

 無論、スパムの性質上、同じらしき所からも何通も来ていますので、
spammerの間でどれくらい広がっているのかは不明です。
まだ現在は単一のspammerグループであることも否定は出来ません。

 なお、昨年から昨月までの調べましたが、届いているのは日本語spamだけで
英文spamはほとんどありません。
 3月に一通だけ
xxx
宛に届いたものがありますが、内容を見るとナイジェリアからの手紙のようです。

 ああ、考えてみるとこのxxxに届いている外国spam一通は
本当にサイトからメアドを拾ったか不明ですな。
 独自ドメイン毎にxxxユーザに送りつけたパターンの可能性もありますね。
(日本語spamには少ないけれども外国語spamにしばしばあるものとしては
ありがちなユーザ名@独自ドメイン
に手当たり次第送りつけているものがありますので。
info@stakasaki.xxx
とか)

 まあいずれにせよ書きたかったことは
「サイトでエンティティ表記してもメアドを拾うspammerが
日本語spammerでは随分登場している模様」
ということです。
 昨年の投稿でも「やらないよりマシ」な程度であり、
絶大な効果を期待すべきでないという点は指摘されていましたが
まあ改めて確認と言うことで。


記事No.21131/タイトル:エンティティ表記(Re: サイトからのアドレス収集2004/03編)
投稿日:2005/07/11(Mon) 19:43:05 / 投稿者:管理人
★ツリー/親記事[20808]+前記事[20808]

ID-code:w6SZ3BprNCg(本記事は投稿者自身により07/12-01:53に修正されました)

> 以下の投稿は一年前にantispam-jメーリングリストで
> 行ったものです。

 すっかり忘れていたのですが、
それ以前にここでそれを話題にしたスレッドに
以下があったようですね。

・所詮は自衛は自衛
http://www2g.biglobe.ne.jp/~stakasa/nospam_bbs/past/log/019064.html

・メールアドレスのエンティティ表記について
http://www2g.biglobe.ne.jp/~stakasa/nospam_bbs/past/log/017076.html

 あ、やば...またネスケVer4を考慮するのを忘れたような....


[掲示板に戻る] [HTML化ログ 大目次へ][ツリー一覧0040番へ]
bokumetusiteki