[ 9307 ] 迷惑メール(spam)撲滅私的調査会 HTML化ログ |
---|
ID-code:u.BgXJ1nVxM(本記事は03/09-02:06に修正されました)
久しぶりの書き込みのOBAです。
どうも以下の2つのツリーのつながりがおかしくなっていますので,ご確認願います。→管理人殿
http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9235&page=0
http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9221&page=0
私はINCMで本掲示版を巡回しているのですが,この2つのツリーだけうまく読み込めない…。
ID-code:CkJudqkaXPo
相変わらず下のツリーは変ですね。
http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9235
> 私はINCMで本掲示版を巡回しているのですが,この2つのツリーだけうまく読み込めない…。
私もINCMですが、OBAさんのお使いのスクリプトは、GETWILD'74さんのKENT-WEBで、親記事判定を修整したものですか?
#sage
ID-code:u.BgXJ1nVxM
> 相変わらず下のツリーは変ですね。
>
> http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9235
こちらの方はうまく取得できるようになりましたが,もう一方の「test.comメールについて」で始まるスレッドは当方の環境では相変わらず駄目ですね。
ただ,これに関しては当方が使用しているスクリプトの方に原因があるような気がしますが…。
> 私もINCMですが、OBAさんのお使いのスクリプトは、GETWILD'74さんのKENT-WEBで、親記事判定を修整したものですか?
私はhimura氏作のWEB FORUM用プラグイン(Ver.2.28)を一部改編して使用しています。
ただ,himura氏自身がGETWILD'74氏のスクリプトの方を薦めているので移行したいのですが,どうもうまく記事を取得できません。
INCMの掲示板でGETWILD'74氏自身がここの掲示板用の親記事判定を提示しておられましたが,その通りにやってみても駄目でした。
差し支えなければ,浪人さんの方で「親記事判定」をどのように修正されているか,教えていただけないでしょうか?
#sage
ID-code:CkJudqkaXPo
> 私はhimura氏作のWEB FORUM用プラグイン(Ver.2.28)を一部改編して使用しています。
> ただ,himura氏自身がGETWILD'74氏のスクリプトの方を薦めているので移行したいのですが,どうもうまく記事を取得できません。
> INCMの掲示板でGETWILD'74氏自身がここの掲示板用の親記事判定を提示しておられましたが,その通りにやってみても駄目でした。
>
> 差し支えなければ,浪人さんの方で「親記事判定」をどのように修正されているか,教えていただけないでしょうか?
あれをお願いした書き込みは私です。が、結局取得漏れがあるので、自分で試行錯誤していますが
未だにうまく取れません。もう少しもがいてみます。
#sage
ID-code:CkJudqkaXPo
> 差し支えなければ,浪人さんの方で「親記事判定」をどのように修正されているか,教えていただけないでしょうか?
記事情報本文(スクリプトのデフォルトと同じですが…)
<blockquote>(.*?)<\/blockquote>,1,4
親記事判定
<a href=\"[^\?]+(\?mode=allread\&no=(\d+)[^\"]*)\">
子記事判定
<[^\?]+\?no=0*(\d+)
で、一部を除き、今のところ取れるようになりました。
9001は日時がおかしくなるのでログを修整しています。
#sage
ID-code:u.BgXJ1nVxM
> 記事情報本文(スクリプトのデフォルトと同じですが…)
> <blockquote>(.*?)<\/blockquote>,1,4
> 親記事判定
> <a href=\"[^\?]+(\?mode=allread\&no=(\d+)[^\"]*)\">
> 子記事判定
> <[^\?]+\?no=0*(\d+)
> で、一部を除き、今のところ取れるようになりました。
ありがとうございます。
ただ,私の環境でやってみましたが,結構取れない発言があります。(そもそも,このツリーが取れてない)
ちなみに,私が使っているhimura氏のスクリプトでは以下のツリーを除いて正常に取得できているようです。
http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9221&page=12
具体的には,No.9272までは取れているものの,No.9276以降が何度やっても取得できません。
もしかして,No.9276でHTMLメールを本文中に貼り付けているので,これが原因で誤動作しているのかもしれません。
とりあえず今日はここまで。
#sage
ID-code:wLS8ohoS2Sc(本記事は03/12-02:05に修正されました)
この掲示板巡回に関する、その後の修整についてはGETWILD'74さんの掲示板でやりとり
しています。スクリプトも大幅に修整してくださっているようです。
http://ka.sakura.ne.jp/~nikeno/incm/bbs/qa/cyclamen.cgi
ご参照下さい。
ID-code:u.BgXJ1nVxM(本記事は03/15-02:23に修正されました)
> この掲示板巡回に関する、その後の修整についてはGETWILD'74さんの掲示板でやりとり
> しています。スクリプトも大幅に修整してくださっているようです。
>
> http://ka.sakura.ne.jp/~nikeno/incm/bbs/qa/cyclamen.cgi
今回の話題が出てから上記掲示板も巡回対象に加えて,拝見させていただいています。
ただ,GETWILD'74氏のスクリプトだと本文の最後にURLが追加されてしまう,という現象があるのと,私自身のPerlの勉強を兼ねて,しばらくはhimura氏のスクリプトの改造版を使おうかなと考えています。
もっとも,当方の手に負えなくなった場合はGETWILD'74氏のスクリプトでも使えることが分かりましたので,安心して移行できます。(爆)
ちなみに,himura氏のWEB FORUMプラグイン(Ver.2.28)は以下の部分を修正すればここの掲示板を(現時点では)巡回出来ていますので,念のため書き込んでおきます。
(1)「# 改ページチェック v2.84 等」というところを捜して,その下の3行の行頭に#を記入してコメントアウトする。
#elsif (/^\[<a href=.*?\?page=(\d+).*?\]$/io) {
# unless ($move) { $move = $1; last R_HEAD; }
#}
(2)「以下 CMLIB15.PL Ver0.35(一部改造) &getmes: 本文の整形」というところを捜して,その何行か下にある次の一文を修正する。
s/&\#(\d+);/pack("C",$1)/eg;
↓
s/&\#(\d{1,4});/pack("C",$1)/eg;
#この発言を書き込んだら,No.9469はどこにぶら下がるだろうか?
→全然直らないですね。
#sage
ID-code:u.BgXJ1nVxM(本記事は03/13-01:18に修正されました)
またもやログデータが破損したようですので,お手数ですが確認をお願いします。→管理人殿
(1) http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9432&page=0
(2) http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9307&page=12
(1)に関しては掲示板トップを見ると本来(2)のスレッドの発言がぶら下がっているように見えますが,一括表示を実行すると問題ないようです。(ただしツリーの並び方がおかしいですが)
また一部の発言が以下のスレッドに分離しているように見えます。(ただし以下のURLを開いてもエラーが出ますが)
http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9478&page=0
(2)は実はここのスレッドです。(^^;
一括表示を実行するとNo.9430しか表示されません。
…と思ったら本発言を投稿した瞬間に大部分は一括表示で表示されるようになったみたいです。
ただしNo.9469は相変わらず一括表示で表示されていません。
ID-code:CkJudqkaXPo(本記事は03/13-01:30に修正されました)
あ、ついでですみません。私の
http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9419
も、迷子になっています。
URLはno=9419となっていますが付いている番号は9469です。
#とりあえずINCM + GETWILD'74さんのKENT-WEB用プラグイン0.77で
#巡回出来てます。
#sage
ID-code:u.BgXJ1nVxM
> またもやログデータが破損したようですので,お手数ですが確認をお願いします。→管理人殿
>
> (1) http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9432&page=0
> (2) http://bbs.spamstop.net/wforum.cgi?mode=allread&no=9307&page=12
まだ直ってませんね。
少なくとも上記(2)に関しては,No.9430,9469,9594の発言が全然関係ないスレッドにつながっているように見えます。
確認をお願いいたします。→管理人殿
ID-code:NrppobISv22
> 確認をお願いいたします。→管理人殿
管理人では有りませんが、一寸見たところ、
お二方の、投稿だけが飛んでるように見えますが。
記事をプラグインを使用して投稿してませんか。
その事が原因とは、考えられませんか。
見当違いだったら申し訳有りません。
ID-code:u.BgXJ1nVxM
> 管理人では有りませんが、一寸見たところ、
> お二方の、投稿だけが飛んでるように見えますが。
> 記事をプラグインを使用して投稿してませんか。
> その事が原因とは、考えられませんか。
私(OBA)に関しては,投稿はすべてブラウザで行なっています。
INCMはログを取得する目的でのみ使用しています。
#sage
ID-code:NrppobISv22
> 私(OBA)に関しては,投稿はすべてブラウザで行なっています。
> INCMはログを取得する目的でのみ使用しています。
そうですか、其れは申し訳ありませんでした。
しかしながら、現在は、お二方の投稿のみの様にも見えます。
当方の見落としで、他にもあるかも知れませんが。
ただ、他のWebFormをベ−スにした物より、この掲示板は
大分デリケ−トな感じがします。
当方も、掲示板に同様の使い勝手をえる為に、改造を致しておりますが
改造をすればするほどデリケ−トさが、増していきます。
その辺も、ご考慮ください。
何れにせよ、余計な口出し申し訳ありません m(__)m
> #sage
#sage
ID-code:CkJudqkaXPo
> ただ、他のWebFormをベ−スにした物より、この掲示板は
> 大分デリケ−トな感じがします。
私はINCMで投稿した時におかしくなった事があります。そのときは管理人様
にご報告しました。
ですから現在はINCMでの投稿は出来るだけ控えていますが、基本的にはアク
セスしてくるユーザーが何を使っても壊れない掲示板でないとまずいわけで
そこは制限出来ませんよね。特にここのように攻撃にさらされる可能性が高
い掲示板では、セキュリティ対策だけでなく、強靱さも要求されます。
何かのタイミングでファイルのロックが効いていないのかなぁとも思いまし
たが、今はツリーを作るルーチンが別の文字列に反応して壊れるような気が
しています。
#sage