October 26, 2003

Weblogs.Com userAgents.xml のカウントの謎

[ Perl , XML , ウェブログに関すること ]

Weblogs.Com では受け取った Ping による更新情報 (changes.xml) だけでなく、XML-RPC あるいは SOAP で Ping を打ってきた UserAgent を数えた結果を userAgents.xml として吐き出してます。

This file tracks the User-Agents of apps that call Weblogs.Com through XML-RPC or SOAP 1.1.

http://www.weblogs.com/userAgents.xml

It's updated when changes.xml changes.

とまあ、必要最低限の事しか語られていないのですが、物は試しに総数を数えてみました。

#!/usr/local/bin/perl
use strict;
use warnings;
 
my $counter = 0;  
while (<>) {
    chomp;
 
    if ($_ =~ m/<agent name="(.*?)" count="(.*?)"\/>/) {
	my ($ua, $count) = ($1, $2);
 
	$counter += $count;
    }
}
 
print $counter, "\n";

こいつにパイプで流し込んだだけです。結果は

3293255

329万件。この userAgents.xml に載っている値がいつから数えられたものかも分からないのですが、これまでの総数だとすると少なすぎる、逆に changes.xml のように 3 時間以内だと多すぎるということで、よくわからない数値なのでした。

Apache XML-RPC が一番多いのはなんでだろう...。J2EE で書かれた blog ツールとかが大人気? ...って BLOGGER かな (BLOGGER は Java で書かれてるっぽいです)。BLOGGER って Weblogs.Com Ping 飛ばすんでしたっけ? 教えて BLOGGER ユーザさん。

Posted by naoya at October 26, 2003 01:18 AM | トラックバック (0)  b_entry.gif
トラックバック [0件]
TrackBack URL: http://mt.bloghackers.net/mt/suck-tbspams.cgi/566
コメント [0件]