<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>taichino.com &#187; blog</title>
	<atom:link href="http://taichino.com/tag/blog/feed" rel="self" type="application/rss+xml" />
	<link>http://taichino.com</link>
	<description>永遠のネバーランド</description>
	<lastBuildDate>Sat, 04 Feb 2012 13:33:04 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>良く読まれるブログはどれくらい記事を書いているのかという話</title>
		<link>http://taichino.com/memo/1314</link>
		<comments>http://taichino.com/memo/1314#comments</comments>
		<pubDate>Tue, 08 Dec 2009 09:12:24 +0000</pubDate>
		<dc:creator>taichino</dc:creator>
				<category><![CDATA[メモ]]></category>
		<category><![CDATA[blog]]></category>
		<category><![CDATA[tophatenar]]></category>

		<guid isPermaLink="false">http://taichino.com/?p=1314</guid>
		<description><![CDATA[firefoxプラグインを作るくらいTopHatenarのファンになっていて、新しいブログを見る度にランキングをチェックしてしまいます。それで自分と似た様なブログでランキングが上だったりすると、書いている記事数をチェックして「あぁ、このブログは自分のよりたくさんの記事を書いているから仕方がない」などと変にプライドを納得させるような事が繰り返し発生しました。そんな事を毎回やっていては時間の無駄ですので、TopHatenarにランキングされているブログがどれくらい実際に記事を書いているのか調べてみました。 やった事 TopHatenarに登録済みはてなダイアリーの、各々の登録記事数を取得して、ブックマーク数や購読者数と相関があるか調べました。 登録記事数の取得方法 はてなダイアリーのブログ情報のページ(d.hatena.ne.jp/***/about)から、日記をつけた日数を取得。正確には１日に２記事書いたりという事もあるのですが、大まかな傾向は変わらないだろうという判断です。 対象 登録記事数の取得方法の制約からTopHatenarの登録されている、はてなダイアリー約93000件。 結果 ブックマーク１個以上の33000件、購読者数１名以上の29000件を 上位から順に1000件ずつ区切って、記事数の平均を取ったのが以下のグラフになります。 個人的には綺麗な右肩下がりのグラフを期待していました。記事数を増やすほど、書ける記事の質も上がり、検索エンジンに登録されるキーワードも増えるので露出も増えるだろうと考えていたからです。しかしグラフを見る限り少なくとも全体的な傾向として記事数はあまり思ったよりも重要ではないようです。実際に何が読まれる要因なのかは今のところハッキリしていませんが、読まれる為には、書き続ける努力だけでは足りないという事で、割とショッキングな結果だと思うんですがどうでしょうか。 このブログは自分が後から参照するのがメイン用途ですが、ついでに色んな人に読まれたら嬉しいなと思っていたのですが、そういう甘い期待は吹き飛びましたね。残念です。 というわけで読まれるブログはどれくらい記事を書いているのかと思って調べた結果は、「一番読まれている1000のブログは500~600の記事数だけど、記事数は読まれるのにあまり重要な要素ではない」でした。冒頭の言い訳はもう使えませんね。 追記 集計するのに使用したプログラムをgithubに上げたのでよろしければどうぞ。 mysqlとq4mをインストールしてる状態で以下のような感じで使います。 $ mysqladmin -u root create hoge $ mysql -u root hoge ＜ inittbl.sql $ python crawler.py &#38; # URLから記事件数を取得するクローラ $ python aggregator.py # TopHatenarから対象のURL群を取得する # 上記プロセスが終了後 $ python tally.py bookmarks # bookmark集計 $ python tally.py subscribers # subscriber集計]]></description>
			<content:encoded><![CDATA[<p><a href="http://taichino.com/programming/1169">firefoxプラグインを作るくらい</a>TopHatenarのファンになっていて、新しいブログを見る度にランキングをチェックしてしまいます。それで自分と似た様なブログでランキングが上だったりすると、書いている記事数をチェックして「あぁ、このブログは自分のよりたくさんの記事を書いているから仕方がない」などと変にプライドを納得させるような事が繰り返し発生しました。そんな事を毎回やっていては時間の無駄ですので、TopHatenarにランキングされているブログがどれくらい実際に記事を書いているのか調べてみました。</p>
<p><span id="more-1314"></span></p>
<p><strong>やった事</strong><br />
TopHatenarに登録済みはてなダイアリーの、各々の登録記事数を取得して、ブックマーク数や購読者数と相関があるか調べました。</p>
<p><strong>登録記事数の取得方法</strong><br />
はてなダイアリーのブログ情報のページ(d.hatena.ne.jp/***/about)から、日記をつけた日数を取得。正確には１日に２記事書いたりという事もあるのですが、大まかな傾向は変わらないだろうという判断です。</p>
<p><strong>対象</strong><br />
登録記事数の取得方法の制約からTopHatenarの登録されている、はてなダイアリー約93000件。</p>
<p><strong>結果</strong><br />
ブックマーク１個以上の33000件、購読者数１名以上の29000件を<br />
上位から順に1000件ずつ区切って、記事数の平均を取ったのが以下のグラフになります。</p>
<div id="attachment_1316" class="wp-caption alignright" style="width: 560px"><a href="http://taichino.com/wp-content/uploads/2009/12/blog_cnt1.png"><img src="http://taichino.com/wp-content/uploads/2009/12/blog_cnt1.png" alt="ブログの記事数と、ブックマーク数・購読者数の関係" title="ブログの記事数と、ブックマーク数・購読者数の関係" width="550" height="330" class="size-full wp-image-1316" /></a><p class="wp-caption-text">ブログの記事数と、ブックマーク数・購読者数の関係</p></div>
<p>個人的には綺麗な右肩下がりのグラフを期待していました。記事数を増やすほど、書ける記事の質も上がり、検索エンジンに登録されるキーワードも増えるので露出も増えるだろうと考えていたからです。しかしグラフを見る限り少なくとも全体的な傾向として記事数はあまり思ったよりも重要ではないようです。実際に何が読まれる要因なのかは今のところハッキリしていませんが、読まれる為には、書き続ける努力だけでは足りないという事で、割とショッキングな結果だと思うんですがどうでしょうか。</p>
<p>このブログは自分が後から参照するのがメイン用途ですが、ついでに色んな人に読まれたら嬉しいなと思っていたのですが、そういう甘い期待は吹き飛びましたね。残念です。</p>
<p>というわけで読まれるブログはどれくらい記事を書いているのかと思って調べた結果は、<strong>「一番読まれている1000のブログは500~600の記事数だけど、記事数は読まれるのにあまり重要な要素ではない」</strong>でした。冒頭の言い訳はもう使えませんね。</p>
<p><strong>追記</strong><br />
集計するのに使用したプログラムを<a href="http://github.com/taichino/snippet/tree/master/python/blog_entrynum_check/">githubに上げた</a>のでよろしければどうぞ。<br />
mysqlとq4mをインストールしてる状態で以下のような感じで使います。</p>

<div class="wp_syntax"><div class="code"><pre class="bash" style="font-family:monospace;">$ mysqladmin <span style="color: #660033;">-u</span> root create hoge
$ mysql <span style="color: #660033;">-u</span> root hoge ＜ inittbl.sql
$ python crawler.py <span style="color: #000000; font-weight: bold;">&amp;</span>     <span style="color: #666666; font-style: italic;"># URLから記事件数を取得するクローラ</span>
$ python aggregator.py  <span style="color: #666666; font-style: italic;"># TopHatenarから対象のURL群を取得する</span>
<span style="color: #666666; font-style: italic;"># 上記プロセスが終了後</span>
$ python tally.py bookmarks            <span style="color: #666666; font-style: italic;"># bookmark集計</span>
$ python tally.py subscribers            <span style="color: #666666; font-style: italic;"># subscriber集計</span></pre></div></div>

]]></content:encoded>
			<wfw:commentRss>http://taichino.com/memo/1314/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

