大掛かりなタイトルだが、インターネットの中核に現在なっている検索エンジンを見た際に今までの通常のホームページをインデックスしているロボット型検索エンジン(Google)と先日記事で紹介させて頂いたBlog用(RSS用)検索エンジンとの差を見ていきたい。
ウェブログの最新情報などを記事にされている DashBlog で、FeedBack についての記事を書いていただきました。ありがとうございます。
Google などの検索エンジンと、FeedBack や Bulkfeeds などの RSS 検索エンジンの比較記事なのですが、比較内容が非常に的確です。うん、素晴らしい分析内容。FeedBack を作った本人よりも分かってらっしゃる。Google なんかと比較されるとアリと巨人といった感じで恐縮なのですが。(笑)
過去ログを見てみると、色々興味深い記事がたくさん。その中で目に止まった記事で、こんな一文がありました。
私は、情報社会と言われるこのご時世、仕事ができる人間と仕事ができない人間の差は情報の収集力であったり持っている情報に依存する処が多いような気が私はする。
これは僕も非常に同感です。僕がこれまでに知り合った方々で、この人は「切れる」と思った方々に聞いてみると、ほぼ全員、非常に情報通。そして、それぞれ独自の情報収集/検索テクニックを考案され、実践しているのです。また、その情報収集手段に満足することなく、それを継続しながらもより効率的な方法を日々模索しているようです。
例えば Bulkfeeds の宮川さんは、Bulknews の作者としても有名(CPAN Author としても、IT企業の役員としても有名)ですが、様々な RSS 関連のツールを駆使して、Bulknews や各 blog サイトから取り込んだ RSS がら大量の情報を集めて、それをどんどん吸収されている。そんなサイトまで読んでるのか...と思うぐらいたくさんのサイトを巡回しているにも関わらず、雑誌の連載記事なんかも執筆していて、どこにそれだけの時間があるのだろうと、不思議に思うぐらいです。
Passion For The Future の橋本さん、ウェブログを見ていただければすぐにお分かりかと思いますが、情報技術についての探究心はとにかくすごい。情報技術にまつわるツールをたくさん使いこなし、必要があれば自身で開発する。そして、大量に書籍を読まれている。仕入れられる知識の量はアウトプットした量に比例するとよく言いますが、ウェブログを見ていれば、そのインプット/アウトプットの量が常人の域を超えているのがよく分かります。
たつをのChangeLogのたつをさん。1995年から自身の行動記録を付けてデジタル化されており、2000年以降は ChangeLog メモ をウェブで公開するためのツール、chalow を自身で開発され、集めた情報を整理して記録、公開し続けています。無人島に何か一つもっていくとしたら、迷わず ChangeLog なんだそうです。
オープンソースの検索エンジン namazu 開発者の高林さん。namazu はそもそも、自分で使いたいから開発したそうです。日本語文書からローマ字によるインクリメンタル検索を可能とするため Migemo を開発しました。高林さんもまた、ChangeLog メモで日々の記録を欠かさず付けているそうです。
職場の先輩でも、僕が「できるなあ」と尊敬している方々は、たとえば PDA などのガジェットをフル活用して、自分で集めた情報にいつでもすぐにアクセスできるようにしていたりと、必ず何か、情報収集/検索のためのテクニックを実践しているように思います。
そこで一つ思うのですが、こういった情報収集のテクニックというのは、情報技術に長けた僕らエンジニアが最も得意とする分野のはずだということ。にも関わらず、エンジニアを職業としている人がみんな「できる」人だと思うかというと、そんなことはなく。折角情報を料理する技術をたくさん持っているのだから、それをもっと活用するべきだと思うし、そうしれば必ず大きな進歩が待っていると思います。
エンジニアという仕事は、常に新しい情報を仕入れて、いかにそれらの情報を頭の中、あるいはツールを駆使してインデクシングしておくかができる/できないの分かれ目だと思います。引き出しを広くもっておいて、必要なときに必要な情報を引き出すことができるエンジニアというのは、ある特定の問題に対する解決作を、様々な角度から検証することができます。
FeedBack のシステムでは、CPAN モジュールをたくさん活用しています。Perl で何かしらの処理を行いたいという場合、そのソリューションのほとんどが、先人の知識として CPAN に集約されています。自力で書いていたら3日かかるコードが、CPAN モジュールでわずか 30 分で実装できてしまう、なんてことが多くあります。こうなってくると、いかに優れたアルゴリズムを考え出すかよりも、いかに多くの CPAN モジュールを知っているかということが重要だったりします。ソフトウェア開発の世界も、考える物作りから、引き出しの中身を組み合わせる物作りへとパラダイムシフトしています。
なんだか論点がずれてきてしまいましたが、こうして振り返ってみると、2003年にはたくさんの人に会い刺激を貰いましたが、その出会いを通じて、「情報は力なり」というのをまざまざと見せ付けられた一年だったように思います。
2004 年は、自分でも情報を力とすべく、色々試行錯誤していこうと思います。
明けましておめでとうございます。
論点がずれてくついでにもう一丁ずらした話になりますが。
「知は力なり」
イギリスの哲学者フランシス・ベーコンの言葉で、たいそう好きな言葉では有りますが、
今までの自分の経験から得た自戒みたいなもんに
「知ってりゃいいってもんじゃないだろ」
というのも有りまして(苦笑。
アルゴリズムにしたって、自分で書ききる力があってこそ先人の大いなる遺産も生きてくるわけで。
有りモノの寄せ集めだけでは自ずと限界も見えてくるんじゃないかなぁ、とも思うのであります。
この辺はアタマ(知識)だけじゃなくて身体(実践)とのバランスという齋藤孝さんの身体感覚の話にも通じるんでしょうけど
「プログラマならてめぇで書いてなんぼのモンだろ」と6年前に異業種に転職した元丁稚プログラマは思うのです。
でも、三日が三十分に短縮できるんなら、そっち使うわな。
速いし(笑。
とりとめのない文になりましたが、今年もよろしくお願いします。
[1] Posted by: すぎやま at January 3, 2004 03:24 PM [返信]すぎやまさん
> 「知ってりゃいいってもんじゃないだろ」
それはその通りですね。(笑) 知った知識をいかに活用しているかが大事ですね。
膨大な知識データベースをどう活用するか、それを実践するために、できる人は
様々な検索テクニックや情報技術を活用されているように思います。
> アルゴリズムにしたって、自分で書ききる力があってこそ先人の大いなる遺産も生きてくるわけで。
そうですね。Java の各種コンポーネントや Perl のCPAN モジュールなんかを
多用する場合に必ずつきまとう問題として、「それが原因で何かあったら?」
という点があります。幸いほとんどの場合でソースコードが
公開されていたりするわけですが、実際にそのソースコードを読み解く力が必要で、
その内部で何が行われているかを正確に把握しておく必要がありますね。
その力があって初めて、それらを有効活用できるように思います。
因果関係をしっかり把握できる人は強いですね。
> 「プログラマならてめぇで書いてなんぼのモンだろ」
これは確かにそうなのですが、この考えに固執しすぎてもいけないなあと
最近思います。完成した物を使う人間にとってはその内部がどう実装されているとか、
誰が実装したかというのはどうでもいい問題で、いかにそれが実現されているか、
どれだけ速くそれを提供できるかという点に目を向けていなければいけません。
なんちゃらアルゴリズムを自分の力で実装したよ、すごいでしょ、というのは
得てして作り手のエゴでしかないのかなと。
できる人間は、周囲の人間をうまくコントロールして自分の力を数倍に膨らませるというのを良く
聞きます。ソフトウェア開発でも同じように、世界中の技術者が取り組んでいる様々な技術を
いかにうまく組み合わせてハンドリングするか、すなわちプロデュース的な作業を
伴う時代になってきているのではないかなと思います。