2016年4月8日金曜日

超高速横断検索API「カーリル Unitrad API」が既存の“使えない”図書館横断検索システムを駆逐する


図書館蔵書検索サイト「カーリル」の運営元である株式会社カーリルは、図書館業務向けの超高速横断検索API「カーリル Unitrad API」の運用を開始しました。実はつい先日、「多摩バーチャル・デポジット・ライブラリー(通称多摩デポ)」に関する中間報告会でこのリリースについて話を伺っていたので、少し詳しく書き記しておきます。なお、新APIの第1号導入は、京都府立図書館です。



多摩デポ中間報告会の記事はこちら。



多摩デポは、NPO法人共同保存図書館・多摩とカーリルが共同で研究開発を進めてきた仕組みです。図書館資料の除籍・廃棄は年々増加しているのに、廃棄しようとしている資料がその地域の他の図書館に残っているかどうかを「素早く」「簡単に」チェックできる仕組みがない、という問題意識からこの開発はスタートしています。

多摩デポの報告会では、バーコードリーダーを使ってISBNのバーコードを連続でピッピッピッと読み取っていくだけで、多摩地区30館と都立図書館の所蔵情報を「素早く」「簡単に」チェックできるデモを見せてもらいました。マジ速い。超速い。

現在、多摩地区の図書館で使われているのは「東京都立図書館統合検索」。サイトのURLを見るに、開発・運用は富士通みたいですね。検索キーワード入力が手作業なのと、システムが重い(これは図書館員の方々が口々にそう言ってました)ため、検索に時間がかかってしまうそうです。

報告会では「1冊あたり約30秒」と表現されていました。もし500冊チェックしようと思ったら、約4時間かかってしまう、と。要するに「カーリル Unitrad API」は、この横断検索を超高速にした、ということなのです。


多摩デポの研究開発で見つかった検索精度の問題


INTERNET Watchへの寄稿では省いたのですが、実は多摩デポではカーリルの検索システムの精度調査も行っています。「東京都立図書館統合検索」の検索結果との差異を、実際に除籍する資料のデータ551件を手作業チェック。しかも同じ調査を2名で同時に進め、ダブルチェックをするという念の入れ方です。

結果、418件(78%)は同一結果、都立の方が多いケースが51件、カーリルの方が多いケースが76件、件数が同じだけど館が違うケースが2件。ほか、書誌データダブりが1件と、ISBNのない外国語資料が2件あったそうです。

なぜ検索結果にバラツキがあるのか? 横断検索の仕組みは、下の図のように(画像が汚くてすいません)、入力されたデータをその都度各図書館システムに問い合わせ、結果を返すというもの。基本的な仕組みは、都立もカーリルも同じです。


ところが例えば、

  • 図書館A:ISBN10桁/13桁どちらでも検索できる
  • 図書館B:ISBN10桁/13桁どちらか片方でしか検索できない
  • 図書館C:ISBNの978を除いた10桁で検索しなければいけない

など、各図書館システムのデータの持ち方や検索方法に違いがあるそうです。都立とカーリルの検索結果の違いは、その処理方法の違いに依るものだということでした。となると当然、都立とカーリルの、どっちが精度が高いの? という疑問が出てきますね。

NPO法人共同保存図書館・多摩の方が「改めて考えてみると、都立の検索精度を調べたことはなかった」という話をしたら、図書館員の方々が口々に「都立で検索して『ある』と出たから借りようと思ったのに、行ってみたらなかったことが何度もある!」と。うーむ。

カーリルでは、例えば上記の図書館Bの場合、10桁/13桁の両方を検索(つまり2回チェック)するなど、各図書館システムに合わせた処理を行っているそうです。カーリル吉本さんは「都立も同じような処理を行っていると信じたいのですが」と言葉を濁していましたが、自社の仕組みには自信がありそうでした。さすが。

そしてこの多摩デポの研究開発を活かしたのが「カーリル Unitrad API」なのです。「伝統的な横断検索をカーリルがやってみるとどうなるか?」をやってみたら、できちゃった、とのこと。各図書館のシステムは充分速くなっており、一斉に問い合わせをしても充分実用に耐えられる、と。

  • 横断検索でもOPACより高速
  • 気持ち良い並び順
  • ISBNによる同定
  • 詳細検索対応
  • 検索ムラの抑制
  • メンテナンスフリー
  • 図書館システムはなにもしなくていい
  • 将来的にはISBNのない書誌にも対応?

という特徴があるそうです。

カーリルは数年以内に使えない横断検索システムを駆逐したいと考えています。すでに全国規模のサービスに耐えるサーバーやネットワークインフラは構築済みで、継続的に技術開発にリソースを投入します。
プレスリリースより

超本気だ!

動画の後半、関西弁バージョンが良い。「ものごっつう速い」んやで。


本気マジだ!

週間人気投稿

月間人気投稿