読者です 読者をやめる 読者になる 読者になる

20160206 大向一輝先生「All about CiNii」

概要

筑波大学 知識情報・図書館学類の集中講義「知識情報学特別講義I」にて、国立情報学研究所の大向一輝先生(@i2k)からCiNiiのこれまでについて講演を拝聴する機会がありました。そのときのメモを公開します。こんなにじっくりと時間をかけてCiNiiについて話したことはないし、自分のなかでもまとめ直しを行う機会になった、と仰っていました。

※Internet Archive Wayback Machineを併せて参照するとイメージが抱きやすいかもしれません。

講演内容

自己紹介

CiNiiの「なかのひと」になるまで

  • 2005年に就職して初めてCiNiiをうちがやってたんだ!ということを知った。言われてみれば確かにNIIという単語がサービス名に含まれている。
    • 「僕から見たら結構ひどいサービスで、確かに論文を探すために使わざるを得ないサービスではあるけど、使っていて楽しくない。こんなの誰が使うんだ?」
  • 僕がNIIにいて、ウェブ系であるということは、他所の人から「あれってどうなんですか?」と言われることを意味する。ちょっと許せない。
    • やってる部署に文句を言っていたら「そこまで文句を言うならやってみろ」と言われ、開発に関わるようになった。
    • 少なくとも学生の頃にはこういうことをやることになろうとは微塵も想像してなかった。それが結局2005年ころからやっていて10年が経った。
  • オープンデータ、データ公開には守りと攻めの両方がある。あと1、2年すると、オープンデータ、オープンサイエンスと大学図書館はどう付き合うのかみたいなことが大きな課題になってくるだろう。

CiNiiの運用体制について

  • Q. 何人くらいでこの仕事をやっているの?
  • A. 15人くらい。1サービスあたり1.5人で面倒を見るということになってる計算。当然、自分たちでプログラミングまではできないので外注する。ただし、企画(どんなものが必要か検討)とか、障害対応などは行なっている。

これまでのCiNiiの歩みを振り返る

2005年「サービス公開」

サービス公開(実際には、2004年には試験公開していた?)

2006年「パーマリンクとオープン化」

これまでは書誌情報の公開に制限があった。書誌情報くらいはいいだろう、本文ならともかく。それまでは検索結果一覧までしか見られず、書誌情報を見るためには契約が必要だった。
ここでGoogleがきた。Googleはそんな公開されていないページを検索結果に反映しないし、できないので。そのために必要な準備としてパーマリンクの制定と、書誌情報のページに誰もがアクセスできるようにすることがあった。
書誌詳細画面を綺麗に、当時のHTMLは大向先生が自ら書いた。

2007年「黒船到来とアリ地獄作戦」

当時、いわゆる檄文を書いた。いま見てみると、怒っているのはよくわかるんだけど。。
要点はパーマリンク、きちんとしたURLをつけること。そうすると検索エンジンから誘導が可能で多くのアクセスが期待できる。そのパーマリンクは有料ユーザのみに公開ではなく一般に公開しよう。そのときにHTMLをちゃんとしよう、本文への誘導をちゃんとしようとか、そういうことが書いてある。
Googleに喰われるかもしれない問題は、CiNiiがそのまま全く無視されるわけではなく、どんな入り方をされても最後に到達するのはCiNiiのパーマリンクなんだ。だから検索画面はスキップされるかもしれないけど、パーマリンクへの経路を増やすことをやらないといけないのであって、連携したほうがいい。

2008年 「暗黒時代」

平成19年4月、Googleに解放された。それまでは月間100万アクセスしかいかなかったが、伸び方が爆発的に増加した。その影響で、コンピュータが停まるようになった!(嬉しい悲鳴)

2009年 「"まともな"ウェブサービスへ」

サービスのまとも化。落ちないようにするとか

2010年:「サービスのうしろに人がいる」、「人と論文(著者検索)」

ウェブサービスは人間がやっているようにあまり思われていない気がする。たとえば、Googleとか食べログとか、人間がやっているように思われない。機械がやっているから機械が全部やっているような気がしてくるけど、本当は、人がいて、人の思いがある。それを利用者に実感してもらうことは大事。
Twitterアカウントを作成したにぃ。CiNiiの読み方が分からない→「サイニーです」と延々とリプライするのが初代なかのひとの仕事。



著者検索実装(同定識別が課題に)、Yahooと連携した「Yahoo!論文検索」、のちにYahoo!爆速化に伴ってリストラ。

2011年 「知識インフラとは何か」、「図書館の本丸へ」

震災に伴う停電によるサービス停止。当時の停電のスケジュールが書かれたホワイトボードは今でもとってある。

参照: #がんばれCiNii #がんばれNII #祝CiNii復活 - Togetterまとめ

2013年「レガシーからの脱却」、「仮想化」

NACSIS WebcatはCで実装されているらしい。コンパイル後のバイナリコードはあるけど、元のソースコードがどこにあるのかわからんとか、前担当者の独自機能が実装されていたりとかするので、メンテナンスが大変だった。
→もうCiNii Booksにしちゃおう。NACSIS◯◯がいいんですけど、とかいう意見もあった。「NACSISってなんですか?僕が就職したのはNIIなんですけど」(この件は2015年の第17回図書館総合展フォーラム「2020年のNACSIS-CAT/ILLを考える」でも話題にあがった。)

2014年「制度面でのオープン化」、「UI/UXと"いいもの使ってる感"」

目録所在情報サービスにCCライセンス付与(利用条件の明示, 目録所在情報サービス )
CiNiiデザイン変更(Articlesは緑、Booksは青、フラットデザイン)

2015年「CiNii Dissertations開始」、「スマホ対応」

博士論文検索Dissertationsの公開(スペルが難しいのでURIには使わず、/d/とした)
スマホ対応(レスポンシブデザイン、Dで試行し、その後、A、Bに導入)

CiNii Dは特殊な位置付け

  • インターネット上での原則公開化 データはこれから出てくる。
  • いまは探すことがそんなに一般的ではない(意味が無い、引っかかっても中身が見られないから)としても、今後は本文見られるようになる。
  • ニーズがあれば実装できますよというプロモーション的な側面もある。
  • オープンサイエンスの話もしたが、学術情報流通の世界においては新しいものが色々たくさん降ってくると考えられる→NIIとして対応できることを示す
  • もちろん検索できて便利という側面はある。完全にユーザのためだけ、ということではない。立ち位置の微妙な違い。
最近のご自身の研究について
  • 同姓同名の論文分類
    • 同姓同名はすごく難しい。
    • 日本人のなかで研究者の同姓同名が最も多いのは、「高橋徹」(KAKEN - 研究者検索結果)。
    • 「高橋徹」さんが20人くらいいる。あらゆる分野に「高橋徹」さん。