み(仮)

the best is the enemy of the good

IRDB の OpenSearch を使って機関リポジトリの更新情報をフィードで取得する

2021/01/19 13:54 注記
一部文章をあらため, 読みやすくなるように強調を加えた。今後大きな変更を加えるつもりはない。

はじめに

学術機関リポジトリデータベース(IRDB)というネット上のサービスがある。要は各大学の紀要論文や博士論文などが置かれてある機関リポジトリを横断検索できるようにしたもので, かつては JAIRO などでそういった検索ができたらしい。最近 Twitter で文献を紹介するアカウントから知って, いつか自分の好きな研究ができる時が来たら利用しようと思って使っている。
学術機関リポジトリ構築連携支援事業によれば

日本国内の学術機関リポジトリに登録されたコンテンツのメタデータを収集し、提供するデータベース・サービスです。

ということになる。サイトはここで, 使い方はマニュアルなどに詳しい。

但, このサービスは検索に癖があり, RSS フィードで検索結果の情報収集をしようと思ったら OpenSearch を使うしかないのだが, その OpenSearch を試験運用ドメインで使っているのか, サーバ証明書が無効になっていて検索ができなかった(2021/01/15 検索)。これではまともに検索ができないから「試験運用中の URL がそのまま OpenSearch のレスポンスに使われていて, サーバ証明書エラーをはいている。このままではまともにフィードを利用できないからどうにかしてくれ」とサポートに問い合わせたところ, こちらの伝え方が悪かったのか「試験運用の URL から新しい URL に変わったのでそこから検索しろ, マニュアルはここをみろ」などと返ってきた。
仕方なくマニュアルを見直して, 検索クエリの例通りにやるとまともに動いた。「バグはバグなのでどうにかしろ」と更に詳しく状況を付け加えて返信したが, そのあとのメールは一方的に遮断して解決済みと返信したので見ていない。どちらにせよ, これでは OpenSearch の利点が活用できていない。今回はフィード登録が目的であるから OpenSearch による検索は試さないが, クエリを URL としてそのまま使うことでしかフィード登録ができないことも不便な点の一つである。

使い方

詳細検索で検索する方法が一般的だが, 今回は RSS のフィードを利用するのでOpenSearchのマニュアルを利用する。OpenSearch は簡単に言うと, 対応しているサイトのアドレスバーに URL を打ち込み, Tab キーやスペースキーを押すことでサイト内検索ができるという, ブラウザの機能である。これを使うことで IRDB に保存されている学術機関リポジトリの情報が検索できるようになる。マニュアルページにはクエリ例が載っており, https://irdb.nii.ac.jp/opensearch/search?q=%E5%A4%A7%E5%AD%A6%E5%9B%B3%E6%9B%B8%E9%A4%A8&count=20 のようなアドレスをそのままアドレスバーに打ち込むことで xml ファイルが生成され, それをフィードリーダーに登録することで最新情報の巡回ができるようになる。この例では~/search?以下のq=%E5%A4%A7%E5%AD%A6%E5%9B%B3%E6%9B%B8%E9%A4%A8&count=20が検索クエリとなるが, q=%E5%A4%A7%E5%AD%A6%E5%9B%B3%E6%9B%B8%E9%A4%A8大学図書館を意味し, count=20は検索結果を20件まで表示することを意味する。両者を&で結ぶことでパラメータの異なる AND 検索が可能になる。その他にもクエリを構成するパラメータ(count や q)があるのだが, 論文の詳細情報はたとえば同じ博士論文でも表示するパラメータの種類が異なっており, どれをクエリに仕込むかは状況によって異なる。パラメータの例は先述のマニュアルに記載があり, そちらを参考にしてクエリを記述していくしかない。

検索例

実際に私がフィード登録まで行った例を示す。神道研究で有名な國學院大學の機関リポジトリを例にとり, 機関リポジトリに登録されている紀要や博士論文の最新情報を取得する。登録までの流れは, 当該機関リポジトリを検索 -> 取得するコンテンツの選定 -> IRDB での検索(検索語の決定) -> クエリの記述 -> クエリと詳細検索による検索結果との照合 -> フィード登録 となることが(当面は)多い。まだまだ試行錯誤の段階であり, 私自身どうするべきか, 方法が確立できていない。とりあえず, 以下を試金石として情報を載せておく。

1 リポジトリを検索する

ある大学院の博士論文を読みたい, ある学科の紀要を読みたい, というときに機関リポジトリで情報がまとめられていることは, 大変価値のある情報リソースとなる。全国の大学でどれぐらいの機関リポジトリがあるのかわからないが, 主要な大学には機関リポジトリがあり, それを利用することで公開された大学内の研究を調べることができる。
一つの大学内の研究結果を閲覧するだけでいいというのであれば, わざわざ IRDB を利用する必要はなく, 定期的に機関リポジトリの更新を(サイト訪問で)チェックすればよい。しかし, なにか研究というのは(研究のみならず, 趣味で特定分野の文献を読む場合であってもそうだが)一つの大学で終始するものではなく, 他大学・他機関の研究を参照することは必要不可欠となる。また, 一つの大学と言っても, 内部の研究機関は多くあり, 複数の学科・機関によって公開されているものや, 同一学科・機関内で複数の文献を発行していることも少なくない。こうした中で, 最新の情報を前回の閲覧と比べて確認することには, 多くの時間と困難が伴う。これが複数の機関リポジトリにまたがる場合であれば, その情報リソースはさらに多くなり, もはや確認するだけで力尽きてしまい, 読むのが大変になってやめてしまうといった本末転倒なことになりかねない。
今更言わずもがなではあるが, 情報の差分をツールで確認する仕組み, すなわちフィード登録による利用は機関リポジトリを数多く利用するものにとって必須の要件となるだろう。

IRDB はそうした困難を横断検索によって解決し, 更にはフィード(XML ファイル)を出力することによって情報検索の効率化に寄与する。本記事は OpenSearch を利用することで, 一つの機関に所属する論文などをフィードリーダーで確認しようとする試みであるが, 機関リポジトリによってはそうした苦労をかけないでもフィードを用意してくれているところがある。

神奈川大学の機関リポジトリはそうした例のひとつである。このリポジトリでは, サイト中央にインデックスリストが表示され, 階層を下るごとに(リンクをクリックするごとに)各学科・機関のコンテンツが閲覧できるようになっている。こうしたリポジトリのような UI は多いが, 本リポジトリに特徴的なのはインデックスリスト右側にアイコンが表示されていることである。このアイコンにはリンクが貼られており, クリックすると Atom フォーマットによる XML ファイルが開く。これをそのままフィードとして登録することが可能であるが, たとえばある冊子の更新情報を知りたいといった場合には, メインページよりさらに階層を下っていくことになる。

ここで日本常民文化研究所発行の冊子「歴史と民俗」の更新情報を, フィードで確認したいといった場合を考える。方法はいくつかあるが, まずはページ中央にあるインデックスリストからたどっていく方法をとる。発行は日本常民文化研究所なのだから, その名のついたリンクを辿ればいいことは容易に想像がつく。問題は日本常民文化研究所がつく階層がメインページには3つ存在するために, どれが正解のリンクなのかが一見してわからない。たんに日本常民文化研究所と名のついたリンクをクリックすると, さらに「03 紀要論文」と「06 図書」のリンクがあり, 紀要論文の方をクリックすると「年報(日本常民文化研究所)」と「歴史と民俗」のリンクがあらわれる。ここで「歴史と民俗」の方をクリックすると, 各号のリンクを見ることができるのだが, 冊子の更新情報を知りたいのだから「歴史と民俗」の右にある XML ファイルを登録すればいいことになる。実に簡単だ。

しかしインデックスリストをたどるのは若干手間なので, サイト左側にあるインデックスツリーを参照したほうが簡単である+-をクリックするとリポジトリ木構造を見ることができる。ここでインデックスツリーから, 見たい情報のひとつ上のページ(「歴史と民俗」であれば「03 紀要論文」)をクリックすると, 問題のページにたどり着くことができる。

國學院大學の機関リポジトリにはこうしたフィード出力サービスが存在せず, フィードの登録に IRDB を使うことになる。クローリングの知識がある場合やプログラミングの腕があるなら自分でフィードをつくるといったことも可能かもしれないが, 一般利用者には難しいだろう。國學院大學リポジトリK-RAINを見るとインデックスツリーのような木構造を可視化するものは存在せず, 発行機関とタイトルのみを記したシンプルなインデックスだけである。発行機関の上部にプルダウンメニューがあり, そこから「学術雑誌・紀要」か「博士論文」を選ぶことができる。

前置きが長くなってしまったが, 対象の機関リポジトリさえ決まったらあとは対象コンテンツの選定をしなければならない。最初から更新を確認したいコンテンツが決まっていれば特に選定は必要なく, すぐに IRDB で検索すればいいが, たとえば「神道関係の論文が読みたい」といった対象範囲が広い場合には, そのコンテンツを選択するべきかどうかの選定を行うことは重要である。以下では, コンテンツの選定について私がどういう選定をしているかについて述べることとする。

2 取得するコンテンツの選定

取得したいコンテンツがすでに決定している場合, この項は読み飛ばしてしまって構わない。<何を読むべきか> がまだ定まっていない場合におけるコンテンツの選定についてここでは述べていく。日頃, フィードリーダーをつかって情報を追っているものにとって, 無駄なフィードは出来る限り登録したくないと考える。面白そうだと思って登録したものが, 更新がなかったり, 大した情報を載せていなかったりするとそれを確認するだけでも結構な手間になる。また, 選定したコンテンツをもとに IRDB でフィードを作っていくことになるから, 本来登録しなくていいものまで登録する作業も手間と時間をかける結果となってしまう。こうした事態を避けるためには, あらかじめ機関リポジトリの方で内容を確認し, 本当に登録するべきコンテンツかどうかを見極めることが重要になってくる。

結論から述べると, 私が2021/01/18現在 K-RAIN で登録しているコンテンツは国史学」「國學院雑誌」「國學院大學大学院紀要(文学研究科)」「東アジア文化研究」の4つである。國學院大學には経済学部や法学部などの学科もあり, 総合大学の様相を呈しているが私は人文学に限っている。理由のまずひとつは他の学科のレベルが相対的に低いこと, そして國學院大學が主に神道研究で名を上げている大学だからである。もし経済学や法学の研究をチェックしたいということであれば, 他の大学を確認すれば良いと考える。

国史学は文学部が発行機関となっている。文学部には「國學院中國學會報」というコンテンツもあるが, そちらのページを確認すると第61輯と第63輯が公開されている。第61輯は2015年に発行され, 11件のコンテンツが公開されている。内容をみると規則が数件と, それにシナ関係の論文がいくつか所蔵されている。第63輯は2017年に発行され, 8件のコンテンツが公開されている。第61輯にあった規則の項目がなく, すべて報告か論文が所蔵されているようである。実際の中身のレベルは所収コンテンツを見てみないとわからないが, 見た感じは内容もまとまっているものが入っているらしい。しかし, 書誌詳細を見ると刊行頻度が年刊となっており, 2017年の発行を最後に2021年現在まで発行されていない(もしくは公開されていない)ことになる。フィードは更新をチェックし, 新しい情報を差分として表示するものであるから, 刊行が今後行われないような雑誌については極力排除していくほうがいいだろうと思われる。そうしないと管理するフィードが膨大なものになり, なぜ登録しているかがわからなくなったり, フィード全体の視認性も落ちる。不要なフィードは消去しておくほうが賢明だろう。

さて「国史学」であるが, こちらは第228号と第229号が公開されている。第228号が2018年発行で5件の登録, 第229号が2019年で4件の登録がある。刊行頻度は年3回とあるが, どうも印刷の頻度らしい。件数こそは少ないが, 内容を概観すると「熊野速玉大社の速玉大神坐像について」など秀逸なタイトルが目につく。2020年分の刊行がなく不安であるが, 第229号を見ると11月の日付があるから, まだ公開されていないだけかもしれない。こちらを候補に入れておく。

次に國學院雑誌」を概観する。一見して登録件数が97件と多いが, 2014年から2020年までのコンテンツが収められており, 刊行頻度は月刊とあるから年12冊の刊行と考えてこれに臨時増刊を含めるとだいたい辻褄があう。一冊あたりの更新レコードはその号によりまちまちであり, 第121巻第11号を見ると21件の登録があるが, 前の第11号では6件と少ない。フィードの性質上, 一度に取得するコンテンツの件数は決められているから, 最大数を確認しておくのには意味がある。21件が最大であると考えれば, 30件を一度に取得できるようにしておけば足りるだろうと考えるのである。こちらは最終号が2020/12となっているから, 今後刊行が途絶えることは当面はないと考えられるし, 内容に関しても秀逸なものが揃っているようである。こちらも候補に入れることとする。

大学院の方では國學院大學大学院紀要」が良さそうだからということで確認する。わざわざ「文学研究科」と補記してあるからには他の学科についても紀要があるのだろうが, そちらは特に公開されていない。2016年刊行の第47輯から2020年の第51輯まで公開されており, 年刊となっている。各輯(なぜか号ではなくこちらを使う)を確認すると登録件数は19件が最大で, 20件を超えるものは見当たらない。内容も特に問題がないので候補に入れる。

同じ大学院の刊行で「東アジア文化研究」がある。2016年創刊のもので, 2020年まで年刊ペースで刊行されている。これを選んだのは「南九州の神楽における「岩戸開き」演目について」と題するコンテンツが含まれているからであるが, その他のコンテンツも秀逸なものが揃っているようである。各号のレコードは20件を超えていない。一見関係なさそうなタイトルのものでも, 自分が読みたいコンテンツが収録されているものもある。こうしたものも確認する作業は大事である。こちらも候補に入れる。

候補から外したものも例をあげておく。「史学研究集録」は良さそうなタイトルであるが, 2018年刊行のものしか登録されておらず, しかも年刊である。今後更新の見込みがないので外した。研究開発推進機構からはいくつかタイトルが公開されているが, こちらも更新が見込めなかったり, 内容が不十分であるために除外した。また, K-RAIN のメインページからは博士論文を確認することもできる(プルダウンメニュー)が, タイトルから内容が真新しいものではないと判断し, 除外した(博士論文なのに...?)。
以上をまとめるとコンテンツの選定は次の手順で行える。

* 機関リポジトリからコンテンツが収められているタイトルを確認し, 内容を確認  
* 刊行頻度, 最終更新年の確認  
* 各コンテンツ内容の精査  

除外したタイトルの例からも分かる通り, 実際にフィードを確認していくとそのうち更新が途絶したり, 所収コンテンツの質が落ちるのを見ることもあるだろう。その場合は適宜フィード登録から外していけばいいのである。

3 IRDB での検索(検索語の決定)

この項目では実際に IRDB を使って検索する方法を見ていく。最終的にはクエリを使ってフィードを作成すればいいのだが, いきなりクエリを記述していくと作成された XML ファイルから必要なコンテンツが得られないことがある。まずは IRDB から検索して, ほしいタイトルやコンテンツの情報(フィールド)を確認する作業が必要となる。以下では, 前項で取り上げた4タイトル「国史学」「國學院雑誌」「國學院大學大学院紀要(文学研究科)」「東アジア文化研究」を例に検索を進めていく。

IRDB での検索には大きく分けて簡易検索と詳細検索の二通りの検索方法がある。簡易検索は入力フィールドが一つのもので, 検索語の種類を問わず好きに入力できるが, 検索精度は低い。試しに「国史学」を検索すると, 弘前大学など20大学の機関リポジトリからデータを拾ってきていることがわかる。簡易検索では AND 検索に対応しておらず, この検索方法では國學院大學の「国史学」のみを選ぶことができない。一方, 詳細検索では14の入力フィールドから検索が可能であり, 簡易検索以上に柔軟で詳細な検索を行うことが可能となる。簡易検索にはこのような不便さがあるために, 以下では詳細検索を用いて検索を進めていくこととする。

詳細検索には14の入力フィールドが存在する。「タイトル」, 「著者名」, 「著者ID」, 「著者所属」, 「刊行物名」, 「各種ID」, 「出版者」, 「学位授与機関」, 「学位授与番号」, 「助成機関名」, 「要約」, 「資源識別のタイプ」, 「出版タイプ」, 「機関」の14であるが, このフィールドがそれぞれ何を意味するかの説明は書かれていない。検索する側はフィールド名から推測してそこへ入力し, でてきた検索結果と照合して入力を変えていく必要がある。おそらくフィールドの詳細を書かないのは, 各種刊行物によって記載されているフィールド情報がバラバラであり, 整合性がとれないためだろう。大学と IRDB でどういう取り決めがされているのかはわからないが, フィールドは大学側がある程度恣意的に決定しているものと思われる。

冊子「国史学」を検索したい。「国史学」は刊行物にあたるから「刊行物名」のフィールドに入力すると良さそうだ。これを検索すると検索結果は10件であり, 機関のところに國學院大學のものと東京工業大学のものとが表示される。東京工業大学のものを見てみると「書評と紹介/深井雅海著『日本近世の歴史3 綱吉と吉宗』」とあり, 詳細から「収録誌情報」を見ると「『国史学』 第214号」とあるからこれが該当したものと思われる。そこでこの結果から國學院大學の「国史学」のものを絞りたい。検索結果の中から適当にタイトルを選んでやり, 詳細情報を確認しよう。すると, 「出版者」が「国史学会」となっており, 「収録誌情報」に「国史学とあることが確認できる。改めて詳細検索にフィールドを入れ直す。すなわち, 出版者に国史学会を, 刊行物名に国史学を入力し, 再度詳細検索を行う。この結果がリポジトリの公開範囲と符合していれば詳細検索がうまくいったことを表す。

詳しくは次項で述べるが, クエリ検索にはパラメータとして「機関名」が指定できない。詳細検索で「機関名」は指定できるが, これをクエリとしてそのまま埋め込むパラメータが存在しない(詳しくは IRDB マニュアル https://support.irdb.nii.ac.jp/ja/about/manual/opensearch を参照)。各コンテンツの詳細情報のページにも機関名がなく, わずかに右側にどこの機関に属するものかが書かれてある程度で, これをクエリとして指定することができないことがここからもわかる。したがって, 後の事を考えて別のフィールドから検索結果を再現できるかを試さなければならない。ここで詳細情報から不本意ながら出版者と収録誌情報を選び, 再検索をかけてみると一致することがわかった。もし今後, 別の機関の国史学会が国史学というタイトルで冊子を刊行することがあれば, 國學院大學の「国史学」に加えてその冊子所収のコンテンツが表示されることになるが, 現状では再現性を保てているのでこれで良しとしたい。

次に残された冊子を見ていくが, すべての冊子の出版者が必ずしも自明であるわけではない。いきなりコンテンツタイトルを「タイトル」に入力したほうが, 検索フィールドをその都度変えないでいいかもしれない。この辺りは好みの違いになるかもしれないが, フィールドを都度都度変えるのが面倒なので, 「國學院雑誌」最新号から適当にタイトルを選んで検索することとする。その結果がこちらである。「国史学」と異なり, 出版者が「國學院大學」になっていることがわかる。同様にして「國學院大學大学院紀要」を見てみると, こちらは出版者が「國學院大學大学院」で正式タイトルが「國學院大學大学院紀要 : 文学研究科」となっている。また「東アジア文化研究」では出版者が「國學院大學大学院文学研究科」となっている。こうしたパラメータの違いは検索してみないとどのように登録されているのかわからないもので, 手間ではあるが検索精度を高めるためにはこうした手順が必要になってくる。

K-RAIN では博士論文を取り上げなかったが, ふつう博士論文は刊行冊子に収められていないことが少なくなく, その場合journal`publisherが不明であるなどして一意に検索語を決定できないケースが存在する。その場合であっても, 詳細検索で博士論文のタイトルを入力して検索すれば詳細情報の確認ができるが, IRDB 詳細検索と検索クエリが一致しないために検索クエリの記述が思うようにいかないことがある。その辺りの悪戦苦闘の様子は次回の記事で紹介したい。IRDB の詳細検索とクエリのパラメータの不一致があるためにこうした事態に遭遇するのだが, 改善してほしいものである。

以上の手順をまとめると,

* 詳細検索を用いてタイトルなどから絞り込みをかける  
* コンテンツの詳細からパラメータを抜き出し, パラメータを用いて再度詳細検索をかける(このときクエリのパラメータと一致するものを選ぶ)  
* 検索結果を確認し, 実際のリポジトリの公開範囲と一致していることを確認する  

詳細検索に選ぶクエリのパラメータとは何か, どういったものを選べば詳細検索ができるだろうか。次の項目ではクエリの記述について見ていくこととしたい。

4 クエリの記述

詳細検索によって得られた検索結果をフィードとして出力するためには, クエリの記述を行う必要がある。クエリの記述の仕方は先述のマニュアルに記載がある。前項で述べた通り, 詳細検索のフィールドとクエリを構成する要素であるパラメータが完全一致しないため, 詳細検索をできるだけクエリに寄せた形で行うと良い。

国史学」を再度例に取ると, 「国史学」は詳細検索の「出版者」に「国史学会」, 「刊行物名」に「国史学」を入力することで行えるのであった。出版者はそのままパラメータにpublisherとあるからそれを使ってpublisher=国史学会と表せる。刊行物名はクエリのパラメータに完全一致するものが見当たらないように思われるが, journalが当てはまるようである。したがってjournal=国史学で良いだろう。クエリの記述例にある通り, これらを&で繋ぎ合わせることでクエリを記述できるから, 全体のクエリは https://irdb.nii.ac.jp/opensearch/search?journal=%E5%9B%BD%E5%8F%B2%E5%AD%A6&publisher=%E5%9B%BD%E5%8F%B2%E5%AD%A6%E4%BC%9A&count=20となる。count=20は標準で付与されるのでそのままで良ければ書き加える必要はない。残りの三つに関しても3. で述べた通りにpublisherjournalを指定すればクエリを記述できる。今回の例ではなかったが, その他のパラメータについても必要があれば記述すれば良い。

以下に詳細検索のフィールド, クエリのパラメータ, RSSAtom のレスポンスフォーマットの照合を示す。但, これらは私なりの見解を踏まえてまとめたものであり, 私にはわからないことも多い。もしかしたら間違いがあるかもしれないが, 賢明な読者からご教授いただければ幸いである。何度か検索するとわかることもあるだろうから, その経験を踏まえて今後表を更新する場合がある。

詳細検索 クエリ RSS Atom
タイトル title title title
著者名 author author author > name
著者ID authorid - -
著者所属 q - -
刊行物名 journal - prism:publicationName
各種ID issn - -
出版者 publisher publisher publisher
学位授与機関 dissertationaffiliation - -
学位授与番号 dissertationid - -
助成機関名 q - -
要約 - description content
資源識別のタイプ - category -
出版タイプ - - -
機関 - irname irname

RSSAtomXML ファイルの記述フォーマットの違いであり, format=をクエリに付与することで各々のレスポンスを得ることができる。「-」がつけられているのは記載がなく表示結果から明らかでないものを示す。Atom の行にauthor > nameとあるのは階層が分かれており, authorが上の階層にあり, nameがその直下にあることを示している。一見して詳細検索とクエリで要約以下の対応関係が明らかでないことがわかる。qは検索のためのワイルドカードのような役割があり, ほとんどの詳細検索のフィールドがこれに対応しているが, 対応関係が不明なものも存在する。致命的なのは「機関」と対応するクエリのパラメータが存在しないことである。レスポンスフォーマットには機関に対応するirnameが存在するが, 何故かクエリ側には存在しない。このため, 機関名を直接パラメータに載せてフィードを出力することが困難になっている。

RSSAtom の違いは色々あるが, ここでは最低限表から読み取れるところのみに言及しておきたい。というのも, 私自身がまだよくわかっていないからである。大きな違いといえば RSS には詳細検索の「資源識別のタイプ」に該当するcontentがあり, Atom にはこれに対応するものが存在しないこと。逆に Atom には詳細検索の「刊行物名」に該当するprism:publicationNameがあるが, これに対応するものが RSS には存在しない。これらは RSS ではitemの階層以下に, Atom ではentryの階層以下に表示されるアイテムであるが, 直接にはクエリの検索結果に影響しないと思われる(現在調査中)。

クエリの構築は3までで事前準備をしさえすれば, 簡単に行うことができるだろう。

5 クエリと詳細検索による検索結果との照合

作成したクエリは詳細検索による結果と符合しているのだろうか。クエリによる表示結果と IRDB の詳細検索による検索結果との照合が必要である。両者が同じであればクエリの記述は成功したことになるし, 検索結果が大幅に異なっていればクエリの記述を見直さなければならない。
前項で作成した「国史学」のクエリは URL: https://irdb.nii.ac.jp/opensearch/search?journal=%E5%9B%BD%E5%8F%B2%E5%AD%A6&publisher=%E5%9B%BD%E5%8F%B2%E5%AD%A6%E4%BC%9A&count=20 であり, 結果を以下に示す。

<rss xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/" version="2.0" xml:lang="ja">
<channel>
<title>IRDB OpenSearch | 国史学 国史学会</title>
<link>https://irdb.nii.ac.jp/opensearch/search?journal=%E5%9B%BD%E5%8F%B2%E5%AD%A6&publisher=%E5%9B%BD%E5%8F%B2%E5%AD%A6%E4%BC%9A&count=20</link>
<description>「IRDBは国立情報学研究所が提供する日本の学術機関リポジトリポータルです。日本の学術機関リポジトリに蓄積された学術雑誌論文,学位論文,紀要論文,研究報告書等を検索することができます。」</description>
<language>ja</language>
<copyright>Copyright(C) National Institute of Informatics</copyright>
<pubDate>Tue, 19 Jan 2021 02:56:31 +0900</pubDate>
<opensearch:totalResults>9</opensearch:totalResults>
<opensearch:startIndex>1</opensearch:startIndex>
<opensearch:itemsPerPage>20</opensearch:itemsPerPage>
<item>
<title>越後国色部氏一族の在地支配と年中行事</title>
<link>https://irdb.nii.ac.jp/01250/0004369659</link>
<author>新保, 稔</author>
<category>Journal Article</category>
<URI>https://opac.kokugakuin.ac.jp/webopac/TC01679705</URI>
<pubDate>2019-11</pubDate>
<irname>國學院大學</irname>
</item>
<item>
<title>関東地方における縄文時代早期前葉の剥片剥離技術 : 城山技法の提唱とその意義</title>
<link>https://irdb.nii.ac.jp/01250/0004369658</link>
<author>大工原, 豊</author>
<category>Journal Article</category>
<URI>https://opac.kokugakuin.ac.jp/webopac/TC01679704</URI>
<pubDate>2019-11</pubDate>
<irname>國學院大學</irname>
</item>
<item>
<title>縄文時代早期の人骨出土例における埋葬属性</title>
<link>https://irdb.nii.ac.jp/01250/0004369657</link>
<author>山田, 康弘</author>
<category>Journal Article</category>
<URI>https://opac.kokugakuin.ac.jp/webopac/TC01679703</URI>
<pubDate>2019-11</pubDate>
<irname>國學院大學</irname>
</item>
<item>
<title>縄文時代早期の洞窟・岩陰葬</title>
<link>https://irdb.nii.ac.jp/01250/0004369660</link>
<author>谷口, 康浩</author>
<category>Journal Article</category>
<URI>https://opac.kokugakuin.ac.jp/webopac/TC01679702</URI>
<pubDate>2019-11</pubDate>
<irname>國學院大學</irname>
</item>
<item>
<title>中国最古の博物館に関する一考察</title>
<link>https://irdb.nii.ac.jp/01250/0004342894</link>
<author>張, 哲</author>
<category>Journal Article</category>
<URI>https://opac.kokugakuin.ac.jp/webopac/TC01676167</URI>
<pubDate>2019-05</pubDate>
<irname>國學院大學</irname>
</item>
<item>
<title>即位山陵使の成立と展開</title>
<link>https://irdb.nii.ac.jp/01250/0004342897</link>
<author>佐藤, 亮介</author>
<category>Journal Article</category>
<URI>https://opac.kokugakuin.ac.jp/webopac/TC01676162</URI>
<pubDate>2019-05</pubDate>
<irname>國學院大學</irname>
</item>
<item>
<title>民俗資料展示における「解説」とその意義</title>
<link>https://irdb.nii.ac.jp/01250/0004342895</link>
<author>三代, 綾</author>
<category>Journal Article</category>
<URI>https://opac.kokugakuin.ac.jp/webopac/TC01676166</URI>
<pubDate>2019-05</pubDate>
<irname>國學院大學</irname>
</item>
<item>
<title>熊野速玉大社の速玉大神坐像について</title>
<link>https://irdb.nii.ac.jp/01250/0004342893</link>
<author>鈴木, 景二</author>
<category>Journal Article</category>
<URI>https://opac.kokugakuin.ac.jp/webopac/TC01676168</URI>
<pubDate>2019-05</pubDate>
<irname>國學院大學</irname>
</item>
<item>
<title>日露戦前における政治的協調の論理 : 対外危機と国内融和</title>
<link>https://irdb.nii.ac.jp/01250/0004342896</link>
<author>伊藤, 陽平</author>
<category>Journal Article</category>
<URI>https://opac.kokugakuin.ac.jp/webopac/TC01676165</URI>
<pubDate>2019-05</pubDate>
<irname>國學院大學</irname>
</item>
</channel>
</rss>

詳細検索の結果は以下の URL を参照されたい(http://irdb.nii.ac.jp/search?kywd=&op=%E6%A4%9C%E7%B4%A2&fulltextflg=All&title=&creator=&creatorid=&creatoraf=&journal=%E5%9B%BD%E5%8F%B2%E5%AD%A6&id=&publisher=%E5%9B%BD%E5%8F%B2%E5%AD%A6%E4%BC%9A&diaf=&dino=&fundaf=&description=&typeid=&versiontypeid=&kikanid=&items_per_page=20&sort=ss_record%2Bdesc)。両者が一致していることが確認できた。残りの三つについては詳しくみないが, 概ねにおいて一致していることが確認できている。

6 フィード登録

こうして得られたフィードをあとはフィードリーダーに登録するだけである。登録の仕方はリーダーによって異なるが, だいたいはフィードを登録するための機能がリーダーには用意されており, それに作成したフィードのアドレスバーからリンクをコピーして, 貼り付けるだけで登録出来ることが多い。指定がなければ一度の巡回に20件まで取得し, 更新の度に新着情報が差分として表示される仕組みになっている。取得した情報をリーダーを通して確認したい場合, クエリの作成手順でformatRSSAtom に指定すればある程度は更新情報を変更して確認することができる。更新があったことだけを確認したいという場合には変更する必要は特にないだろう。デフォルトでは RSS で出力されるようになっており, 紹介した例でも RSS で表示されるようにしてある。

終わりに

実は國學院大學の機関リポジトリで得られた冊子情報の登録はかなりうまくいった例であり, 先述したように博士論文の場合であれば刊行物情報が付与されていないことのほうが多く, 詳細検索はより困難を極める。IRDB から得られる詳細情報は RSSAtom などの表示に似ていると思われるが, 残念ながらこの情報からクエリを作成する技術を私は完全には持ち得ていない。この記事を書いている今は広島大学の博士論文の情報取得を模索している最中であるが, この一件ではクエリの表示結果と広島大学の機関リポジトリの公開情報とが一致せず, コンテンツごとのフォーマット情報にあまり統一性がないことが確認できている。

5でも述べたように, 経験上は詳細検索とクエリでの表示が一致しないことが頻繁にあり, 私の技術不足によるところが大きいと痛感している。そうかといって IRDB の使い勝手がいいと過大評価するまでに至っていない。正直なところ IRDB は非常に良くできたリポジトリ横断検索と言い難いように思われる。しかしながら, 主要大学機関がそれぞれ機関リポジトリを擁している現状にあって, こうした機関リポジトリの横断検索を用意してくれたことについては感謝の言葉にたえない。今後, IRDB の欠点を克服し, さらなる発展的な進化を願うばかりである。最後になったが, 國學院大學の機関リポジトリ K-RAIN や IRDB の情報は特に許可を得ず勝手に公開している。ネット上のサービスで公開されている情報にあって, ログインせずに得られる情報を再度公開することについては特に問題はないと考えているし, IRDB や K-RAIN を確認しても著作権の所在を特別注意喚起を促すものはみられない。もし問題があればご教示いただけると幸いである。