み(仮)

the best is the enemy of the good

IRDB で博士論文の更新履歴を取得する

IRDB で特定の大学から博士論文の履歴をフィードでチェックできないかと考え, 広島大学文学研究科から博士論文の一覧を IRDB のクエリ検索で取得する方法を試していた。方法は前記事と同じで, 適当な論文のタイトルを選んでやり, それをタイトルで検索。詳細情報から検索に使えそうな情報を抜き取って, 博士論文の抽出を試みる。
広島大学機関リポジトリの該当する URL は https://ir.lib.hiroshima-u.ac.jp/ja/list/doctoral_thesis 。詳細情報から「広島大学(Hiroshima University)」と簡易検索キーワード(つまりq=のところ)に「博士(文学)」を指定し, クエリを作成してリンク先のものと同じリストになることを確かめた。しかし結論から言うと, 同じリストにはならなかった。
原因はなんだろうか。当初は詳細情報の「学位授与番号」の書き方が違っているからではないかとか, キーワードの表記ゆれによるものではないかと考えたりしたが, 検索結果はどれもこちらの想定するものではない。ちなみに, たんに「広島大学」と入力した場合は広島女学院大学のものも検索結果にあがるため, 詳細情報から直接抜き出して検索キーワードに指定してある。機関リポジトリ側のリストは 2021/01/22 現在, 以下の通りとなる。

ページによる表示の順番は更新順と ID 順とがあり, それぞれ降順と昇順とが選べるが, 「更新日(昇順)」の例を載せる。また, その後のクエリによる表示と合わせるために20件を抜き出してある。

タイトル 著者 学位授与年月日
1 西南日本外帯南部の完新世地殻変動に関する地形学的研究 前杢 英明 1992-09-07
2 西晉文学研究 : 陸機を中心として 佐藤 利行 1993-11-15
3 フォークナー文学の世界 : 自己増殖のタペストリ 田中 久男 1995-02-20
4 世界恐慌とジャワ農村社会 植村 泰夫 1995-11-13
5 地理学におけるハウジング研究 由井 義通 -
6 中国地方における鉄穴流しによる地形環境変貌についての自然地理学的研究 貞方 昇 1994-02-21
7 チョーサーの作品における語りの文体論 地村 彰之 2002-10-21
8 ドイツ語イディオム学習・教授法に関する総合的研究 : 日独イディオム比較・対照研究の視点から 植田 康成 2001-06-18
9 初期バークにおける美学思想の全貌 : 18世紀ロンドンに渡ったアイリッシュの詩魂 桑島 秀樹 2004-03-25
10 中世民衆ギリシャ語の空間表現 : 複合前置詞の成立 橘 孝司 1999-07-19
11 日本古代における鉄鍛冶技術の研究 古瀬 清秀 1999-07-05
12 クレールーキアの研究 : アテナイ植民活動にみる人的結合の諸相 前野 弘志 1999-07-19
13 中国新石器時代の農耕文化の考古学的研究 : 黄河・長江流域における農耕具と加工調理具を中心にして 槙林 啓介 2004-03-15
14 ディケンズにおける規範と逸脱 小野 章 2006-03-23
15 トマス・ハーディ研究 : 時間意識と二重性の自己 宮崎 隆義 2007-04-16
16 近世瀬戸内海路を巡る情報とその特質 : 幕府公用通行を中心に 鴨頭 俊宏 2008-04-16
17 荒川洋治の現代詩研究 : 虚構と隠喩 吉田 敬 2008-03-06
18 絶海中津の基礎的研究 朝倉 和 2003-03-04
19 読み直すヘミングウェイ : 故郷オークパークから/へのまなざし 前田 一平 2008-03-06
20 芥川龍之介研究 : 芸術至上主義の超克 相川 直之 2003-03-04

表示を「ID(昇順)」とした場合は以下の通りである。

タイトル 著者 学位授与年月日
8 ドイツ語イディオム学習・教授法に関する総合的研究 : 日独イディオム比較・対照研究の視点から 植田 康成 2001-06-18
9 初期バークにおける美学思想の全貌 : 18世紀ロンドンに渡ったアイリッシュの詩魂 桑島 秀樹 2004-03-25
10 中世民衆ギリシャ語の空間表現 : 複合前置詞の成立 橘 孝司 1999-07-19
7 チョーサーの作品における語りの文体論 地村 彰之 2002-10-21
1 西南日本外帯南部の完新世地殻変動に関する地形学的研究 前杢 英明 1992-09-07
2 西晉文学研究 : 陸機を中心として 佐藤 利行 1993-11-15
3 フォークナー文学の世界 : 自己増殖のタペストリ 田中 久男 1995-02-20
4 世界恐慌とジャワ農村社会 植村 泰夫 1995-11-13
5 地理学におけるハウジング研究 由井 義通 -
11 日本古代における鉄鍛冶技術の研究 古瀬 清秀 1999-07-05
12 クレールーキアの研究 : アテナイ植民活動にみる人的結合の諸相 前野 弘志 1999-07-19
13 中国新石器時代の農耕文化の考古学的研究 : 黄河・長江流域における農耕具と加工調理具を中心にして 槙林 啓介 2004-03-15
14 ディケンズにおける規範と逸脱 小野 章 2006-03-23
15 トマス・ハーディ研究 : 時間意識と二重性の自己 宮崎 隆義 2007-04-16
16 近世瀬戸内海路を巡る情報とその特質 : 幕府公用通行を中心に 鴨頭 俊宏 2008-04-16
17 荒川洋治の現代詩研究 : 虚構と隠喩 吉田 敬 2008-03-06
18 絶海中津の基礎的研究 朝倉 和 2003-03-04
19 読み直すヘミングウェイ : 故郷オークパークから/へのまなざし 前田 一平 2008-03-06
20 芥川龍之介研究 : 芸術至上主義の超克 相川 直之 2003-03-04
A 村上春樹研究 : 物語不在の時代の〈物語〉 山根 由美恵 2003-03-04

5の著者名は不明であるため, 「-」とした。「更新日(昇順)」と「ID(昇順)」ではデータの順番が異なっている。また, 「ID」ではあった6のデータが「更新日」ではなくなっている。そのため一つ空きができることになるが, 「ID」にはAのデータが追加されている。順番は大きく異なるが, 実質的な差異は6とAの違いのみである。

一方でクエリによる表示は以下の通りとなり, 機関リポジトリの順番を変更したときとは逆に, 差異の大きなものとなっている。

title name subject updated
1 地理学におけるハウジング研究 由井, 義通 290 2019-02-08
2 A Functional Approach to English Literary Discourse Kikuchi, Shigeo 930 2019-02-08
3 普遍と真理 : アベラルドゥス 言語哲学の研究 永嶋, 哲也 130 2019-02-08
4 ジオサイバースペースの空間構造に関する地理学的研究 : 地域のコミュニケーションの視点を中心に 和田, 崇 300 2019-02-08
5 芥川龍之介研究 : 芸術至上主義の超克 相川, 直之 910 2019-02-08
6 村上春樹研究 : 物語不在の時代の〈物語〉 山根, 由美恵 910 2019-04-16
7 夏目漱石研究 : 小品の独自性と可能性 二宮, 智之 910 2019-02-08
8 厳島の祭礼と芸能 原田, 佳子 770 2019-02-08
9 パーソナリティ認知過程における自己一致性に関する研究 浜名, 外喜男 140 2019-02-08
10 ベトナム・日本関係史の研究 : 明治維新から太平洋戦争まで - 220 2019-02-08
11 中国地方における鉄穴流しによる地形環境変貌についての自然地理学的研究 貞方, 昇 290 2020-12-26
12 宮沢賢治研究/文語詩集の成立 : 鉛筆・赤インク〈写稿〉による過程 島田, 隆輔 910 2019-02-08
13 読み直すヘミングウェイ : 故郷オークパークから/へのまなざし 前田, 一平 930 2019-02-08
14 ドイツ語イディオム学習・教授法に関する総合的研究 : 日独イディオム比較・対照研究の視点から 植田, 康成 840 2019-02-08
15 中世民衆ギリシャ語の空間表現 : 複合前置詞の成立 橘, 孝司 890 2019-02-08
16 チョーサーの作品における語りの文体論 Dimura, Akiyuki 930 2019-02-08
17 西南日本外帯南部の完新世地殻変動に関する地形学的研究 前杢, 英明 450 2020-12-26
18 西晉文学研究 : 陸機を中心として 佐藤, 利行 920 2020-12-26
19 中国新石器時代の農耕文化の考古学的研究 : 黄河・長江流域における農耕具と加工調理具を中心にして 槙林, 啓介 220 2019-02-08
20 ディケンズにおける規範と逸脱 小野, 章 930 2019-02-08

更新日を取得したいのでformatAtom で指定し, タイトル, 著者, 主題, 更新日をそれぞれ<title>, <name>, <subject>, <published>タグから抜き出して表にまとめた。<subject>は NDC である。10番目のデータのみnameが`「,」となっており不明であるため, 「-」とした。取得漏れの原因は不明である。

一部にリポジトリにはみられないデータが含まれている。上表の2~4, 7~10, 12 がクエリの検索結果で新しくみられるデータである。一方, 1, 5, 6, 11, 13, 15~20 はリポジトリの最初の20件のものと符合する(上表6は「ID」表示によるAである)。この差異はいったい何を意味するのか。
更新日は2019-2020までのものであり, 大きく異なるものではないように思われる。なぜここまで表示が違うのか, そもそもフィードによるデータが何を基準として昇順に並んでいるのか。その順番を変更することは可能なのか。しばらくマニュアルを眺めていたが結局わからなかった。

もう一度データの詳細を眺めてみることで一つの推測が成り立つ。詳細情報によれば「日付」と「学位取得年月日」とが混在している。「日付」とは作成日を指す。つまり, IRDB のデータに含まれる論文作成日と学位取得年月日が混在しているために, データの順番がリポジトリのものと異なっていることが考えられる。
では, クエリ検索の結果表にみられる「新しいデータ」はリポジトリにないものかというとそうではない。順番こそ異なるがリポジトリの「博士論文」一覧に記載がある。というわけで, 大筋において得たい更新データは得られていることになる。
先述の推測が正しいかどうかは今後の調査課題としたい。