レコード・マネジメント
Online ISSN : 2424-1954
Print ISSN : 0915-4787
ISSN-L : 0915-4787
プロジェクト研究
機械学習を用いた行政文書の第一次選別機能の開発と性能評価
新原 俊樹
著者情報
ジャーナル フリー

2023 年 85 巻 p. 54-65

詳細
抄録

地方公共団体では、保存期間が満了した行政文書の一部を特定歴史公文書として選定する評価選別作業の効率化が課題となっている。本研究は、熊本県の知事部局において2016~2020年度に保存期間満了を迎えた文書を対象として、過年度(2016~2019年度)の文書の第一次選別結果に基づき、コサイン類似度に基づく文書の同一判定手法を用いて最新年度(2020年度)の文書の第一次選別を自動判定で行う手法を開発した。その結果、自動で判定を下すことができた文書数は全体の58%に上ったほか、自動判定結果と委員による実際の判定結果を比較したところ、再現率は60%、適合率は32%であった。 各指標はトレードオフの関係にあり、全ての指標を共に改善することは容易でないが、判定精度の向上に寄与し得るものとして、(1)他の機械学習モデルとも比較し、最適なモデルの選定、(2)文書の内容に合わせて適切な名称を付与するしくみの導入、(3)過年度の第二次選別結果の第一次選別の過程への反映が今後の研究課題である。

著者関連情報
© 2023 記録管理学会
前の記事 次の記事
feedback
Top