SMART-GS は歴史学、文献学などの人文学におけるテキスト研究用のツールです。SMART-GS は手書きを含むテキストの画像イメージを検索、マークアップ、リンクすることができます。SMART-GSは、手書き文書、古代語などの未知の言語のテキストでも検索を行うことができます。そのため歴史学、言語学、文献学などにおける文献研究に使用することができます。


Update : 2008.10.04

What's SMART-GS?

SMART-GSは歴史学、文献学などの人文学におけるテキスト研究用のツールです。SMART-GS は手書きを含むテキストの画像イメージを検索、マークアップ、リンクすることができます。SMART-GSは形の類似性により検索を行うので古代語などの未知の言語のテキストや草書などの文字の範囲が不明瞭なテキストでも検索を行うことができます。

SMART-GS は林晋が自身の数学基礎論史研究から生まれました。林は19-20世紀のドイツの数学者 David Hilbert の数学手帳を研究中に、その困難な作業をサポートするための情報ツール作成を思い立ちました。ソフトウェア工学者でもあった林はヒルベルト数学手帳の分析とシステム開発における要求分析の類似性に着想を得て、そのツールを神戸大学財席時に学生たちとともに開発したUML モデル開発ツール SMART system を元にデザインしました。そのため、このシステムは SMART-GS (SMART-Geschichte Studie: 歴史研究用 SMART) と呼ばれています。(現在では SMART は SMART-SE (SMART-Software Engineering)と呼ばれています。 )

この誕生の経緯から SMART-GS のデザインは要求開発ツールの影響を大きく受けています。例えば要求間の依存関係を記述するための Reasoning Web や、Reasoning Web 記述用の XML に基づく SMART 用 Markup 言語 (SML) を SMART-SE から継承しています。そして、SMART-SE の時から行われていた Reasonning Web を用いた理論改変支援ツールの研究も、京都大学情報学研究科山本章博研究室によって継続され、大きな進歩がなされつつあります。

SMART-GS の大きな特徴は、北海道大学田中譲により提唱された Transmedia の思想を受け継ぎ、手書きテキストを、コード化するのではなく、画像として検索を行えることです。この検索機能は田中譲研究室との共同研究により開発されており、北大作成の検索エンジンを元に、献学研究者が使いよいような様々な工夫が凝らされています。たとえば、検索エンジンの出した不完全な検索結果を人間繰り返し評価する繰り返し検索の機能を使うと、Hilbert の手書きの数学手帳70ページ程度の中から、数分で Kronecker という人名を(おそらく)全部探索するのに成功しています。この検索は歴史研究用には既に実用段階に達しており、京都大学文学部・文学研究科、情報・史料学専修における歴史学研究に使用されています。

SMART-GS は多くの歴史家、人文学研究者の興味をひきつけており、現在、実用化を目指して、人文学研究の多種多様なスタイルへの適用、ネットワークを通しての発表・相互批評などの共同作業の支援、Web 上のデジタル・アーカイブへの応用などが計画されています。

SMART-GS modules
HS-Transmedia Text image search Reasoning Web

SMART-GS は画像としてのテキストを操作する単純なアーキテクチャをベースに作成されています。

これは SMART-GS のために考えられたものですが、田中の Transmedia machine のアーキテクチャを、文献研究用に改変したものとみなし、Humanistics Study-Transmedia (HS-Transmedia) アーキテクチャと呼びます。本来の Transmedia と異なり、画像文書を変更しないことを前提として作られていますが、文献研究のために便利なように作られています。

HS-Transmediaは近い将来、ネットワーク対応や多層的・相互的マークアップ、リンクなどに対応するよう拡張される予定です。

Image search はテキスト画像の行の一部分を指定すると、それに似た別の行の一部分を探し出す機能で、word spotting とも呼ばれます。SMART-GS の image search は北大のチームが開発したものです。

通常の文字列検索は精度100%ですが、この検索では誤りが生じ、その精度は低い場合には正解率10%にもなりません。

しかし、そのような場合でも、見つかったものをバケットに逐次入れて、バケット中にあるどれかに近いものすべてを探すという反復検索の方法を使うと、例えばヒルベルト日記の場合では、多くの単語の場合に、80ページ程度の中から、数回の反復で、ほぼすべての適合パターンを検索できることが経験的に知られています。実際の検索の動画デモ、静止画による説明

文献研究を行う際には、非常に多くの事実の相互関係を論理的に検討し分析する必要がありますが、資料の文書が多い場合、それは容易なことではありません。

このタスクはシステム開発における要求仕様の構築と管理に大変似ています。SMART-GS の Reasoning Web は、研究者が、文書間の論理的関係を分析する際に役立つ研究用補助ツールです。これは SMART-SE の Reasoning Web を、ほぼそのまま継承したものです。

このデモのように、Reasoning Web を使うと、様々な文書の関係をグラフィカルに表現することができます。

     

Downloads

  • HCP Project サイトに会員登録してダウンロード可能。他のHCPツールもある
  • 登録不要のマニュアルのダウンロードはこちら

Team

  • Current Members
    • 京大文学研究科: 林晋, 清水土筆, 橋本雄太, 小林道央
    • 京大情報学研究科:池田真土里
    • 北大 MEME LAB: 寺沢憲吾, 猪村元
  • Past members: 小林和晶, 小林和博, 田村勇樹

News&Log

  • 2006年:小林和晶が修士論文研究として開発に着手。
  • 2007年2-3月:プロトタイプが完成。小林和晶が修了によりプロジェクトから離れる。
  • 2007年2月:小林和博, 田村勇樹, 清水土筆, 橋本雄太がプロジェクトに参加。
  • 2007年12月:科研費特定領域「日本の技術革新 ―経験蓄積と知識基盤化―」第3回 国際シンポジウムの招待講演でSMART-GSを紹介。
  • 2008年2月25日:日本経済新聞で SMART-GS が紹介された。
  • 2008年7-10月:永井「倉富日記プロジェクト」の支援より editor を Ekit に置き換え。
  • 2008年10月4日:公開開始。HCP新サイトも開設。
Documents
Links
Contact Us...
京都大学文学研究科情報・史料学専修
  • Address : 京都市左京区吉田本町
  • Mail : susumu@shayashi.jp
  • サイト管理者 : 林晋

当サイトの著作権はすべて京都大学文学研究科情報・史料学専修に属します。
製作者 林晋 (佐藤真紗美作成の SMART homepage を元にしています。)