SMART-GS

この章では開発の経緯や思想など、SMART-GS の背景について解説します。

SMART-GSは古文書・歴史史料のWEBの構築を目指すプロジェクトの一環として位置づけられています。その基本的な哲学は「本当に人文学者が求め使いたいと思う人文情報技術」です。また、このソフトウェアの大きな特徴として、開発が人文学の研究者を中心として行なわれているということがあります。ネット基盤の最重要部分を担当する相原のような例外はあるものの、SMART-GSは何等かの意味で人文学に関わる人たちにより構築されており、開発者が同時に中心的な利用者であるという、本来のオープンソースソフトウェアが持っていた特徴を色濃くもっているのです。

SMART-GS/HCPプロジェクトは、世界の人文学者、特に文献史料学的技法をくしする歴史家などのために開発されており、そして、その最大のユーザの一人が開発リーダであるという特徴を持ちます。これは、D. Knuth 氏の TeX システムの開発形態に似ています。我々は、TeXシステムが数学・情報学などの理系研究者の研究活動に貢献したように、SMART-GS が人文学者のために真に役に立つツールとなることを目指して開発を続けています。

SMART-GSはGPL2ライセンスのもとに配布される無料のオープンソースソフトウェアです。その開発も、オープンソフト開発の拠点である sourceforge.jp で行なわれています。SMART-GSプロジェクトが目指す理想実現のためには、多くの労力と創造性が必要です。我々は、一人でも多くの人文学者が、このツールにより恩恵を受けることを望むと同時に、一緒に開発を行なってくれる仲間も求めています。

SMART-GSとは?

SMART-GSは歴史学、古典学、文献学、言語学などの人文学におけるテキスト研究用ツールです。

手書き史料や古印刷物を、検索、マークアップ、リンクするには、それを翻刻して電子テキストに打ち直す必要がありました。 しかし、SMART-GS では画像イメージのままで、検索、マークアップ、リンクができます(注1)。 OCRで作ったテキストを検索するのと異なり、類似するパターンをパターンのままで検索するので、文字体系がわかっていない言語のテキストでも使えます。 OCRに比べ精度が若干落ちますが、手間が大幅に削減できるため、従来ならば翻刻補助員の謝金などの大きな資金を必要とした研究を個人で行うことが可能になります。 これらの機能のため、読みにくい手書き史料、OCRが十分機能しない古印刷物などの検索・翻刻・釈読・分析のための便利なツールとして人文学の多くの分野で役立つものと期待されています。

すでに19世紀ドイツ数学基礎論史研究に使用されて成果をあげており、現代日本政治史の倉富勇三郎日記研究での使用も始まっています。 また、京大文学部・文学研究科の歴史学関係の演習で使用する計画が進行中です。

SMART-GSは人文学研究・教育のための実用的ツールを開発し、広く世界の人文学の研究者・学生に提供することを目指す人文学サイバープラットフォームのプロジェクトであるHCP (Humanity CyberPlatform)プロジェクトの一環として開発されています。 ソースは公開されており、自分の人文学研究のために自由に改変することができます(注2)。

SMART-GS の歴史

SMART-GSは林晋の数学基礎論史研究から生まれました。 林は2006年ころ、19-20世紀のドイツの数学者David Hilbert の数学手帳を研究作業をサポートするための情報ツール作成を思い立ちました。

ソフトウェア工学者でもあった林は史料の分析とシステム開発の要求分析の類似性に着想を得て、神戸大学工学部で学生たちと開発したモデル開発ツール SMART system を元にそのツールをデザインしました。 そのため、このシステムは SMART-GS (SMART-Geschichte Studie: 歴史研究用 SMART) と呼ばれています。以下、混乱を避けるために、元のソフトウェア工学用の SMART を SMART-SE (SMART-Software Engineering)と呼びます。

SMART-SE の SML というマークアップ言語と処理系(河村、小林和晶作成)の一部を、SMART-GSは継承しています。また、現在 Reasoning Web と呼ばれているものは、SMART-SEの要求仕様管理ツール(潘沂冰、薛世宗作成)を一部継承しています。 SMART-GS の設計は、2006年ころ林を中心に京大情報・史料学専修により行われ、実装は小林和晶の2006年度修士論文研究の一環として行われました。 この際、Reasoning Web は完全に書き換えられましたが、SMLエンジンは極く一部ながら現在も使用されています。

また、京大の山本章博の助言により、北大の田中譲研究室の画像検索技術が採用されることになり、北大(当時)の寺沢、猪村のチームによりSMART-GS 用の Java画像検索機能用モジュールが構築され組み込まれました。

こうして出来た SMART-GS は、2007年から林のヒルベルト研究への応用されるようになり研究の効率が著しく向上することが実証されました。 また、並行して小林和博を中心とする情報・史料学の学生のチーム(清水、田村、橋本)により、多くの改善・改良が行われました。その後、約2年ほどのブランクがあったものの開発は進み、特に2010年度より相原健郎(NII)が参加して、SMART-GSをネット上協働ツールに進化させる人文学研究用の情報基盤HCPの開発と、そのためのSMART-GSの大幅な改造が科学研究費の補助による研究として開始されました(注1)。そして2010年夏より大浦真と久木田水生が、非常勤特別研究員として、このプロジェクトに参加し、また、林自身がプログラマとしての活動を始めました。SMART-GS0.8は、この三名の開発作業の結果であり、従来の SMART-GSに大幅な改善を加えたものです。そして、 この SMART-GS0.8を、相原が開発したHCP基盤のクライアント化することにより、ネット上協働人文学研究用ツールを構築する計画が進行中です。

また、歴史学での実際の利用においては、2008年には永井和代表科学研究費基盤A「倉富勇三郎日記研究 IT応用新研究支援ツールの導入による全文翻刻と注釈の作成」への応用が始まり、すでにこのプロジェクトによる倉富日記翻刻の第一巻が出版されています。また、林は京都学派NO2の哲学者田辺元の研究をSMART-GSを用いて開始し約50年間実質的に手付かずのまま残されていた難読史料を一部解読することに成功し、従来の田辺像に修正を迫りつつあります。これらの研究が可能となった背景にはSMART-GSをプロジェクタと組み合わせて多人数で翻刻を行なうという「協働翻刻」の手法が永井研究室で開発されたことがあります。この手法を使うと50年間哲学の専門家にも解読困難であった田辺の講義準備メモが、哲学に全く興味を持たない学部学生にとってさえパズルのようにして楽しく読めるものになるという、驚くべき効果があることが分かって来ています。この効果がネット上で発揮されれば、その威力が文献史学に与える影響は大きなものがあるでしょう。

さらに詳しい話は、少し古い資料になりますが、次をご覧下さい:

  1. 林、永井、宮崎:文献研究と情報技術 : 史学・古典学の現場から(<特集>歴史知識学) , 人工知能学会誌, 25(1), pp.24-31, 2010年1月.
  2. SMART-GSを使った歴史研究: http://www.shayashi.jp/xoops/html/modules/wordpress/index.php?p=45
  3. 文献研究用ツールSMART-GSとHCPプロジェクト(「SMART-GS」で古文書のワールド・ワイド・ウェブを):http://www.astem.or.jp/virtual-lab/culture/research/r_kenkyu6,文化とコンピューティング京都研究所

注1. この研究は、基盤B(一般) No. 22300083, “人文学研究を促進する協働のための情報共有基盤に関する研究”, 代表者 林晋、分担者 相原健郎, 総合領域,情報学,図書館情報学・人文社会情報学, 情報メディア,歴史情報学, 2010-2012、の補助を得て進められています。

SMART-GS の作成者

SMART-GS を発案しデザインしたメイン・アーキテクトは林晋です。 そして、 SMART-GS の構築には、前身の SMART-SE の時代からすると多くの人たちが、その作成に関わっています。 現在のSMART-GSに使われているソースの作成者を以下にリストします。

配布


トップへ戻る SMART-GSの初期画面