医師にとってのLSDツールの利用価値とは

LSDはPubMedを始めとする多くの学術文献や総説から解析した単語をデータベースにしています。そのため英語の論文を読み書きする際のサポートツールとして利用価値が高いと言えます。例えば、WebLSDで日本語から英語を検索すると、その用語のほかに、学術誌に収録されている代表的な用例がピックアップされます。各用例にはリンクが貼られているため、それらが使われている抄録をPubMedで参照することも可能。さらに共起検索ではその英単語の前後にどのような単語が出現しやすいかを調べる事もでき、ネイティブスピーカがどのような言い回しを多く使うかもわかります。

ウェブサイエンス辞書検索結果

これだけでも十分使い手はあるように思えますが、金子先生はさらにLSDの活用について、3つのビジョンを打ち出しています。それは「ポータルサイト機能」「PubMed機械翻訳」「テキストマイニング」です。

「ポータルサイト機能については、医学や生命科学の用語を検索する場合に検索の手助けを提示したいと考えています。例えば、“アルツハイマー病”という言葉を検索する場合、あなたが知りたいのはその治療についてなのか、メカニズムについてなのか、単なる検索だけではなく、その単語から関連する知識情報をサジェストできるようにするといったことが可能です」。このポータルサイト機能については、現在すでに実験的に行われており「ここ1年ぐらいで完成させる見込み」と金子先生。一方、PubMedの機械翻訳については「医療の現場で重要性が高まっているEBMと絡めて利用価値があると考えています。EBMの観点からは、その元になるリファレンスにあたる必要がありますが、その際、LSDを利用すれば文献を日本語で容易に検索し、読むことを可能にできます。実は、すでにWebLSDでは日本語検索からPubMedへのリンクが実装されています。ヘルプ機能にも近々載せる予定ですが、まだあまり知られていないんですよね」と語っています。

現時点でWebLSDでは日本語から英語、英語からPubMedを探るという2アクションが必要ですが、ゆくゆくは完全翻訳し、Web上で日本語でも読めるようにしたいと、金子先生。「一見難しそうな作業ですが、PubMedに出てくる文章は、ある程度パターンが決まっているので、まともな辞書とパターンの元となる構文を与えるとかなり精度のいい機械翻訳が可能です。この機械翻訳のエンジン開発については、情報技術の専門家とパートナーシップで実現しようと思っています」

ウェブサイエンス辞書検索結果

また、テキストマイニングは、もともと薬理学を専門としている金子先生がLSDプロジェクトの中で最もやりたいことのひとつだと言います。「例えば遺伝子と文献データベースをリンクさせると、Aという遺伝子とBという病気やCという薬物との関係が明らかになる。そんな可能性が出てきます。また、薬物有害事象の早期発見も期待できます。電子カルテの普及によって、デジタルフォーマットの医療文書が増えていきます。その場合、薬と病気のボキャブラリーを使ってテキストマイニングすることで、組み合わせの善し悪しを見つけることも可能です」。さらに金子先生はこう語ります。「(結局のところ)生命科学や医学の研究成果の大半はテキストの中にある」と力説します。「大量のテキストをコンピュータを通すことで、初めて見えるものが出てきます。まったく関係が無いと思われていた両者が実はとても深く関わっていたということが分かる。そして、これらを我々が実験科学で証明していけばいいわけです。最終的な判断はもちろん、人間です」

iPodの利用でさらに広がる教育用途

元々教育的な視点を踏まえたLSDプロジェクトですが、直近の教育目的の成果物として、iTunesやiPodで利用できる音声版のLSD「耳で覚えるライスサイエンス英語2000」がリリースされ、ダウンロードできるようになっています。 クォート

「最初は音楽CDフォーマットでという案もあったんですが、iTunesのほうが面白いだろう、ということになり実際に作り始めたらできあがり、特にiPodとの組み合わせは持ち運びを可能にしました。(LSDの中から)学習用に必要とも思われるもので頻度の高いものから2,000語をピックアップし、イギリス人の発音で1つの単語を2回づつ録音したものに曲名として英日の対訳がつけてあります。例えばこれを入れたiPodを電車に乗っているときシャッフル再生すると、順不同に再生されてまず耳で聞いてリスニングをします。次に正しく聞き取れているかどうかはディスプレイで確認できます。現在は単語レベルですが、文章レベルの教材に発展するとさらにいいと思います。医歯薬系の教育機関のほとんどが、これまできちんとした専門英語を教えてきていません。そう言う意味では、こういった教育資源を提供することは、とても価値あると思っています」

ウェブサイエンス辞書iTune

LSDの今後の展望

LSDは、今後3年間で1万語ずつ増やして網羅性を高め、2008年には7〜8万語を目標にしています。用語の追加に関しては「網羅性をあげていくことで、テキストマイニングなどの次のステップへの利用が開けます。インターネットとPDFの出現でテキスト量が爆発的に増加しています。もはや人間だけで解読できる量ではない。そういう意味では人間だけでなく、コンピュータにも使える辞書への転換期にあると思っています」と金子先生。また「言葉は明らかに変わっていきます。例えば、“expression”は”発現”と訳しますが、我々のなかではDNAがRNAに変わる変化を指していました。ところが最近は、形質が現れることすべてが”発現”になっている。こうした時代背景も理解しながら、言葉を増やしていきます。」(金子先生)

‘80年代からのコンピュータユーザの「Macへのこだわり」

金子先生の分子薬理学研究、そしてLSDプロジェクトを支えているのがMac。先生は複数台のパソコンを使いこなされていますが、メインマシンはPower MacとApple Cinema Display 23インチモデル。統計処理はPrism、科研費の申請にはAdobe InDesignを利用するなど、使うアプリケーションも適材適所で利用されているそうです。「研究をまとめるのに統計やグラフの処理はとても大切です。Prismならグラフもきれいなラインが引けますし、付随するドキュメントがきちんとした統計学の教科書になっている点も気に入っています。 クォート

最近は様々な申請用紙がPDFファイルで来るので、それをまずInDesignの書類に貼り、別のレイヤーに文字を入れ込みます。InDesignのおかげで研究費の申請はとても楽になりました。MicrosoftのソフトはWindows上で使うことも多いですが、広いデスクトップの上でいろいろなアプリケーションを立ち上げて使う場合、Macの方が絶対使いやすい」と金子先生。「やはりパソコンはマルチウインド、マルチタスクがスムーズに動くことが不可欠です」。金子先生がMacを利用するもうひとの理由は、バックグラウンドでPerlなどを使って辞書の膨大なテキスト処理がスムーズに行える、という点です。「(UnixベースのMac OS Xは)処理が断然早い」と金子先生。

また、研究室ではXserve G5を最新のMac OS X Tiger Serverで利用。MacとWindowsが混在する研究室で共有のファイルサーバや学生のメールサーバやメーリングリストサーバとして利用しているほか、LSDプロジェクトの協力員が使用するFileMakerのサーバとしても活用しています。FileMaker にはLSDに収録予定の新語をストックしておき、そこから新語をWebブラウザに呼び出し、訳語を入れる等の作業をするわけですが、そのためのデータベースも置いているそう。「正直言いまして、Xserveは半信半疑で買いました。なぜなら情報がなかなか無かったため、どのような使い勝手なのか、なかなか理解しにくかったんですね。公開されているドキュメントや書籍を見てもいまひとつ分かりませんでした。買って動かしてみて、ああ、そういうことだったんだと納得しました。例えば、LinuxのFedora Coreを使ってサーバを立ち上げることを考えるとそれなりの苦労をするわけですが、Xserveはオールインワンなので、ほとんど何も手を加えなくても、GUIの管理ツールで設定できてしまった。あれには本当に感動しました」今後もMacを活用して研究を進めるという金子先生、さらなる活躍が期待されます。