第90回研究会

出典: SigDD

目次

第90回デジタルドキュメント研究会 

  • 主査:中挾知延子(東洋大学)
  • 幹事:高橋慈子(ハーティネス)、秋元良仁(凸版印刷)、菅沼明(有明工業高等専門学校)
  • 開催日:平成25年7月25日(木)15:00-17:15、26日(金)09:15-16:15
  • 会場:岩手県立大学アイーナキャンパス学習室1 http://www.iwate-pu.ac.jp/outside/aina/toppage.html

テーマ 「文書デジタル化の初期段階、および一般」

文書の電子化に際しては、どのように活用するために電子化するのか?という初期段階の検討が重要です。 たとえば電子化の目標を「大半は読める文字で、一部分に読めない文字があり、読める文字は検索できるようにしたい」のと、 「現時点では大半が読めない文字だが文字単位の分割は可能で、将来読めるようになると考えてデジタル化しておく」と設定した場合、 さらに「文字単位の分割も不確定な状態だが、紙をめくったり複写引用するコストを下げるためにデジタル化しておく」 と設定したのではデータ作成の手順も大きく異なります。 デジタルドキュメント研究会第90回研究会では、「どのような活用を目標に、どのようなデジタル化を行なうべきか」の検討、事例紹介のセッションを予定しております。 デジタルドキュメントに関わる考察や経験をお持ちの方、また、提案可能な技術をお持ちの方は是非ご参加をお願い致します。

研究会の研究分野

  • デジタルドキュメント研究会(DD)

  文書記述 XML、HTML、マルチメディアコンテンツ記述、RSS

  作成技術 テクニカルライティング、オーサリング技術、マルチメディア文書処理、思考・推敲支援技術

  管理技術 コンテンツマネジメント、知識管理、文書管理、メタデータ

  表示技術 Webデザイン、ユーザビリティ、視覚化、レンダリング、レイアウト、ブラウザ

  情報流通・活用技術 情報検索、パーソナライゼーション、P2P、DRM(Digital Rights Management)、ワークフロー

  基礎技術 自然言語処理、認知心理学、知的財産権、セキュリティ、セマンティックWeb

  社会インフラ コンプライアンス、サイバーリテラシ

  応用技術 Webサービス、SOA(Service Oriented Architecture)、電子商取引、EDI、電子政府、デジタル放送、電子出版、

  デジタルアーカイブ、eラーニング、モバイル、SNS、ブログ

※2009年度より研究発表会はペーパレスとなっております。公知日も開催日の1週間前(7月18日(木))となりますのでご注意ください。

参考:ペーパーレス研究発表会の開催手順 & 良くある質問

参加費用

デジタルドキュメント研究会登録会員(個人会員、賛助会員、準登録(個人)): 無料
情報処理学会学生会員を除く個人、賛助会員: 1,500円
情報処理学会学生会員: 500円
非会員: 2,500円

・発表者も同様の参加費をいただきます。

・年間を通して参加される場合には、当研究会への登録をお勧めします。

・併催されるLOIS研究会の発表資料をご所望の場合は、別途資料代をご用意下さい。

プログラム

  • 発表時間予定:
 一般講演(30分):発表 20 分 + 質疑応答 10 分
 招待講演(50分):発表 40 分 + 質疑応答 10 分
  (質疑応答を含みます.多少変わることもあります。)

7月25日(木) 午後 LOIS (1) (15:00~16:00)

(1)/LOIS 15:00 - 15:30

介護施設内の情報共有による問題解決手法の提案

○佐藤央渉・杉野栄二・澤本 潤(岩手県立大)

(2)/LOIS 15:30 - 16:00

震災時における避難所での情報集約とその活用に関する研究

○仙道 航・瀬川典久・澤本 潤・杉野栄二(岩手県立大)

--- 休憩 ( 15分 ) ---

7月25日(木) 午後 招待講演 (16:15~17:15)

(3) 16:15 - 17:15

[招待講演]

「3.11に現場で何が起きていたのか」

◯越野修三(岩手大)


7月26日(金) 午前 DD (1) (9:15~10:45)

(DD-1) 9:15 - 9:45

HTML文書へのキャラクタデバイスの接続

◯鈴木俊哉(広大)

近年、モバイルデバイスでのセキュリティ配慮のためにアプリケーションの実行環境も仮想環境やWebブラウザ内部に閉じられ、様々な周辺機器への利用が難しくなってきている。本稿ではJavaScriptインタプリタが対応していないキャラクタデバイスの制御信号をWebSocketによって受信し、Webアプリケーションのインタフェースを改善する可能性について試験実装と評価を行った。

(DD-2) 9:45-10:15

ブートストラップ型文書構造化のためのLabel学習方式の開発

◯藤尾正和(日立)、平山淳一(日立)

医療,金融,製造で扱われる業務情報は文書の形で記録,閲覧,活用される。業務情報の分析・整理に携わる知識労働者の生産性向上のためには,大量の非構造文書を利活用可能な形式へ構造化する技術が必須である。文書構造化においては,特に多くの情報が集中する表の構造化が有効だが,表構造化のためのLabel(項目名)辞書を業務に合わせて構築する必要があり,辞書構築のコストが導入ネックとなる。本研究では,Label辞書構築のコスト削減のため,既知のLabel辞書を基に新規Label単語を獲得し,Label辞書を随時更新していく,Label学習型の表構造化技術を開発した。これにより,表構造の抽出率80%を達成した。

(DD-3) 10:15-10:45

循環型社会に向けた人材育成とICT技術の活用に関する検討

◯大野邦夫(安土)、西口美津子(福島高専)

循環型社会では、スマフォやタブレットPC、デジタルTVのような画像デバイスとのイ ンタラクションによる情報の活用を通じた省資源、省エネルギ化が期待される。さら に、そのようなデバイスを活用した生活空間、コミュニティ設計が期待され、その要 素技術としての住宅設備、ビル設備などの生活環境を組込系機器の延長としてビジネ ス化して輸出産業化するアプローチが考えられる。ここではそのような社会設計のた めのスキル要件や人材育成についての検討を述べる。


7月26日(金) 午前 LOIS (2) (11:00~12:00)

(4)/LOIS 11:00 - 11:30

GPSデータから抽出した滞在地の珍しさ推定

○藤岡大輔(岡山大)・望月理香・渡部智樹(NTT)・阿部匡伸(岡山大)

(5)/LOIS 11:30 - 12:00

LOIS研究の動向分析(2)

○若原俊彦(福岡工大)・岡本 学(NTT)・山元規靖(福岡工大)・茂木 学・

杵渕哲也(NTT)

7月26日(金) 午後 DD (2)

(DD-4) 13:30 - 14:30

[招待講演]

[伝統的モンゴル文字の電子化利用の現状と課題]

栗林均(東北大学)

伝統的モンゴル文字は、中国の内モンゴルを中心に居住する500万人以上のモンゴル族が現在使用している伝統的な縦書きの文字です。電子化利用と言った場合、モンゴル族にとっての利用と研究者にとっての利用がありますが、両方取り上げたうえで、私(研究者)にとっての利用を中心にしたいと考えています。 Windowsでは、2007年に発売されたVista以降、Unicodeに対応した入力言語「モンゴル語(伝統的なモンゴル文字、中国)」と、それに対応したフォント(Mongolian Baiti)が入力言語のひとつとして標準でバインドされるようになりました。これは、その後のWindows7にもそのまま引き継がれていますが、広く普及するには至っていません。中国で伝統的モンゴル文字の国家標準(Unicode規格)が最終的に発布されたのは、2011年になってからのことでした。 こうした事情により、中国国内および世界における伝統的モンゴル文字のUnicode対応は、緒に就いたばかりと言わざるを得ませんが、これからはパソコン、携帯、インターネットにおける伝統的なモンゴル文字の使用は飛躍的に拡大していくことが予想されます。 ところで、伝統的なモンゴル文字がUnicodeに対応した利用に向けて動き始めた、ということは、データの共有の観点から重要な要件となりますが、それですべての問題がが解消するわけではありません。講演では、伝統的モンゴル文字独自の特徴から生じるデータ共有の問題を具体的に考えながら、解決策を探りたいと思います。


7月26日(金) 午後 DD (3) (14:45~16:15)

(DD-5) 14:45 - 15:15

ウイグル文字古文献デジタル化のためのグリフデザインの検討

◯ウメルジャン・オスマン(長岡技大)、中平勝子(長岡技大)、鈴木俊哉(広大)、植村俊亮(奈良産業大)、三上喜貴(長岡技大)

本論文で扱うウイグル文字は,歴史的にはアラム文字を起源とし,アラム文字から派生したソグド文字を直接の祖先として形成された表音文字である.また,ウイグル文字からは,後にモンゴル文字,満州文字などが派生した.ウイグル文字は,縦書き,横書きいずれの書記方向でも書かれてきた.横書きのウイグル文字は中央アジアの西トルキスタンと東トルキスタン地方に見られる.一方,縦書きのウイグル文字は紀元8-9世紀頃にトルファン地方で誕生したと考えられ,西はトルファンから東はモンゴルと甘粛に至る広範囲で使われるようになった.検討にあたって,文献作品クダトクビリグと阿毘達磨倶舎論実義疏には,作成者の署名を表すような様々な図形が登場し,これをすべて符号化しようとすれば数百になる. ここで検討が必要なのは,縦書き用の文字と横書き用の文字を,符号として区別するかどうかという点である. ウイグル文字の単語中での文字の位置によって文字図形が変化する文字の場合,異なる図形ごとに異なる符号を与える方式,図形は異なっても同じ音を意味する場合には同じ符号を与える方式(符号-グリフ分離方 式) とがある.ISO/IEC 10646 では符号-グリフ分離方式が採用されていることから,本設計でも,符号-グリフ分離方式を採用した.筆者らは,このウイグル文字の文字符号を確立することによって,ウイグルの貴重な歴史的文献情報の保存と活用の基盤形成に貢献したいという目的をもって研究を行なっている.本論文ではその研究成果であるウイグル文字古文献に基づくグリフデザインの経験について述べる.

(DD-6) 15:15-15:45

A Survey on the Achievements of the Oracle Bone Digitization Projects and Prior Definitions of the Targets

◯Atsushi Suzuki(Ibaraki University)、suzuki toshiya(Hiroshima University)

During 2003-2012, the Old Hanzi Expert Group under ISO/IEC JTC1/SC2/WG2/IRG was working to draft the Oracle Bone character encoding for ISO/IEC 10646. However, the group was disbanded without finishing the draft. It was supposed that the failure was caused by the irregular situation that the group had to work for the industrial and international standard. On the other hands, there were several projects to digitize Old Hanzi materials since the late 1990s, in China mainland, Hong Kong and Taiwan. Checking their results, it is found that the failure in ISO Old Hanzi Expert Group was not irregular one, similar failures were found when the projects were started without the clear prior definition of the project "what should be digitized". In this report, the survey is summarized and the expected prior definition of the projects is discussed.

(DD-7) 15:45-16:15

悉曇文字の国際標準化の動向

◯川幡太一(NTT)、鈴木俊哉(広大)、永崎研宣(人文情報学研究所)、下田正弘(東大)

悉曇文字は日本において、仏典の研究や菩薩の種字等に用いられるインド系文字の一種である。本報告では、日本の悉曇文字の国際符号化文字集合(UCS)への提案活動に関して、その概要・標準化の経緯・および標準化にあたっての技術的課題および今後の予定について述べる。


一般講演(30分):発表 20 分 + 質疑応答 10 分

  • 懇親会
 ◎1日目(25日)研究会終了後、意見交換会(懇親会)を予定しております。
 会場: ぴょんぴょん舎駅前店( http://www.pyonpyonsya.co.jp/tenpo_morioka-ekimae.html )
 時間: 18:00-20:00
 会費: 一般4500円、学生3500円(見込)

発表予定の方へのお願い

 ・締切り後の発表キャンセルは原則としてできません。発表申し込み後にキャンセルの必要が生じた場合にはなるべく早くご連絡ください。発表申込後、学会が提示する原稿提出締め切りまでに原稿が到着しない場合には、幹事団の判断により発表を取り消しさせていただくこともあります。

 ・論文提出締切後(7/1)の原稿差し替えはできません。

 ・研究会はペーパーレスでの開催となり、印刷した研究報告の配布を行いません。また、特許出願の公知日(研究報告の公開日)が従来より1週間早まりますので、ご留意ください。

個人用ツール