クラウドファンディング、皆様のお陰で達成することができました。
たくさんのお力添え、本当にありがとうございます。
この御恩には必ず「研究成果を出す」という形で返させて頂きます。
今後ともよろしくお願い致します。
naomi tanaka
近年、公的年金制度をはじめとする日本の社会保障制度がほころび始めていることを背景に、得た財産を今までのように貯蓄するだけではなく、投資による資産形成も必要になることが予想されます。実際、NISA(少額投資非課税制度)など、投資による資産形成を支援する制度も整ってきており、この機運は今後高まるでしょう。しかし実際に投資をするとなると、躊躇する方も多いのではないでしょうか?
その理由のひとつは、金融専門文書の読みにくさであると考えています。投資というと、企業の事業内容や業績状況に関する情報を集めるため、企業の決算発表内容をまとめた決算短信や有価証券報告書などの、金融専門文書を読み解く必要があるというイメージをお持ちの方も多いと思います。しかし投資初心者の方が、これらの文書を読み解くことは容易ではありません。文書内には文字が多く、専門用語が多数使われ、見やすい文書であるとは言い難いからです。実際に投資をしようとする忙しいビジネスパーソンが、これらの文書を仕事の合間に読んで情報収集することは、かなりハードルが高いのではないかと思います。
そこで、本プロジェクトではこの問題を解決するため、テキストマイニングの技術を用いて、投資判断に有用な情報を、金融専門文書から抽出する手法の考案と、抽出した情報を用いて、非専門家にもわかりやすい情報可視化システムの構築に取り組みます。
テキストマイニングとは、文書から重要な情報を取り出す技術のことで、身近な例ではGoogle検索のような検索エンジンなどに用いられています。金融業界でもこの技術は使われており、ある証券会社では、テキストマイニング技術を用いた景気動向指数の構築なども行っています。
他のテキストマイニングの金融専門文書への適用例として「手がかり表現からの因果関係抽出」(※)などの先行研究が挙げられます。この方法では、文書から「〜ために」や「〜の結果」のような「原因と結果」に関する表現を手がかりに、「AのためにBが起きる」や「Aの結果Bが起きる」といった「原因と結果」に起因する重要情報を得ることができます。たとえば、原因「安定的なローンの積み上げのため」に対する結果として「堅調な業績の拡大が見込まれる」や、原因「株式市場の影響を大きく受けるため」に対する結果「予想は困難である」のような業績予想に関する情報を抽出できます。
しかしこの手法では、投資を行う際に重要なその他の情報、たとえばどの事業でいくら収益が出たかなどの「売上情報」や、各社がどのような事業を行っているかを示す「セグメント情報」は、得ることができません。これらの情報は多くの場合、「〜ために」や「〜の結果」のような、「原因と結果」に関する表現を手がかりに抽出することができないからです。つまり、この先行研究の技術では、金融専門文書から投資初心者が欲しい情報すべてを得ることができない、いわば「かゆいところに手が届かない」状態なのです。
(※)坂地泰紀,酒井浩之,増山繁,決算短信PDFからの原因・結果表現の抽出,電子情報通信学会論文誌D, Vol.J98-D, No. 5, pp. 811--822, 2015.
この状況を打破するべく、本研究ではかゆいところにも手が届く、金融専門文書からの重要情報抽出手法の開発に取り組みます。さらに手法の開発に留まらず、たとえば企業名を打ち込むと事業概要とその収益状況を得ることができるWebサービスを立ち上げるなど、本手法を用いて「非専門家にもわかりやすい情報可視化システムの構築」を行います。これにより、金融専門文書を身近に感じる社会、そしてより投資を身近に感じる社会をつくることへの貢献を目指します。
企業におけるビジネスを意識した研究とは異なり、上記のような「社会貢献」という理念のもと、大学にて本研究を行うため、開発したシステムは基本的には公開し、誰でもアクセス可能な状態にする予定です。このような研究を通して、誰もが投資判断に必要な情報を気軽に手にすることができる世の中を実現したいと考えています。
具体的な研究は、大きく次の4ステップの作業で進めます。
1. 重要情報の定義
金融専門文書のうち、初心者が投資に必要な情報を得るという目的を達成するために、どの情報が重要なのかを定義する。
2. データセット作り(アノテーション)
金融専門文書をテキストデータに変換し、人力で重要情報を識別してタグをつける。
3. 重要情報抽出モデルの作成
データセットを元に、深層学習を用いてモデルを作成。
4. 可視化システムの構築
モデルを用いて、金融専門文書から重要情報のみを抽出。非専門家でもわかるような情報として可視化する。
本プロジェクトでは金融専門文書のうち、決算短信を対象にこの作業を行う予定です。現在は手始めに「決算短信からのセグメント名およびそのコンテンツの抽出」を重要情報として、上記の1〜3ステップについて研究を進めており、2019年度人工知能学会全国大会にて成果を発表予定です。この研究を行うなかで培った技術をベースに、今後はセグメント名以外の売上情報など、さらなる重要情報の抽出に取り組んでいきます。
深層学習を用いてモデルを作成するには、大規模なデータセットが必要です。このようなデータセットは、基本的には人力で作る必要があり、その労力は多大です。そこで近年クラウドソーシングを用いて、このようなデータセット構築を行う場合が増えています。しかし当然ながらクラウドソーシングを利用するにはお金がかかります。
クラウドファンディング以外にも、企業との共同研究などで研究費を調達する方法もあります。ただしこの場合には、利益を度外視したシステムの無償公開をすることは困難であるため、本研究の理念である「より金融専門文書を身近に感じる社会をつくること」、そして「より投資を身近に感じる社会をつくること」にはつながりません。そこで今回は、クラウドファンディングを用いて資金調達を行うことに決めました。研究費は、主にデータセットを作るためのクラウドソーシング利用費用に当てる予定です。
私たちの理念に共感した方、研究内容にちょっとでも興味を持った方、どなたでも歓迎です。よろしければぜひ協力して頂けると幸いです。
伊藤友貴
Date | Plans |
---|---|
2019年6月 | クラウドファンディング挑戦 |
2019年9月 | データセット構築 |
2020年1月 | 重要情報抽出手法構築 |
2020年3月 |
重要情情報可視化システム構築
|
2020年3月 | 国内学会(人工知能学会金融情報学研究会・言語処理学会) にて発表 |
2020年 | 主要国際会議 (査読あり)にて発表 |
研究の詳細な進捗などをレポートにまとめてお送りします。応援よろしくお願いいたします!
研究報告レポート(PDF版)
5 supporters are supporting with this reward. (No quantity limit)
個人Webサイト( https://www.tomokiito.net/ )にお名前を掲載いたします。応援よろしくお願いいたします。
Webサイトにお名前掲載 / 研究報告レポート(PDF版)
6 supporters are supporting with this reward. (No quantity limit)
2019年3月の国内学会にて本研究に関する発表をする際、謝辞にお名前を掲載させていただきます。また、発表資料(電子版)を送付いたします。お力をお貸しください。応援よろしくお願いいたします!※学会発表が叶わなかった場合、その後の学会発表資料の謝辞にお名前を掲載いたします。
学会発表資料の謝辞にお名前掲載 / Webサイトにお名前掲載 / 研究報告レポート(PDF版)
5 supporters are supporting with this reward. (No quantity limit)
研究成果をまとめた論文が、査読あり国際会議・または査読あり論文誌に通った場合、その草稿を限定で公開いたします。国際会議のProceedingsや論文誌は有料である場合が多く、その内容を無料で見られることは貴重な機会です。
ペーパーの限定公開 / 学会発表資料の謝辞にお名前掲載 / Webサイトにお名前掲載 / 研究報告レポート(PDF版)
3 supporters are supporting with this reward. (No quantity limit)
本プロジェクトにて構築した重要表現の予測モデル、及びそれを用いた簡単な重要情報抽出プログラムを公開いたします。本モデル、そしてプログラムを使うことで、皆様が各自でお持ちの金融専門文書についても、今回のプロジェクトで構築した重要情報抽出手法をお気軽に試すことができます。
構築した予測モデルの公開と簡単なプログラムの先行公開 / ペーパーの限定公開 / 学会発表資料の謝辞にお名前掲載 / Webサイトにお名前掲載 / 研究報告レポート(PDF版)
4 supporters are supporting with this reward. (No quantity limit)
本研究成果を発表する際の謝辞にお名前を掲載させていただきます。※研究成果をまとめられるよう努力いたしますが、論文の掲載に至らない可能性もございますこと、ご承知おきいただけますと幸いです。
論文謝辞にお名前掲載 / 構築した予測モデルの公開と簡単なプログラムの先行公開 / ペーパーの限定公開 / 学会発表資料の謝辞にお名前掲載 / Webサイトにお名前掲載 / 研究報告レポート(PDF版)
1 supporters are supporting with this reward. (No quantity limit)
本プロジェクトが成功した場合、本プロジェクトにて作成した決算短信からの重要情報可視化システムのURLを、一般公開する前にお送りいたします。
今回の研究で作成したWebサービスの先行使用権 / 論文謝辞にお名前掲載 / 構築した予測モデルの公開と簡単なプログラムの先行公開 / ペーパーの限定公開 / 学会発表資料の謝辞にお名前掲載 / Webサイトにお名前掲載 / 研究報告レポート(PDF版)
2 supporters are supporting with this reward. (No quantity limit)
SSL encryption communication is used in this Web site, and the informations filled out are safely transmitted.
研究報告レポート(PDF版)
5
supporters
back
(No quantity limit)
Webサイトにお名前掲載 and others
6
supporters
back
(No quantity limit)
学会発表資料の謝辞にお名前掲載 and others
5
supporters
back
(No quantity limit)
ペーパーの限定公開 and others
3
supporters
back
(No quantity limit)
構築した予測モデルの公開と簡単なプログラムの先行公開 and others
4
supporters
back
(No quantity limit)
論文謝辞にお名前掲載 and others
1
supporters
back
(No quantity limit)
今回の研究で作成したWebサービスの先行使用権 and others
2
supporters
back
(No quantity limit)