TIS、自然言語処理で企業分析を行うためのデータセット「CoARiJ」を無償公開
~ ESGをはじめとした非財務情報への自然言語処理技術活用を推進する ~

2019年11月14日

TIS株式会社

TISインテックグループのTIS株式会社(本社:東京都新宿区、代表取締役会長兼社長:桑野 徹、以下:TIS)は、自然言語処理で企業分析を行うためのデータセット「CoARiJ(Corpus of Annual Reports in Japan)」(コアリジェ)を無償公開することを発表します。

「CoARiJ」は、有価証券報告書やCSR報告書、統合報告書の記載内容(事業概要や財務情報等)と、数値情報(株価およびTOPIX等の指数)をまとめたデータセットです。2014年度から2018年度までの5か年度分を収録しており、無償かつ日本語の企業文書データセットとしては初の公開となります。

より高度な企業評価を行いたい研究者また企業は、「CoARiJ」と自然言語処理技術を組み合わせることで、財務・非財務両面で分析を行うことが可能となります。

「CoARiJ」を活用した分析のイメージ

「CoARiJ」を活用した分析のイメージ

「CoARiJ」公開ページ:
https://github.com/chakki-works/CoARiJ

「CoARiJ」公開の背景

TISでは、アニュアルレポートなどの事業報告文書へ自然言語処理を活用することで、従来の財務分析にとどまらない、非財務分析を加えた総合的な企業分析を行いたいと考えています。自然言語処理による非財務分析はまだ発展途上であり、研究の推進に貢献するため「CoARiJ」を無償公開します。なお、一般の企業にとってもわかりやすい形でのデータ提供は、TISのソリューションとして提供する予定です。

今回「CoARiJ」を公開したように、TISでは研究開発をオープンな姿勢で行っています。データセットだけでなく自然言語処理の研究に際して開発したソフトウェアは、以下のページでオープンソースとして公開しています。

https://github.com/chakki-works

今後の展開

TISでは、与信管理ソリューション「SCORE LINK」や企業分析サービス「Finplus」を提供していますが、これらのサービスでは財務情報を主軸に扱っています。今後ここに「CoARiJ」を活用した非財務情報の分析が加わることで、企業の与信・融資業務支援の充実が図れるとともに、投資・融資を受ける企業側にも数値面だけでない評価が受けられるというメリットが生まれます。
TISは、財務・非財務両面の分析を支援していくことでESG投資をはじめとした持続可能な成長への投資を促進し、企業のSDGsの実現に貢献していきます。

TISの関連ソリューションについて

各ソリューションの詳細はURLを参照下さい。

TIS株式会社について

TISインテックグループのTISは、SI・受託開発に加え、データセンターやクラウドなどサービス型のITソリューションを多数用意しています。同時に、中国・ASEAN地域を中心としたグローバルサポート体制も整え、金融、製造、流通/サービス、公共、通信など様々な業界で3000社以上のビジネスパートナーとして、お客様の事業の成長に貢献しています。詳細は以下をご参照ください。http://www.tis.co.jp/

TISインテックグループについて

TISインテックグループはグループ会社約60社、2万人が一体となって、それぞれの強みを活かし、日本国内および海外の金融・製造・サービス・公共など多くのお客さまのビジネスを支えるITサービスをご提供します。

本件に関するお問合わせ先

報道関係からのお問い合わせ先

TIS株式会社 企画本部 コーポレートコミュニケーション部 浄土寺/橋田
TEL:03-5337-4232 E-mail:tis_pr@ml.tis.co.jp

本件に関するお問い合わせ先

TIS株式会社 サービス事業統括本部 ペイメントサービスユニット
フィナンシャルサービス部 担当:久保
TEL:03-5337-4297 E-mail:scorelink@ml.tis.co.jp

※ 記載されている会社名、製品名は、各社の登録商標または商標です。
※ 記載されている情報は、発表日現在のものです。最新の情報とは異なる場合がありますのでご了承ください。

更新日時:2019年11月14日 13時0分

PAGE TOP