ストックドッグ

KatoTakahiro。金融系の会社で働くSEが株やPython、その他諸々について書いています。サービスも運営してます→http://fmbrain.work

「ビック・データで株価を読む」の感想

目次


ビッグ・データで株価を読む

ビッグ・データで株価を読む

なぜ買うのか

「株価を予測」というワードには投資家の人であれば、かなり敏感に反応するのではないでしょうか?

そして、反応の仕方は様々でしょうが、ほとんどの人が「どうせ無理だろう」と、こんな反応を返すと思います。

そういう人は決まってランダムウォーク理論やアクティブファンドの殆どがインデックスファンドの運用実績を上回っていない事実などを引っ張り出してきますね笑

それを出されると正直グゥの音も出ませんし、実際株価を予測なんてことは非常に困難だと思います。

ただ、この本は予測できちゃってるんです。

もちろん、検証の仕方によってこういった結果は大きく変動するので、なんとも言えません。

でも気になりますよね、どういった手法で、どの程度予測できているのか。

ちょっと詳しく読んでみたいなぁと思い、買いました。

この本の予測のアプローチ方法

「ビック・データ」とデカデカと表紙に書いてありますが。

この本の言うビックデータは「言葉」です。

SNSに書き込まれるテキスト、ニュースで流れてくる記事などなど。

今やtwitterやみんかぶの掲示板、毎日のニュースなど量は膨大です。

これら全部集計すると、もちろんビック・データになるので、これらを解析することで株価を予測しようと、そういうアプローチです。

なので分野で言えば自然言語処理ですね。

例えば、その日流れたニュースに「反落」というワードが多ければ、その日の日経平均は反落する可能性が高い、というのを自然言語処理によって判断させます。

私は授業なんかで軽くしか自然言語処理を勉強していないので、少し理解するのが難しい部分はありました。

全く自然言語処理が知らないと本の後半部分の理解は難しいかもしれないです。。。(Amazonレビューで☆1だったのはこういう理由ですね笑)

本の一部紹介

実際に予測し、結果がでている部分を紹介します。

http://sigfin.org/?plugin=attach&refer=SIG-FIN-010-02&openfile=SIG-FIN-010-02.pdf

本の中で紹介されている論文で、本には論文ほど詳しくは書かれていません。

これを簡単に要約すると、過去1年間のニュース記事を解析し、それを元にして作ったモデルで、一日前のニュース記事を評価します。

その評価を元に次の日の相場を「上昇」あるいは「下落」で予測します。

予測結果が上昇であれば、日経225を寄り付きで買い5日後に手仕舞いし、下落であれば日経225を空売りし5日後に手仕舞いします。

これを10年間続けたところ、予測の正答率は52.3%で年率リターンは11.3%だったそうです。

かなり大雑把な説明なので、詳細を知りたい方は論文or本を読んでください笑

ちょっと自分でも検証してみたくなる結果ですね。(できない)

なぜ言葉によるアプローチは有効なのか

数あるデータの中から「言葉によるアプローチ」を選んだ理由はなんなのでしょうか?

株価というのは人が形成するものなので、そこには心理というものが関わってきます。

心理が大きく関わっているという証拠に、例えば、晴れの日には株価は上がりやすいという統計結果がでています。

晴れの日は気分が良いから、買いが優勢で、雨や台風、雪の日は人の心理は塞ぎこみやすく、売りが優勢になるという、にわかに信じがたいですが、統計的に相関しており、もう何十年も前から存在しており、今現在も変わらない経験則です。

他にもウォール街に古くから伝わる「Sell in May and Go away 〜5月に売って逃げろ〜」という格言もあります。

これは1月から5月は株価は上がりやすく、6月から12月は株価が下がりやすいという経験則から来ているものなのですが、最近の研究でこれにはどうやら太陽の日照時間が大きく関わっていることが明らかになっています。

日が照って明るいうちは買いが優勢で、日が沈みあたりが暗くなると心理も同じように暗くなり、そしてネガティブになり、売りが優勢になると。

これだけ株価に心理というものが大きく関わっていれば、その心理を読むことである程度予測ができるのも納得です。

まとめ

読んでいて、面白かったです。

一読の価値あると思うのですが、詳しい方から見るとどうなんでしょう。

こういったアプローチもあるんだなぁと勉強になりました。