ストックドッグ

KatoTakahiro。金融系の会社で働くSEが株やPython、その他諸々について書いています。サービスも運営してます→http://fmbrain.work

ソシャゲ系会社同士の株価の相関をとってみた

目次

今日やること

ソーシャルゲーム系の会社同士の株価の相関をとります。

新作が当たれば株価が上がり、新作がハズレれば株価が下がり...

暴騰したと思えば、暴落して...

と、株価の動きが激しいソーシャルゲーム系の会社。


もう上がるときはどこまで上がるのか少し予想がつきづらいですね。

そういうときは、株価の動きが似た会社を参考にすればある程度は天井が予測できるのかな、と思ったので、とりあえずどことどこの株価の動きが似ているのかを調べてみます。

そして、その結果をseaborn(最近よく使っているpythonのライブラリ。キレイにプロットできる)を使って、プロットします。

だいたい6ヶ月分の株価を取得して、相関をとります。

結果発表

f:id:doz13189:20161112030639p:plain

上から
code_2121 : mixi
code_2432 : DeNA
code_3668 : コロプラ
code_3765 : ガンホー
code_9766 : コナミHD

行列で相関をとっています。

下と上は表示している内容が一緒なので、下半分は表現方法を変えてみました。

数値で見ると。

mixi DeNA コロプラ ガンホー コナミHD
mixi 1 -0.25963525 0.76632659 0.84763592 -0.82744506
DeNA -0.25963525 1 -0.60384986 -0.14132976 0.49656536
コロプラ 0.76632659 -0.60384986 1 0.66132166 -0.66657306
ガンホー 0.84763592 -0.14132976 0.66132166 1 -0.60877667
コナミHD -0.82744506 0.49656536 -0.66657306 -0.60877667 1

軽い考察

目を見張るのは、コナミHDmixiの逆相関具合。

マイナス0.8なので、相当強い逆相関っぷりですね!


ガンホーmixiはプラス0.8と強い相関を示しています。

ガンホーが暴落or暴騰したときはmixiの過去の株価の動きを参考にすれば、見えてくるものがありそうですね。


全体的に見ると、コナミHDDeNAは他社に対して逆相関を示しがちですね。

株価の調子の良さが出ているのだと思います。


ただ、単純に調子の良いのならDeNAのように他社にさほどの相関を見せずに上がるはずです。

コナミHDの経営は多角化していますが、今のコナミHDの調子の良さはソシャゲ部門の貢献が大きいということがこの結果からわかると思います。

ソシャゲは顧客の取り合いがあからさまにでる分野ということもあり、キレイに相関関係がでましたね。

おわり。


【参考サイト】

Lec60-65_株価のデータ解析

大統領選の世論調査はどれが正しいのかを検証してみた

目次

なぜ検証するのか?

世論調査は発表されていますが、いったいどの結果が最も真実に近いがわかりません。

ブレグジット世論調査通りで行けば、残留派が優勢であったにも関わらず結果は離脱。

世論調査という手法自体に精度の限界はありますが、その中でも最も精度の高い世論調査の結果を知りたいですよね。

世論調査は実施の仕方で大きく結果がブレるので、(日本でも実施するメディアが右派か左派かで結果が全く異なりますよね)、この検証でまともな世論調査をしているメディアを見つけ出したいと思います。

複数メディアが実施している世論調査

www.realclearpolitics.com

このHPによると、クリントン46.6、トランプ44.9で、クリントンが1.7ポイントリードという状況です。

ただ、この結果の問題点として、すべてのメディアが実施している世論調査の平均をとっている点が上げられます。

適当な調査結果も、厳密な調査結果も対等というのはまずいですよね。

実施しているメディアによって多少結果は異なりますし、実際には世論調査の結果の誤差は5ポイント程度あると言われています。

(メディア総じてクリントン応援ムードなので、一部では本当にこの世論調査は真実なのか、という声もあるほどです。)

そのため、この調査結果の数字を全面的に信用できるかというと、そうではないことがわかると思います。

なので今回は、どのメディアの世論調査最も世論の意見を反映しているかについて検証します。

対象メディア

  • FOX NewsFOX News
  • CNN/ORCCNN/ORC
  • Reuters/IpsosReuters
  • Economist/YouGovEconomist


この4つのメディアが実施している世論調査に絞り今回は検証していきます。

この4つのメディアは年初から10回〜20回ほどの世論調査を実施しているので、十分なデータ量であると判断しました。

他のメディアは実施回数があまりに少なかったです。(実施回数3,4回が多かった印象です)

検証方法

Google Trendsと各メディアの実施している世論調査の相関をとりました。

Google Trends(グーグルトレンド)は、ある単語がGoogleでどれだけ検索されているかというトレンドをグラフで見ることができるツール。

検索ワード : 「Donald Trump」& 「Hillary Clinton」

場所 : US (アメリカ合衆国国内で検索されたワードのみを計上)

現在はクリントン65、トランプ55であり、クリントンのほうが良く検索されていることがわかります。

最近、逆転してますね。

世論調査Google Trendsの関連性

Googleはネット環境のあるすべての人が使用できるツールであり、とくにアメリカ国内では圧倒的なシェアを誇ります。

そのため、Googleで検索されている数が多い = 関心度が高い と言えます。

そして、Google Trendsを利用する最も大きな理由として、データのサンプル数が十分だからです。

google Trendsのデータにブレはないと考えていいと思います。


次に、今回の大統領選の特徴的な部分として、お互いが過去に闇を抱えていることが上げられます。

トランプは過去の暴言等々、クリントンはメールの私的利用や汚職等々。

これらの真実を知りたいアメリカ国民が必死にググっていることがGoogle Trendsからも見て取れます。

クリントンのメール私的利用に関してFBIが再調査を開始したタイミングもピッタリ一致していますね。

とすると今回の大統領選に限り、Googleで検索されることはマイナス要因であることが言えます。

検索数が上がる = スキャンダラスな過去が暴かれる

とすれば、検索数が上がれば、世論調査での支持率は下がると考えると、Google Trendsの検索数と世論調査は逆相関するのではないでしょうか。

仮説

少々無理やりですが、今回の検証はGoogle Trendsと逆相関している世論調査が、最も適切に世論の意見を反映しているとします。

結果

仮説どおり、Google Trendsと逆相関を示す世論調査がありました。

グラフの見方
Poll(Trump) : 濃い赤色の線。上のメディアが実施しているトランプの支持率を表しています。
Google(Trump) : ピンク色の線。Google Trendsでトランプが検索されている数。
Poll(Clinton) : 青色の線。上のメディアが実施しているクリントンの支持率を表しています。
Google(Clinton) : 緑色の線。Google Trendsでクリントンが検索されている数。

FOX NewsFOX Newsの結果

f:id:doz13189:20161106205153p:plain



世論調査実施期間 : 6/21 〜 11/3
調査実施回数 : 計16回

トランプの検索数と世論調査の相関 : -0.2

クリントンの検索数と世論調査の相関 : -0.3

ほぼ0なので、無相関に近いと言えます。

FOX NewsFOX Newsが行っている世論調査Google Trendsに相関関係はありません。

どういった調査方法なのかは知りませんが、ここの世論調査結果ははたして信用していいのだろうか...

もちろん、仮説が正しい前提ですが...

CNN/ORCCNN/ORCの結果

f:id:doz13189:20161106205917p:plain

世論調査実施期間 : 8/13 〜 10/23
調査実施回数 : 計10回

トランプの検索数と世論調査の相関 : -0.5

クリントンの検索数と世論調査の相関 : 0.2

トランプに関して言えば、ある程度逆相関関係がありました。

しかし、-0.5なので、それほど気にするほどの数字ではありませんね。

クリントンはほぼ0です。

あまり、いい結果はでませんでした。

Reuters/IpsosReutersの結果

f:id:doz13189:20161106210401p:plain

世論調査実施期間: 6/4 〜 11/4
調査実施回数 : 計23回

トランプの検索数と世論調査の相関 : -0.8

クリントンの検索数と世論調査の相関 : -0.3


トランプに関して言えば、強い逆相関があると言えます。

ここは調査回数も多く、データが豊富だったため、ある程度の関連性が見えてきたのだと思います。

ただ、クリントンに関してはパッとしないですね。

Economist/YouGovEconomistの結果

f:id:doz13189:20161106210711p:plain

世論調査実施期間 : 6/2 〜 11/1
調査実施回数 : 計21回

トランプの検索数と世論調査の相関 : -0.7

クリントンの検索数と世論調査の相関 : -0.68


どちらも逆相関が表れました。

目視でも、逆相関している様子が伺えますね。

ここも調査回数が多かったので、いい結果が出たのだと思います。

結論

Economist/YouGovEconomistによる世論調査が最も世論の意見を反映していると、今回の検証では明らかになりました。

f:id:doz13189:20161106210711p:plain

ここの世論調査の結果では、クリントン48、トランプ45と3ポイント差をつけてクリントンがリードしていることがわかります。


この検証を通して共通して言えるのは、データ数がある程度多ければ、それだけ相関関係もはっきりと出ました。

ただ、どのメディアも実施回数がそれほど多くありませんでした。(3〜4回くらいのメディアが多数)

実施回数がそれほど多くないメディアも含めて、平均し世論調査として発表しているので、その数字はあまり信用できないのではないでしょうか。

しっかりとした調査を行っているメディアの結果を参考したいですね。


※アメリカの選挙方法は少し特徴的なので、世論調査の結果と直結しません。

統計学の知識が浅いので、いたらない点が多いと思います。なので、こんな結果もあるよ〜ぐらいで楽しんでください。

ジェイテクト 6473 〜売買記録〜

証券コード:6473

銘柄名: ジェイテクト

売買:買い

エントリー日付:2016/11/1

エントリー価格予定:成行注文1544円

保有株数:100

決済価格: 成行注文1569 円

決済日付:2016/11/1

損益: + 2111 円

損益率: + 1.3 %

保有期間: 1 日間

【買い理由】

f:id:doz13189:20161101172624p:plain

f:id:doz13189:20161101172636p:plain

下値が硬そうだったので、反発狙いで買いを入れたのですが...

よく考えると反発したあとのこと考えずに買いを入れていました。

どこまで反発したら利食いだとかはやっぱり買う前に決めておかないと。

いつもは複数のストーリーを考えるのですが、ちょっと気が緩んでいたのかも。

ここ2週間ほどは市場が元気なので、こういったアバウトな取引が許されるかもしれませんが、今の上昇トレンドが崩れたときにアバウトな取引をしていると痛い目を見ると思うので、しっかりと反省です。

【売り理由】

しっかりと反省するために出直し。。。

投資の神様からのカウンターパンチ

インベスターZ(1)

インベスターZ(1)

最近話題のマンガ、インベスターZ。

マジンガーZとダブって見えるのは私だけですか?

f:id:doz13189:20161101022345j:plain

ただ、このマンガはロケットパンチもしなければ、

f:id:doz13189:20161101022332j:plain

ブレストファイヤーで敵を焼き付くこともありません。

f:id:doz13189:20161101022421j:plain

そもそも主人公はパイロットではないし、このマンガは戦隊物でもありません。


投資に関するマンガですね!

1巻だけ読んだんですが、これは面白いです!

内容が面白いのはもちろんのこと、随所で出てくる名言が心に響くんです。

もう名言の宝庫です。


一番いいなぁと思った名言が、

主人公が一番最初の株を買ったあとに、先輩が言った言葉。

まず自分の好きな会社の株を買う。
これが投資の最初の基本だ。
そして、思い切って一歩を踏み出したヤツに神様はちょっとだけご褒美をくれる。

これがビギナーズラック!
幸運は最初にやってくる。

いい言葉ですね。

こう考えると、ビギナーズラックって神様からの応援メッセージのようにも思えますね〜。


まぁ、私は勇気を出して一歩踏み出したところに神様からカウンターパンチをもらいましたけどね!

あやうく一発KOされるところでしたよ、危ない、危ない!

「ビック・データで株価を読む」の感想

目次


ビッグ・データで株価を読む

ビッグ・データで株価を読む

なぜ買うのか

「株価を予測」というワードには投資家の人であれば、かなり敏感に反応するのではないでしょうか?

そして、反応の仕方は様々でしょうが、ほとんどの人が「どうせ無理だろう」と、こんな反応を返すと思います。

そういう人は決まってランダムウォーク理論やアクティブファンドの殆どがインデックスファンドの運用実績を上回っていない事実などを引っ張り出してきますね笑

それを出されると正直グゥの音も出ませんし、実際株価を予測なんてことは非常に困難だと思います。

ただ、この本は予測できちゃってるんです。

もちろん、検証の仕方によってこういった結果は大きく変動するので、なんとも言えません。

でも気になりますよね、どういった手法で、どの程度予測できているのか。

ちょっと詳しく読んでみたいなぁと思い、買いました。

この本の予測のアプローチ方法

「ビック・データ」とデカデカと表紙に書いてありますが。

この本の言うビックデータは「言葉」です。

SNSに書き込まれるテキスト、ニュースで流れてくる記事などなど。

今やtwitterやみんかぶの掲示板、毎日のニュースなど量は膨大です。

これら全部集計すると、もちろんビック・データになるので、これらを解析することで株価を予測しようと、そういうアプローチです。

なので分野で言えば自然言語処理ですね。

例えば、その日流れたニュースに「反落」というワードが多ければ、その日の日経平均は反落する可能性が高い、というのを自然言語処理によって判断させます。

私は授業なんかで軽くしか自然言語処理を勉強していないので、少し理解するのが難しい部分はありました。

全く自然言語処理が知らないと本の後半部分の理解は難しいかもしれないです。。。(Amazonレビューで☆1だったのはこういう理由ですね笑)

本の一部紹介

実際に予測し、結果がでている部分を紹介します。

http://sigfin.org/?plugin=attach&refer=SIG-FIN-010-02&openfile=SIG-FIN-010-02.pdf

本の中で紹介されている論文で、本には論文ほど詳しくは書かれていません。

これを簡単に要約すると、過去1年間のニュース記事を解析し、それを元にして作ったモデルで、一日前のニュース記事を評価します。

その評価を元に次の日の相場を「上昇」あるいは「下落」で予測します。

予測結果が上昇であれば、日経225を寄り付きで買い5日後に手仕舞いし、下落であれば日経225を空売りし5日後に手仕舞いします。

これを10年間続けたところ、予測の正答率は52.3%で年率リターンは11.3%だったそうです。

かなり大雑把な説明なので、詳細を知りたい方は論文or本を読んでください笑

ちょっと自分でも検証してみたくなる結果ですね。(できない)

なぜ言葉によるアプローチは有効なのか

数あるデータの中から「言葉によるアプローチ」を選んだ理由はなんなのでしょうか?

株価というのは人が形成するものなので、そこには心理というものが関わってきます。

心理が大きく関わっているという証拠に、例えば、晴れの日には株価は上がりやすいという統計結果がでています。

晴れの日は気分が良いから、買いが優勢で、雨や台風、雪の日は人の心理は塞ぎこみやすく、売りが優勢になるという、にわかに信じがたいですが、統計的に相関しており、もう何十年も前から存在しており、今現在も変わらない経験則です。

他にもウォール街に古くから伝わる「Sell in May and Go away 〜5月に売って逃げろ〜」という格言もあります。

これは1月から5月は株価は上がりやすく、6月から12月は株価が下がりやすいという経験則から来ているものなのですが、最近の研究でこれにはどうやら太陽の日照時間が大きく関わっていることが明らかになっています。

日が照って明るいうちは買いが優勢で、日が沈みあたりが暗くなると心理も同じように暗くなり、そしてネガティブになり、売りが優勢になると。

これだけ株価に心理というものが大きく関わっていれば、その心理を読むことである程度予測ができるのも納得です。

まとめ

読んでいて、面白かったです。

一読の価値あると思うのですが、詳しい方から見るとどうなんでしょう。

こういったアプローチもあるんだなぁと勉強になりました。

D3.jsで株の取引額内訳を可視化してみた

今までの株取引額内訳

総取引額(一番外の円):150,470円
利益(Profit):63,101円
損失(Loss):61,320円
税(Tax):7,438円
手数料(Commission):18,611円


総取引額は、今まで出た利益と損失を合計した数字です(税と手数料も含む)。

元手25万で始めたのですが、15万だとけっこう増減していますね。

利益と損失がトントンですね。

わずかに利益のほうが大きいですよ!!笑

可視化してみて思ったこと

今回は可視化の表現方法として、パックレイアウトを使用しました。

数字で表すより直感的でわかりやすいと思います。

可視化してみるとわかりやすいですが、手数料の多さにビックリです。

いつも100〜200株しか買わないので、手数料の比率がどうしても多くなってしまうので仕方のないことなのですが...

ちなみに可視化には、javascriptのライブラリの一つであるD3.jsを利用しました。

表現方法が豊富で最近、よく使っています。

ソースコード

<script src="http://d3js.org/d3.v3.min.js" charset="utf-8"></script>

<style>
svg { width: 320px; height: 320px;}
circle { fill:"blue"; stroke: "none"; opacity:0.25; stroke-width: 3px;}
text { font-size: 10pt; text-anchor: middle; fill: white; opacity: 0; }
</style>


<script type="text/javascript">

var dataSet = {
	value : 150470,
	children : [
		{value : 63101, name : "Profit"},
		{value : 61320, name : "Loss"},
		{value : 7438, name : "tax"},
		{value : 18611, name : "Commission"}
	]
}


var color = d3.scale.category10();

var bubble = d3.layout.pack()
	.size([320, 320])

var pack = d3.select("#myGraph")
	.selectAll("g")
	.data(bubble.nodes(dataSet))
	.enter()
	.append("g")
	.attr("transform", function(d,i){
		return "translate("+ d.x + "," + d.y + ")";
	})

pack.append("circle")
	.attr("r", 0)
	.transition()
	.duration(function(d,i){
		return d.depth * 1000 + 500;
	})
	.attr("r", function(d,i){
		return d.r;
	})
	.style("stroke", function(d,i){
		return color(i);
	})
        .style("stroke-width", "2px")


pack.append("text")
	.style("opacity", 0)
	.transition()
	.duration(3000)
	.style("opacity", 1.0)
	.text(function(d,i){
		if(d.depth == 1){
			return d.name;
		}
		return null;
	})
</script>




さくらインターネット 3778 〜売買記録〜

証券コード:3778

銘柄名: さくらインターネット

売買:買い

エントリー日付:2016/10/27

エントリー価格予定:成行注文1001円

保有株数:100

決済価格: 成行注文1022 円

決済日付:2016/10/27

損益: + 1711 円

損益率: + 1.7 %

保有期間: 2 日間

【買い理由】



【売り理由】

f:id:doz13189:20161029152241p:plain

今週の市場はあれほど活況だったのにも関わらず、地味な下落をし続けていました。

ボリンジャーバンドの-2σも微妙に割っているほどです。

f:id:doz13189:20161029152511p:plain

この一週間、さくらインターネットを保有していた人たちはきっと歯がゆくて仕方がなかったでしょう。

ということで私もその歯がゆい仲間入りしたい!と思い、買いを入れました。


【売り理由】

f:id:doz13189:20161029152907p:plain

歯がゆかったです。

伸びるに伸びなかったです。

なので、金曜の始値で売っぱらってやりましたよ!