« 2017年6月 | トップページ | 2017年11月 »

2017年9月

2017年9月 2日 (土)

日本の観光地ランキング

じゃらんのデータで遊んでみた。

観光スポットがエリア、都道府県に分けられ、星と口コミと各月のオススメランキングの数値がある。今回は1ページ目に表示されるベスト30のみを扱う。

47都道府県、12ヶ月、ベスト30の枠組みにブレは無いが、オススメランキングは変わる。その時点のデータに依るためで、各観光スポットがベスト30に入っているかにはブレがある。相対的に上位のブレは小さいと思うが、下位だけでなく、気を付けておきたい。また、ランキングにはネット予約可能というじゃらんとの契約企業も入るため、それ以外とは区別して考えた方が良い。

星については平均値だが、口コミ数が小さいと揺らぎが大きいようだ。0.1位の変動は1ヶ月くらいで起こっている。

口コミ数は増加関数だが、都道府県別のベスト30のため、下限値がばらつく。都道府県別の最大の下限値を下回るものの取り扱いには注意が要る。

仮定が大きいが、他にも限界値が計算可能だ。

まず、人口の大きなところでは口コミ数が大きくなりがちだ。そこで口コミ数を都道府県人口で割った口コミ率が計算可能だ。これも都道府県別の最大の下限値を下回るものの取り扱いに注意が要る。

観光スポットの数も都道府県で異なる。同じ3位でも観光スポット数が少なければ大したことが無いかもしれない。各月での最高順位30位を観光スポットで割った最高パーセント順位が計算できる。順位は方向が逆なので、この都道府県別最高パーセント順位の最小値を上回るものの取り扱いに注意が要る。

上記の準備の上、星を見てみた。星のソートの前に口コミでソートをしてある。

J1

星の上位は黄色で示したじゃらんとの契約企業が多い。それを除外すると、口コミ数が足らないものが目立つ。

J2


それを除くと口コミ率や%順位の問題もほぼ取れる。

J3

これはじゃらんの全国ランキングトップ10を含んでいる。契約企業はともかく口コミ数が多ければ星は割りと良い指標だ。

次にその口コミ数を見てやる。

J4

これは割と問題が無い。%順位の良くないものは星の悪いものと一致する。先に星で口コミ数が重要で、ここで口コミ数に星が重要なことが分かった。ならば、両者を利用すべきだろう。

最初は星総数を使ってみた。星と口コミ数を掛ければ良い。

J5

どうも変わり映えしない。星の変化幅が小さ過ぎるのだ。そこで(星-4.0)*口コミを使ってみた。これは口コミが4と5だけであれば、5つ星口コミ数に一致する。

J6

結構良い感じだ。じゃらんの全国ランキングに近い。上高地が落ちているが、これは季節観光地だからだろう。季節情報はオススメランキングしかない。これを何とか利用してみる。

順位の方向を変えるため、31-順位を計算する。これで棒グラフを書けば、上高地なら夏に山ができる。この棒グラフは順位なので刻みが1に固定されているが、まあやらないよりはマシだろう。口コミ数をこの棒グラフに比例配分して月ごとの5つ星口コミ数を計算してみた。

まず1月

M1

いくつか見慣れないものが上位に来ている。それらはランキングに圏外の月があるもので、比例配分の結果、ランクを上げたものだ。あしかがフラワーパーク以外は1月だけで季節観光地として上位に来ているのか、30位辺りを彷徨っていたのが偶々1月だけ圏内に入ったものか判断に困る。まあ下位の者は黄色のフラグも立っているので無視すれば良いのだろうか。

M2

2月は圏外の月のあるものは全てフラグが立っている。

M3

3月では河津桜はOKだ。権現堂堤の桜はフラグが立っているが拾い上げても良いのかもしれない。

M4

4月、全てにフラグが立っているのだが、桜の季節だ。少なくとも桜と銘打ってある、弘前公園、目黒川、三春、吉野山は拾うべきか。

M5

5月、フラグ無しはスタジアム広島と上高地。花の季節なのでフラグ有りでもチューリップと限定している横浜公園は拾うのだろうか。

M6

6月、上高地が上位に来る。

M7

7月、ファーム富田が3位にランクイン。北海道の花の季節。フラグが有るも、同じ北海道では、パッチワークの路、礼文島、積丹岬がランクインしている。

M8

8月、フラグ無しに四季彩の丘、知床五湖が加わる。フラグが有るも、旭岳や弓ヶ浜は順位が高い。

M9

9月、フラグ無しで摩周湖がランクイン。

M10

10月、新入りは全てにフラグが立っているが、北海道は紅葉の季節。上位の北大イチョウ並木は拾うべきだろう。

M11

11月、あしかがフラワーパークが再度ランクイン。紅葉の季節、フラグが立つも上位の香嵐渓、東福寺辺りは拾うのか。

M12

常連強し。フラグ立つも、12月の澄んだ夜景を掬星台で見るべきだろうか。

さて、12個は面倒。月別の最高値でソートする。フラグも除去。

Ma

圏外の月の有る季節観光地はファーム富田、四季彩の丘、上高地、河津桜、スタジアム広島、知床五湖、摩周湖、昭和記念公園、神威岬と続く。どうもこれが一番良さそうだ。更に下位も表示しておく。

Mb

Mc

Md

Me

更に下位もあるが、月5つ星のlogでグラフを書くと150位から200位の辺りから急に値が小さくなる。月5つ星もここらで丁度30で日5つ星1個が限界と思えばここらまでが日本の代表的観光地と言えるのだろう。

« 2017年6月 | トップページ | 2017年11月 »

2017年11月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    

最近のトラックバック

無料ブログはココログ