JAPAN SYSTEMS Driving for NEXT NEW with Comfort and Convenience

オープンデータからの知見⑤(福岡市博多区 ワードクラウド編)

データを活用するためのソフトウェアの発展と、データを処理するハードウェアの低価格化が、より大量のデータ分析やより高度な可視化を可能にしています。組織においてはデータからいかに知見を得て活用するかということが課題になっているのではないでしょうか

弊社でもビジネスインテリジェンスソリューションとして、いかにしてお客様が持つデータを有用な知見に変えるかということに日々取り組んでおります。

本コラムでは誰もが利用できるオープンデータの可視化から、どのような知見が得られるかを試していきたいと思います。

第4回目はジャパンシステム九州営業所がある福岡市博多区の公開データから新たな発見や知見を得られるかチャレンジしたいと思います。

博多区はJR博多駅、福岡空港、博多港を有し線路、空路、海路の主要ターミナルが近接する交通の要衝です。地図でみると近接ぶりがよくわかりますね。真ん中に位置するJR博多駅から港、空港まではそれぞれ4キロメートルほどです。

hataka.gif

空港と港がはじめて登場しました。
福岡空港、博多港に関連するデータから進めていきたいと思います。法務省が出入国管理統計統計表として公開している国籍別の入国者数の港別データをみてみることにしましょう。
(データ出典:法務省 【統計表一覧】)

ip3_01.png

福岡空港の入国者数は2016年3月まで順調に増加していたことが読み取れます。2016年4月からの急激な減少は熊本地震の影響でしょうか、その後順調に回復し2016年12月には過去最高値を更新しています。
入国者の国籍をみてみましょう

ip3_03.png

韓国の方が多いですね。博多港、福岡空港から入国された韓国の方々は2016年は95万人でした。ちなみに2016年に日本へ入国した韓国の方の総数は488万人でした。韓国の人口はおよそ5000万人ですからおおむね10人に1人が訪日し、そのうち5人に1人が博多から入国したことになりますね。

hatakaDistance.gif

博多を中心に300,600,900キロメートルの円をGoogleマップ上に描いてみました。博多からもっとも近い韓国の都市は韓国第2の都市である釜山です。博多ー釜山は空路1時間、海路で3時間ほどです。

博多からですと大阪よりも釜山のほうが近く、韓国の首都ソウルと大阪はほぼ同じ距離なんですね。

韓国の方に対し、博多のどのような情報がインターネットで表示されているのかを調べてみましょう
Google Custom Search APIを利用して「博多」の韓国語(ハングル文字)「하카타」を韓国から検索した結果を入手します。(2017年3月時点)

ページタイトル / URL ページ説明
하카타 - 나무위키 大韓民国のウィキ-博多
일본정부관광국 | 지역관광정보 | 후쿠오카현 | 하카타 日本観光協会(JNTO)-博多
하카타역 - 나무위키 大韓民国のウィキ-博多駅
하카타엑셀호텔도큐 | 도큐호텔즈 博多エクセルホテル東急|東急ホテルズ
토요코인 하카타 에키 미나미 東横イン博多駅南
하카타 도큐 레이 호텔 | 도큐호텔즈 博多東急レイホテル|東急ホテルズ
토요코인 하카타구찌 에키마에2 東横イン博多グッチ駅前
JR 규슈호텔 블로섬 하카타추오 - JR HOTEL GROUP JR九州ホテルブロッサム博多中央
아고다 :: 후쿠오카의 니시테츠 호텔 크룸 하카타 (Nishitetsu Hotel ... 福岡の西鉄ホテルクルム博多
슈퍼호텔 Inn 하카타-SuperHotel スーパーホテルInn博多-SuperHotel

博多に関する情報サイトと博多にあるホテルの韓国語(ハングル文字)ページが上位にリストされました。上記ページの韓国語テキストを全抽出してどのような情報が届けられているかを見てみましょう

wcKorean.png

ワードクラウドという方法で単語の出現頻度を可視化したものです。日本語で表記すると以下になります。

wcKoreanJp.png

単語の出現頻度の上位は「ホテル」「東急」「福岡」「博多」「レイ」「新幹線」「九州」などです、ちなみに「レイ」は東急レイホテルの「レイ」です。続いて「JR」「乗り場」「文書」「利用」「地下鉄」などホテルと鉄道関係のワードが多いのがわかりますね

次に入国者が多い台湾(繁体字)を見てみることにしましょう

wcZh-tw.png

漢字ですので、大体わかりますね。念のため日本語表記を見てみましょう。

wcZh-twJp.png

上位は「ホテル」「東急」「福岡」「博多」と韓国語と同じ結果でした。
Googleの検索結果に納得いかないと言われる読者の方もいると思いますが、Googleにて韓国、台湾から「博多」を「ハングル文字」または「繁体字」で検索した人に表示されているコンテンツは「ホテル」「東急」が多いことがわかりました。

ではGoogleにて日本からの日本語検索で「博多」を検索した結果をみてみましょう(2017年3月時点)

wcJp.png

同じ「博多」を検索しても、海外の人への検索結果と日本人への検索結果の違いがわかるのではないでしょうか。
みなさんどう思いましたでしょうか、予想どおりでしたでしょうか?
「AMU」「AMUEST」というワードご存知でしたか?
JR博多駅にある商業施設の名前だそうです。よかったら憶えておいてください。

今回は福岡市博多区に関するオープンデータの中のいくつかを可視化してみました。なにか新しい発見はありましたでしょうか

次回はジャパンシステムの東京イーストオフィスがある東京都江東区の公開データを使って新たな発見や知見を得ることにチャレンジしたいと思います。

本文書記載の図は出典元WEBサイトで公開されているデータをジャパンシステム株式会社が編集加工したものです。

データ分析を考えるコラム一覧

検索結果のワード出現頻度についての注意
本コラムに掲載したワード出現頻度の図は、以下理由により100%の再現性がないことをご留意ください。
・Google社はブラウザごとに検索履歴や閲覧履歴を分析してそれぞれのブラウザごとに検索結果を最適化していると言われています。同じワードの検索においてもユーザーごと、ブラウザごとに違う検索順位になることがあります。
・ウェブサイトは日々更新されるためコンテンツのワード数も日々変化します。

Adobe® Reader®

PDFファイルの閲覧には、Adobe® Reader®が必要です。

Adobe® Reader®のダウンロード

お問い合わせ