SQL データを学ぶ

【初心者向けSQL】必要なデータを抽出してみよう【SELECT / FROM】

この記事では、下記の部分まで理解することを目指しましょう。

この記事の目標

  • SQLの第一歩「select」「from」の使い方を理解する
  • 多くのデータテーブルの中から必要な列だけ取り出す

会社でデータ分析を覚えろって、DWHのアカウントだけ与えられたけど
そもそも何をしたらいいか分からないよお。。

最近はビジネス職の人にもデータ分析を覚えてもらう風潮があるもんね。。。
大丈夫!実はビジネスに使うレベルのSQLはそんなに難しくないんだよ。
ひとつずつ見ていこう。

ahilog

DWH(データウェアハウス)にはBigQuery / Redash / Treasure Data などありますが
本記事ではBigQuery環境を想定して執筆します。

必要なデータを抽出してみよう

SELECTの説明

SQLを書く時、一番最初に書くワードがSELECTです。

SQLでは、SELECTの次に
書いたものを抽出することができます。

例えば、このようなデータテーブルがあったとします。

名前社員番号身長体重年齢趣味
相葉くん11504525音楽
伊藤さん21605033釣り
上野くん31728235サッカー
江頭さん41544540野球
小山さん51665125ゲーム
table.1:社員のプロフィール

特にDWH(データを貯める箱)には分析に使わない列も入っているので
必要なものだけ取り出す操作をします。

例えば、table.1のようなデータがあったとして
アナタが社員の身長と体重だけを分析に使いたいとします。

この場合は

SELECT 名前,身長,体重

と書くことによって、無数にある列から身長と体重のみを指定できます。
※複数の列を指定したいときは「,」を使って区切ります。

FROMの使い方

実はSELECTだけでは、SQLは動きません。

SQLくん

身長とか体重とかがほしいのはわかったんやが
それどこにあるん?わからんやで!

そのデータがどこにあるのか居場所を教えてあげる必要があります。
この時に使うのがFROMです。

この場合だと、table1というテーブルから取ってきてほしいので、

SELECT 名前,身長,体重
FROM table1

と書くことで動作します。

名前身長体重
相葉くん15045
伊藤さん16050
上野くん17282
江頭さん15445
小山さん16651
table2:社員の身長と体重のみ抽出した結果

無駄な列がなくなって見やすくなったし、
データも軽くなったね!

最近は何でもデータが取れちゃうから、
本当にたくさんの列(カラム)がデータに有ることも多いです。
必要なものだけ取り出せばわかりやすくなります。

ahilog

BigQueryでやってみよう

DWH(データウェアハウス)にはBigQuery / Redash / Treasure Data などありますが
本記事ではBigQuery環境を想定して執筆します。

使用するデータについて

BigQueryにtitanicのデータを格納しており、
こちらをもとに分析します。

データはtitanic_sample というフォルダの中に
titanic_logという名前で格納してあります。

ahilog

この場合、FROM titanic_sample.titanic_log と「.」をつけて
フォルダ名を書く必要があるので注意しましょう。
大抵の場合、データは何かしらのフォルダにまとめて置かれています。

タイタニック乗船者の名前と性年齢を抽出しよう

それでは、実際にBigQueryを使ってやってみましょう。

今回は
titanic_sampleの中にあるtitanic_logというテーブルから
Nameとsexとageを抽出するクエリを書くので

select
Name,sex,age
from `ahilog-analysis.titanic_sample.titanic_log`



が正解です!

いかがでしたでしょうか。

SQLは最初は難しく感じることが多いのですが、
概念を理解してしまえば、直感的にデータを操作できる便利な言語なので、
未経験の皆様もぜひ、チャレンジしてみてはいかがでしょうか。

より体系的にガッツリと勉強したい方にはUdemyがおすすめです!
リッチな動画コンテンツで豊富な知識を手に入れましょう。

キャリアアップに必要な知識を身につけよう | Udemyオンライン動画コース

  • この記事を書いた人

yutasukun

京都橘高校からの史上初東大受験・現役合格を成し遂げ 「リアルドラゴン桜」として横断幕が出たことアリ。 そんな過去の栄光も虚しく10年が経過。 今はデータアナリストとして汐留の広告代理店で バリバリはたらく毎日。

-SQL, データを学ぶ

© 2021 ahilog Powered by AFFINGER5