重複を取り除く(1)ロードスクリプトでのDistinct

重複した行をカウントしない

こんにちは。Deckです。

今回はQlikViewでデータ分析をする際の「重複する値を取り除くにはどうすればよいか?」という疑問を解説します。

例えばこのようなデータを見てみましょう。

上はとある学校祭の予定ですが、場所や催し物にいくつか重複がありますね。

QlikViewを使い、重複する値を取り除いてみましょう。

サンプルデータはこちらからダウンロードできます。

データの準備

新規アプリを作成し、ロードスクリプト編集画面から「テーブル ファイル..」をクリックします。

ファイルを選択し、「開く」をクリックします。

単一項目のテーブルを読み込む際のDistinct

まず、読み込む項目が1つだけのLOAD文を作ってみましょう。

データのプレビューで「催し物」のみ選択して「終了」をクリックします。

生成されたスクリプトの画像の位置にDistinctを追加します。

Distinctは重複しているデータをそれぞれ1回のみ読み込みするようにする指定です。

今回のサンプルデータでは取り込みが以下のように行われます。

重複している行は1回だけ読み込まれるため、テーブル ビューワで確認するとDistinctをつけてロードした場合はとDistinctをつけない場合と比べて件数が異なっていることがわかります。

複数項目のテーブルを読み込む際のDistinct

では、複数の項目を読み込むLOAD文ではどうなるかを見てみましょう。

先ほどのLOAD文を次のように修正します。

データ ロード エディタでLOADに続くDistinctは読み込まれる項目全体が重複しているかをチェックするため、一部分のみが重複する行は省かれずに読み込みが行われます。

データ ロード エディタで使われるDistinctの解説は以上です。

次回の記事ではシートで使われるDistinctの説明をします。

QlikViewを体験してみませんか?

アイウェイズコンサルティングでは毎月QlikViewの無料ハンズオンセミナーを開催しています。 初めてQlikViewをご利用される方を対象に、QlikViewって何?ってところからQlikViewと他のBIとの違いについてもわかりやすくご説明させて頂いております。