kMeans，Mean Shift クラスタリング（Python, Google Colaboratory を使用）

前準備

Python の準備（Windows，Ubuntu 上）

Windows での Python 3.10，関連パッケージ，Python 開発環境のインストール: 別ページ »で説明している．

Ubuntu では，システム Pythonを使うことができる．Python3 開発用ファイル，pip, setuptools のインストール: 別ページ »で説明している．

【サイト内の関連ページ】

【関連する外部ページ】

kMeans, MeanShift クラスタリングの例

架空データ

架空のデータの合成

N1, N2 はデータの個数．c1, c2 は平均．sd1, sd2 は標準偏差．

import numpy as np
N1 = 10
N2 = 10
c1 = (0, 0)
c2 = (3, 5)
sd1 = 1
sd2 = 1
a1 = np.zeros((N1, 2))
a1[:,0] = np.random.normal(c1[0], sd1, N1)
a1[:,1] = np.random.normal(c1[1], sd1, N1)
a2 = np.zeros((N2, 2))
a2[:,0] = np.random.normal(c2[0], sd2, N2)
a2[:,1] = np.random.normal(c2[1], sd2, N2)
a = np.concatenate([a1, a2])
print(a)

プロットして確認

20 個のデータがプロットされている

%matplotlib inline
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')   # Suppress Matplotlib warnings
plt.style.use('ggplot')
plt.plot(a[:,0], a[:,1],  'ro')
plt.show()

kMeans クラスタリング

このデータを使い，クラスタリングを行う．クラスタ数は 3 に設定．

from sklearn.cluster import KMeans
c = KMeans(n_clusters = 2).fit_predict(a)
print(c)

MeanShift クラスタリング

このデータを使い，クラスタリングを行う．

from sklearn.cluster import MeanShift
c = MeanShift().fit_predict(a)
print(c)

Iris データセット

ここでは，iris をクラスタリングする．

Iris データセットの読み込み

import pandas as pd
import seaborn as sns
sns.set()

iris = sns.load_dataset('iris')

Iris データセットの表示

print(iris)

Iris データセットを，数値の行列に変換

文字列 'setosa'，'versicolor'，'virginica' は，1, 2, 3 に置き換え．

a = iris.values
a[:,4] = iris['species'].map({'setosa':1, 'versicolor':2, 'virginica': 3}).values
print(a)

（以下省略）

kMeans クラスタリング

このデータの 0, 1, 2, 3 行目を使い，クラスタリングを行う．クラスタ数は 3 に設定．

x = a[:,(0, 1, 2, 3)]
from sklearn.cluster import KMeans
c = KMeans(n_clusters = 3).fit_predict(x)
print(c)

MeanShift クラスタリング

このデータの 0, 1, 2, 3 行目を使い，クラスタリングを行う．

x = a[:,(0, 1, 2, 3)]
from sklearn.cluster import MeanShift
c = MeanShift().fit_predict(x)
print(c)

本サイトは金子邦彦研究室のWebページである．

資料等の公開では，原則，「クリエイティブコモンズ BY NC SA」として公開するようにしている． PDFファイル，パワーポイントファイルなどには，「クリエイティブコモンズ BY NC SA」を明記するとともに，ロゴを記載するようにしている（作業が間に合っていない分もあるのでご容赦ください）．

公開している資料をご利用になる場合の，再配布の条件，剽窃の防止などについて，別ページ »で説明再配布や資料改変の際には，そのページをご確認ください．

サイトマップは，サイトマップのページをご覧下さい．本サイト内の検索は，サイト内検索のページをご利用下さい．

問い合わせ先：金子邦彦（かねこくにひこ） [image]