本アーカイブ（またはディレクトリ）に含まれるデータは公開データを加工（主に日本語訳）したものです。
以下に各ファイルの詳細および出典を記載します。各種の権利は原著作者または許諾者に帰属します。

iris.txt

	＞アヤメのデータ
	アヤメの花について、がく片と花弁の長さ・幅を計測し、種との関係を調べたデータです。
	
	データ形式：
	タブ区切りのヘッダ付きテキストデータで、文字コードはUTF-8です。
	
	出典：
		FISHER, R. A. (1936), THE USE OF MULTIPLE MEASUREMENTS IN TAXONOMIC PROBLEMS.
		Annals of Eugenics, 7: 179–188.

boston_train.txt
boston_test.txt

	＞ボストンの住宅価格データ
	米国ボストンの506地点について、一戸建て家屋の住宅価格と関連する様々な指標を調査したデータです。
	オリジナルデータを学習用と検証用に分割しています。

	データ形式：
	タブ区切りのヘッダ付きテキストデータで、文字コードはUTF-8です。
	
	出典：
		Harrison, D. and Rubinfeld, D.L. (1978) Hedonic prices and the demand for clean air.
		J. Environ. Economics and Management

bank.txt

	＞銀行のテレマーケティングデータ
	ポルトガルの銀行で実施されたダイレクトマーケティングのキャンペーンに関するデータです。
	キャンペーンは定期預金の申し込みを訴求するもので、電話によって行われました。
	申し込みの有無が判明するまで、一人の顧客に対して複数回のコンタクトが試みられるケースも多くあります。
	
	本データはUCI Machine Learning Repository (http://archive.ics.uci.edu/ml/datasets/Bank+Marketing)
	から取得したデータを加工したもので、日本語訳および値の置換（yes/no → 1/0 など）を行っています。
	上記の説明についてもデータに含まれる解説を日本語訳したものです。
	
	データ形式：
	タブ区切りのヘッダ付きテキストデータで、文字コードはUTF-8です。
	
	出典：
		[Moro et al., 2011]
		S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology. 
		In P. Novais et al. (Eds.), Proceedings of the European Simulation and Modelling Conference - ESM'2011, pp. 117-121,
		Guimarães, Portugal, October, 2011. EUROSIS.
		
		Available at:
			[pdf] http://hdl.handle.net/1822/14838
			[bib] http://www3.dsi.uminho.pt/pcortez/bib/2011-esm-1.txt
