ページ

2016年5月25日水曜日

機械学習のフレームワークTensorflowを試す3 - サンプルコードを紐解く -


前回まで環境設定と動かすまでやったので、今回から簡単なサンプルで
色々学習していきたいと思います。

サンプルコード

公式ページのIntroductionに掲載されているコードです。
import tensorflow as tf
import numpy as np

# Create 100 phony x, y data points in NumPy, y = x * 0.1 + 0.3
x_data = np.random.rand(100).astype(np.float32)
y_data = x_data * 0.1 + 0.3

# Try to find values for W and b that compute y_data = W * x_data + b
# (We know that W should be 0.1 and b 0.3, but Tensorflow will
# figure that out for us.)
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.zeros([1]))
y = W * x_data + b

# Minimize the mean squared errors.
loss = tf.reduce_mean(tf.square(y - y_data))
optimizer = tf.train.GradientDescentOptimizer(0.5)
train = optimizer.minimize(loss)

# Before starting, initialize the variables.  We will 'run' this first.
init = tf.initialize_all_variables()

# Launch the graph.
sess = tf.Session()
sess.run(init)

# Fit the line.
for step in xrange(201):
    sess.run(train)
    if step % 20 == 0:
        print(step, sess.run(W), sess.run(b))

# Learns best fit is W: [0.1], b: [0.3]
y = x * 0.1 + 0.3の数式の内、0.10.3を隠してTensorflowに
導きだしてもらうサンプルです。

事前準備

まず、最初にxの値をランダムに100個作成し
x_data = np.random.rand(100).astype(np.float32)
その値を元に数式を計算しy_dataに格納します。
y_data = x_data * 0.1 + 0.3
この時点でy_dataには100個ランダムな値が格納されています。
次の
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.zeros([1]))
y = W * x_data + b
ですが、Variableはメモリにテンソルをバッファします。
テンソルとは・・?
学習処理で扱われるデータ構造。n次元の配列。
tf.random_uniform([1], -1.0, 1.0)では一次元の配列の要素1つ[1]
-1.0から1.0までの間のランダムなテンソルを返します。
tf.zeros([1])では一次元の配列の要素1つに0を設定したテンソルを返します。
次に
loss = tf.reduce_mean(tf.square(y - y_data))
optimizer = tf.train.GradientDescentOptimizer(0.5)
train = optimizer.minimize(loss)
では、tf.square(y - y_data)y - y_dataの2乗した値が設定されたテンソル(1次元で100個の要素)をtf.reduce_meanで平均値を算出しています。 つまり元の正解の値(0.1と0.3)で計算したy_dataとランダムな値で
計算したyとを比較し間違いの度合いを算出しています。
tf.train.GradientDescentOptimizer最急降下法のアルゴリズムを
使用し間違い度合いが少なくなるように設定します。
この方法を最小二乗法というらしいです。。
ちなみに何故二乗するかは、誤差がマイナスでもプラスでも二乗する事で全てプラスになります。

学習の実行

最後に
init = tf.initialize_all_variables()

# Launch the graph.
sess = tf.Session()
sess.run(init)

# Fit the line.
for step in xrange(201):
    sess.run(train)
    if step % 20 == 0:
        print(step, sess.run(W), sess.run(b))
学習を実行させ、適当なステップ毎に値を表示させています。
実行する度に表示される値は異なりますが、だいたい0.10.3に近づいているかと思います。

0 件のコメント:

コメントを投稿