admin 管理员组

文章数量: 1184232

【feature

1· 对于连续特征来说,feature_column里面用的最多的就是Numeric column这个函数了
Numeric column函数是比较简单的,我们直接看函数def

def numeric_column(key,shape=(1,),default_value=None,dtype=dtypes.float32,normalizer_fn=None):

参数含义

参数参数说明
key特征名称,对应的列名称(字符串的识别输入,feature名字)
shapekey对应特征的shape,默认是1,但是在有些情况下,比如one-hot类型,shape就不会是1,而是实际的维度
default_value不存在的数值,给定默认值
dtype数据类型
normalizer_fn对该特征下的所有数据进行转换,如果需要进行normalize,那么就是使用normalize的函数.这里不仅仅局限于normalize,也可以是任何的转换方法,比如取对数,取指数,这仅仅是一种变换方法

2. 举例

# 设置normalizer_fn函数,给里面每个数值开方
import tensorflow as tf
sess = tf.Session()
def norm(x):return x**2
features = {'age': [[2], [3], [6],[11],[2]]}
age = tf.feature_column.numeric_column('age', normalizer_fn=norm)
print(sess.run(tf.feature_column.input_layer(features,[age])))

3. 结果

[[  4.][  9.][ 36.][121.][  4.]]

有兴趣可以看我的专栏: 今天你面试了吗?

本文标签: feature