卡盟商品预置定价 通过Kmeans聚类算法分析行业价格给商品定价

卡盟商品预置定价 通过Kmeans聚类算法分析行业价格给商品定价

卡盟类型:
进入卡盟

简介

卡盟商品预置定价 通过Kmeans聚类算法分析行业价格给商品定价

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

前言

电商中的数据维度有很多,各方各面都会有数据存在,通过对这些数据进行分析,我们就可以知道一些我们需要的信息。商品的定价对于电商销售来说有着关键的影响。比如定价多少会直接影响所获得的利益。定价太低也许销量有了却没有利润,定价太高有利润可惜卖不出去。只有合适的价格 ,才能获得市场中的一席之地。

本篇以彩妆行业下三级类目“粉饼”类目为例,数据来源是淘宝搜索“粉饼”关键词下,60%价格段销量排序的TOP400个商品。

一、聚类算法——Kmeans

Kmeans聚类算法,又叫K均值聚类算法。是一种迭代求解的聚类分析算法。预先将数据分成K组,随机选定K各对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离。把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。

Kmeans算法是数据分析中常用或者说常见的算法,属于聚类算法之一,用于对不知道明确划分界限的数据分类。电商中通常用在客户分析,构建RFM模型。

二、使用步骤 1.引入库

代码如下(示例):

 

import numpy as np
import pandas as pd 
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.externals import joblib
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MinMaxScaler

 

卡盟商品预置定价_商品如何定价_商品怎样定价

2.读入数据

代码如下:

 

data1= pd.read_csv(r'F:\灯具彩妆执行\彩妆\行业分析报告\数据\价格\粉饼.csv',encoding='utf-8')

 

3.数据检查及处理

 

data1.dtypes
data1["销售价最低"]=data1["销售价最低"].astype(np.int64)
data1["30天销售额"]=data1["30天销售额"].astype(np.int64)

 

在这里插入图片描述

在这里插入图片描述

查看数据类型卡盟商品预置定价,可得知我们的数据源中各个字段的数据类型,和共有多少个字段。将之后会用到的字段修改成方便数据处理的类型。

 

data1.info()

 

在这里插入图片描述

info函数同样可以做到这一点,不仅如此,info()还可以让我们知道这些字段中,哪些字段数据有缺失,从而让我们可以将这些数据进行处理(删减/填充)。

 

dt2 = data1[["宝贝id","销售价最低","30天销量"]]
dt2.describe()

 

在这里插入图片描述

商品如何定价_卡盟商品预置定价_商品怎样定价

describe()函数可以为我们计算出数据的数量、标准层、均值、四分位数以及最大最小值。可以更直观看出我们的数据是否有异常。这里我们看到30天销量为-1,显然是不正确的。

 

dt2 =dt2[(dt2['销售价最低']>0) & (dt2['30天销量']>0) ]
dt2.describe()

 

在这里插入图片描述

提取出所有销量>0的数据然后查看。

4.聚类分析

在确认数据没有问题后便可以开始着手进行聚类分析了。

图片示例

暂无相关图片
    暂无相关资讯
    暂无相关资讯
卡盟商品预置定价 通过Kmeans聚类算法分析行业价格给商品定价