如何解决与Seaborn进行绘图时,如何根据年份传播绘图的日期轴?
我正在尝试通过使用Google股票价格(见https://www.kaggle.com/medharawat/google-stock-price)使用Python训练线性回归模型。 并尝试通过给定功能预测未来库存。之后,我打算将其与当前数据集中的值一起绘制。
首先,我使用日期解析器读取具有日期值的数据框,并将这两个数据框汇总为一个,以便自己拆分:
parser = lambda date: pd.datetime.strptime(date,'%m/%d/%Y')
df_test=pd.read_csv("/kaggle/input/google-stock-price/Google_Stock_Price_Test.csv",parse_dates=[0],date_parser=parser)
df_train=pd.read_csv("/kaggle/input/google-stock-price/Google_Stock_Price_Train.csv",date_parser=parser)
df=pd.concat([df_train,df_test])
然后,我将Close列的类型更改为“ float64”,并通过使用seaborn绘制了Date-Close关系:
import seaborn as sns
sns.relplot(x='Date',y='Close',data=df,kind="line")
输出为:
我已经管理了必要的列转换,直到这部分代码为止。在这一部分中,我拆分数据框架,创建并训练模型,并预测值。
from sklearn.model_selection import train_test_split
X=df[["Open","High","Low","pc"]]
y=df["Close"]
X_train,X_test,y_train,y_test = train_test_split(X,y)
from sklearn.linear_model import LinearRegression
model=LinearRegression()
model.fit(X_train,y_train)
model.score(X_test,y_test)
y_pred=model.predict(X_test)
在这部分之后我想要实现的是我想将这些预测的日期设置为将来的日期,以便将它们组合到我的数据框中并绘图。我设法为真实数据和预测数据创建了2个数据框,并合并并将它们融合到新的数据框中以进行绘制。
dates=(df[-320:]["Date"]).values
df_plot=pd.DataFrame(columns=["Date","Close"])
df_plot["Date"]=dates
df_plot["Close"]=y_test.values.transpose()
df_predd=pd.DataFrame(columns=["Predicted","Date"])
df_predd["Predicted"]=y_pred.transpose()
df_predd["Date"]=dates
df_predd["Date"]=df_predd["Date"]+pd.offsets.DateOffset(years=8) #I want to plot it as future predictions
concatenated = pd.concat([df_predd.assign(dataset='df_predd'),df_plot.assign(dataset='df_plot')],axis=0)
melted_df=pd.melt(concatenated,id_vars=["Date"],value_vars=["Predicted","Close"])
sns.relplot(x='Date',y='value',data=melted_df,hue="variable",style='variable',kind="line",height=10)
这是不需要的输出:
我想念什么?我检查了日期列的类型。现在是日期时间。我无法像上面显示的第一个图一样散布x轴。 任何帮助将不胜感激。预先感谢。
解决方法
为简化您的示例,请考虑以下两个玩具数据帧:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(1)
df_actual = pd.DataFrame(data={
"date" : pd.date_range(start="2020-01-01",periods=8,freq="MS"),"value" : np.random.randint(10,30,8),})
df_forecast = pd.DataFrame(data={
"date" : pd.date_range(start="2020-08-01",periods=4,4)
})
如果要在共享的x轴上一起绘制实际值和预测值,我想到的最简单的方法是通过添加type
列并将其馈送到hue
来区分它们Seaborn线图的参数。
通过使预测数据框的第一个值与实际数据框的最后一个值相同来记住“连接”这两行:
#first forecast value == last actual value
df_forecast.iloc[0,:] = df_actual.iloc[-1,:]
df_forecast["type"] = "forecast"
df_actual["type"] = "actual"
df = pd.concat([df_actual,df_forecast])
最后,您按如下方式创建情节:
plt.figure(figsize=(10,5))
sns.lineplot(x="date",y="value",hue="type",data=df)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。