如何解决使用matplotlib在多线图中显示误差线
我已经使用marplot lib创建了多线图,现在我想在X轴上显示每个参数的最小-最大值。我的代码如下:
import numpy as np
import pandas as pd
from pandas import DataFrame
import matplotlib.pyplot as plt
from matplotlib import pyplot as plt
import seaborn as sns
df = pd.DataFrame({'Time': ['D=0','D=2','D=5','D=X'],'Latency': [74.92,75.32,79.64,100],'Delay': [18.2,80,82,84]
})
plt.plot( 'Time','Latency',data=df,marker='s',color='black',markersize=4,linewidth=1,linestyle='--')
plt.plot( 'Time','Delay',marker='o',linestyle='-')
plt.legend()
plt.xlabel("Time")
plt.ylabel("Average Score (%)")
plt.ylim(0,100)
plt.xlim('D=0','D=X')
plt.savefig('Fig2.png',dpi=300,bbox_inches='tight')
plt.show()
我要添加的最小-最大间隔为:
Latency:
D=0 => {73.3,76}
D=2 => {73.3,80}
D=5 => {75,83.3}
D=X => {100}
Delay:
D=0 => {0,50}
D=2 => {50,100}
D=5 => {68,90}
D=X => {75,90}
非常感谢
解决方法
plt.errorbar()
绘制带有误差线的线图。它的参数与plt.plot()
非常相似。 xlim的宽度需要稍宽一些,以免误差线被绘图边界所割断。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame({'Time': ['D=0','D=2','D=5','D=X'],'Latency': [74.92,75.32,79.64,100],'Delay': [18.2,80,82,84]})
latency_min_max = np.array([(73.3,76),(73.3,80),(75,83.3),(100,100)]).T
latency_err = np.abs(latency_min_max - df['Latency'].to_numpy())
delay_min_max = np.array([(0,50),(50,100),(68,90),90)]).T
delay_err = np.abs(delay_min_max - df['Delay'].to_numpy())
plt.errorbar('Time','Latency',yerr=latency_err,data=df,marker='s',capsize=2,color='black',markersize=4,linewidth=1,linestyle='--')
plt.errorbar('Time','Delay',yerr=delay_err,marker='o',capsize=4,linestyle='-')
plt.legend()
plt.xlabel("Time")
plt.ylabel("Average Score (%)")
plt.ylim(0,100)
plt.xlim(-0.2,3.2)
plt.savefig('Fig2.png',dpi=300,bbox_inches='tight')
plt.show()
另一种方法是使用plt.fill_between
创建误差带:
plt.fill_between(df['Time'],latency_min_max[0,:],latency_min_max[1,color='red',alpha=0.2,label='Latency error')
plt.fill_between(df['Time'],delay_min_max[0,delay_min_max[1,color='blue',label='Delay error')
,
首先将错误值放在列表中:
latency_lower_err = [73.3,73.3,75,100]
latency_upper_err = [76,83.3,100]
然后从这些值中减去数据点,因为matplotlib
需要误差极限到相应数据点的距离(以绝对单位为单位):
latency_lower_err = (latency_lower_err - df['Latency']).abs()
latency_upper_err = (latency_upper_err - df['Latency']).abs()
将结果值放入列表中,其中第一个元素是较低的错误,第二个元素是较高的错误:
yerr = [latency_lower_err,latency_upper_err]
然后将呼叫从plt.plot
更改为plt.errorbar
,并添加yerr
参数:
plt.errorbar('Time',yerr=yerr,capsize=5,... )
其余参数与之前用于plt.plot
的参数相同。
结果:
也为Delay
修改了相同的逻辑,以获取该变量的错误。
您应该使用plt.errorbar
而不是plt.plot
,然后将数据点与上下限之间的差的绝对值指定为上下误差值(numpy具有方便的矢量化功能,可以做这个)。为避免误差线的上限重叠而造成混淆,我建议使用不同的颜色并更新图例。
从表示的角度看,在轴周围有一些空白可能看起来更好,因此数据看起来不会被切断-您可以相应地设置plt.xlim
和plt.ylim
。首先要感谢@JohanC。
import numpy as np
import pandas as pd
from pandas import DataFrame
import matplotlib.pyplot as plt
from matplotlib import pyplot as plt
import seaborn as sns
df = pd.DataFrame({'Time': ['D=0',84]
})
latency_limits = np.array([[73.3,[76,100]])
delay_limits = np.array([[0,50,68,75],[50,100,90,90]])
latency_errors = abs(df.Latency.values - latency_limits)
delay_errors = abs(df.Delay.values - delay_limits)
yerr = np.array([[1,1,1],[5,5,5]])
fig = plt.figure()
Latency = plt.errorbar(
x=df.Time,y=df.Latency,yerr=latency_errors,linestyle='--')
Delay = plt.errorbar(
x=df.Time,y=df.Delay,yerr=delay_errors,linestyle='-')
plt.legend((Latency,Delay),("Latency","Delay"))
plt.xlabel("Time")
plt.ylabel("Average Score (%)")
## widen both limits to give some whitespace to the plot
plt.ylim(-5,105)
plt.xlim(-0.2,3.2)
# plt.savefig('Fig2.png',bbox_inches='tight')
plt.margins(5,5)
plt.show()
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。