如何解决将时间转换为指定的时间格式并应用于绘图图形的 y 轴
我目前正在尝试根据文章 An Interactive Web Dashboard with Plotly and Flask 使用 plotly
和 Flask 创建用于 Formula1 中的分析的网络仪表板。
我有 MM:SS:sss 字符串格式的单圈时间(其中 MM 是分钟,sss 是毫秒),我已经尝试(下面的 Python 脚本)使用 datetime.timedelta
将其转换为可量化的值,以便我能够绘制它们并操纵它们(例如,找出车手在几圈内的平均时间)。但是,当我尝试在 timedelta
中绘制 plotly
对象时,它们以微秒为单位显示。
是否可以以指定的时间格式创建 timedelta
对象并对其进行量化,以便 plotly
能够正确地绘制它们?
from datetime import timedelta
times = ["1:23.921","1:24.690","1:24.790"]
# convert to timedelta object
def string_con(string_time):
new_time = timedelta(minutes=int(string_time.split(
":")[0]),seconds=int((string_time.split(":")[1]).split(".")[0]),milliseconds=int((string_time.split(":")[1]).split(".")[1]))
return new_time
# compute average pace using timedelta objects
def average_pace(laps):
laps = list(map(string_con,laps))
return (sum(laps,timedelta(0))/len(laps))
print(average_pace(times))
解决方法
您需要将 timedelta
的数字内部值转换为与存储它们不同的时间单位,分别是 days
、{{1 }} 和 seconds
。
既然您说您不能自己将它们转换为字符串,那么潜在的解决方法可能是将它们转换为 microseconds
子类,该子类可以按照您想要的方式将自身转换为字符串。
要记住的一件事是 timedelta
可能包含巨大的值,必须以某种方式处理——所以只是说你想要“MM:SS.sss”格式忽略了理论上的事实也可能涉及数天和数小时。下面的函数计算它们,但仅在它们不为零时显示它们的值。
下面的代码定义了一个新的 timedelta
子类并使用它。我已经定义了子类的 MyTimeDelta
方法以返回所需格式的字符串。现在,只要新类的实例转换为字符串,就会使用前一个函数,但该类作为一个整体仍然像它的基类一样是“数字的”。子类的 __str__()
方法使用我也添加的名为 __str__()
的私有帮助方法。
_convert_units()
,
- 将文本转换为解析表示是正确的。我也使用过 Timedelta。在某些方面,使用纳秒会更简单
- 您还需要转换回轴刻度和悬停文本。我为此使用了一个实用函数
- 这一切结合在一起,您可以创建情节正确且人类可读的单圈时间图;-)
import requests
import pandas as pd
import plotly.express as px
# get some lap timing data
df = pd.concat([
pd.json_normalize(requests.get(f"https://ergast.com/api/f1/2021/7/laps/{l}.json").json()
["MRData"]["RaceTable"]["Races"][0]["Laps"][0]["Timings"]
).assign(lap=l)
for l in range(1,25)
]).reset_index(drop=True)
# convert to timedelta...
df["time"] = (
df["time"]
.str.extract(r"(?P<minute>[0-9]+):(?P<sec>[0-9]+).(?P<milli>[0-9]+)")
.apply(
lambda r: pd.Timestamp(year=1970,month=1,day=1,minute=int(r.minute),second=int(r.sec),microsecond=int(r.milli) * 10 ** 3,),axis=1,)
- pd.to_datetime("1-jan-1970").replace(hour=0,minute=0,second=0,microsecond=0)
)
# utility build display string from nanoseconds
def strfdelta(t,fmt="{minutes:02d}:{seconds:02d}.{milli:03d}"):
d = {}
d["minutes"],rem = divmod(t,10 ** 9 * 60)
d["seconds"],d["milli"] = divmod(rem,10 ** 9)
d["milli"] = d["milli"] // 10**6
return fmt.format(**d)
# build a figure with lap times data... NB use of hover_name for formatted time
fig = px.scatter(
df,x="lap",y="time",color="driverId",hover_name=df["time"].astype(int).apply(strfdelta),hover_data={"time":False},size=df.groupby("lap")["time"].transform(
lambda s: s.rank(ascending=True).eq(1).astype(int)
),)
# make figure more interesting... add best/worst and mean lap times...
fig.add_traces(
px.line(
df.groupby("lap")
.agg(
avg=("time",lambda s: s.mean()),min=("time",lambda s: s.min()),max=("time",lambda s: s.max()),)
.reset_index(),y=["avg","min","max"],).data
)
# fix up tick labels
ticks = pd.Series(range(df["time"].astype(int).min() - 10 ** 10,df["time"].astype(int).max(),10 ** 10,))
fig.update_layout(
yaxis={
"range": [
df["time"].astype(int).min() - 10 ** 10,],"tickmode": "array","tickvals": ticks,"ticktext": ticks.apply(strfdelta)
}
)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。