如何解决如何将MLB数据打印到Pandas DataFrame中?
我仍在学习如何抓取网页并可以使用一些帮助。我想将MLB数据打印到Pandas DataFrame中。
该程序似乎无法正常运行,但是我没有收到错误消息。任何建议将不胜感激。预先感谢您提供的任何帮助。
import pandas as pd
import requests
url = 'https://www.baseball-reference.com/data/war_daily_bat.txt'
headers = {'User-Agent':
'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/47.0.2526.106 Safari/537.36'}
df = pd.read_html(url)
response = requests.get(url,headers=headers)
解决方法
您不需要任何抓取操作即可完成此操作,因为内容已采用csv可读格式。
因此,您可以使用read_csv
将数据放入数据框中。熊猫还支持其他格式,例如json
和excel
(分别为read_json
和read_excel
)。
如果您想进行测试以确保可以运行:
import pandas as pd
df = pd.read_csv('https://www.baseball-reference.com/data/war_daily_bat.txt')
print(f'Head of the Data\n{df.head()}')
print(f'Data contains {df.shape[0]} rows and {df.shape[1]} columns')
这将打印出数据的第一行以及数据中的行数和列数。
,该页面包含CSV格式的文本文件。因此,用这样的大熊猫加载它:
pd.read_csv(url)
那应该可以为您提供所需的东西。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。