如何解决从熊猫中的read_csv获取对象大小
我阅读了一个csv文件并找到了它的大小
import pandas as pd
data = pd.read_csv("train.csv")
data.size
我得到10692结果 但是我尝试另一种方式
y = data["Survived"]
这次,我的长度只有891。我认为必须是10692。 您想找出区别吗? 我在这里下载数据
https://www.kaggle.com/c/titanic/data?select=train.csv
解决方法
可以预期的是,由于DataFrame.size
的工作方式不同,因此它会计算DataFrame的所有值。
data = pd.DataFrame({
'A':list('abcdef'),'B':[4,5,4,4],'Survived':[7,8,9,2,3],})
print (data)
A B Survived
0 a 4 7
1 b 5 8
2 c 4 9
3 d 5 4
4 e 5 2
5 f 4 3
#3 columns x 6 rows = 18
print (data.size)
18
y = data["Survived"]
print (y)
0 7
1 8
2 9
3 4
4 2
5 3
Name: Survived,dtype: int64
#nuber of values in Series/column
print (y.size)
6
如果需要行数和列数:
print (data.shape)
(6,3)
或行数:
print (len(data))
6
,
此外,data.info()是获取有关DataFrame形状信息的另一种方法。要获得有关内存使用情况的确切“大小”,只需添加参数memory_usage =“ deep”。
,10692是数据集包含的元素总数。
它有891行和12列。
df = pd.read_csv("train.csv")
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries,0 to 890
Data columns (total 12 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 PassengerId 891 non-null int64
1 Survived 891 non-null int64
2 Pclass 891 non-null int64
.....
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。