如何解决CSV文件到数组,没有最后一个值
因此,我对Python和神经网络领域还很陌生。我编写了一些神经网络(主要是CNN),但这些只是一些测试项目。我在教程等的大量帮助下完成了这些练习。现在,我正在尝试编写一个简单的神经网络,该网络通过一些“指标”来预测学生的学习成绩。问题在于“变量”没有按列分隔。我需要将指标分为所有指标的列表(不包含最后一个指标)和包含最后一个指标但不包含其他内容的列表。我也很确定我需要将“是”和“否”分别转换为1和0。
数据集:https://archive.ics.uci.edu/ml/datasets/student+performance
解决方法
要读取csv数据:
- 使用 read_csv 将数据加载到数据框中。指定分号作为分隔符。
- 使用列集合调整要从主数据框中提取的列
- 使用应用将列从yes \ no转换为1 \ 0
以下是供参考的csv文件的前5行:
import pandas as pd
df = pd.read_csv("student/student-mat.csv",sep=';') # read csv
dfmain = df[df.columns[:-3]] # no grade columns
dfgrade = df[df.columns[-3:]] # grade columns
for c in df.columns[16:24]: # yes\no columns
dfmain[c] = dfmain[c].apply(lambda x: 0 if str(x)=='no' else 1).astype(int) # no=0,yes=1
print(dfmain[df.columns[16:24]]) # yes\no columns
以下是解析csv数据的代码:
famsup paid activities nursery higher internet romantic famrel
0 0 0 0 1 1 0 0 1
1 1 0 0 0 1 1 0 1
2 0 1 0 1 1 1 0 1
3 1 1 1 1 1 1 1 1
4 1 1 0 1 1 0 0 1
.. ... ... ... ... ... ... ... ...
输出(是\否列)
if(pt instanceof MuaonParser.DefinationContext)
doSomething(pt);
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。