如何解决Seaborn的多个分类列计数图
下午好,
我一直试图找出如何可视化表中的三个分类列,并在尝试将列字符串转换为float或“ DataFrame对象没有属性'get'”的地方不断出错。
我不确定问题出在哪里,但我觉得我已经接近将数据可视化了。
我们非常感谢您对这些可视化的帮助!预先感谢!
@transform(
countplot_output=Output(os.path.join(OUTPUT_DIR,"categorical_column_bar_plots")),data=Input(INPUT_DATA_RID),)
def build_plots_for_categorical_columns(
countplot_output: Any,data: pyspark.sql.DataFrame,):
data = data.dataframe()
# Remove non-numeric columns
column_info = data.schema.fields
numeric_columns = []
non_numeric_columns = []
for column in column_info:
if column.dataType in NUMERIC_TYPES:
numeric_columns.append(column.name)
else:
non_numeric_columns.append(column.name)
non_numeric_data = data.select(non_numeric_columns)
nndd = non_numeric_data[['sensor_band','area_code','image_source_sensor']]
loguru.logger.info(f"DATA REPORT: Non-numeric columns are {non_numeric_columns}.")
countplot_validation_object = Validation()
for column in nndd.columns:
# Sample Data
# data_to_analyze = sample_non_null(nndd,column,SAMPLE_SIZE) (not currently in use)
countplot = sns.countplot(x='sensor_band',data=nndd)
countplot_validation_object.add_image(column,countplot)
plt.clf()
countplot_validation_object.save(countplot_output)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。