AI导航网

栏目导航

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

xarray 在 NumPy 多维数组中加入变量名与坐标索引

程序名称：xarray

授权协议: Apache-2.0

操作系统: 跨平台

开发语言: Python

xarray 介绍

xarray 是一个开源 Python 包，它可以使处理多维数组更加简单、高效并有趣。xarray 在原始类 NumPy
多维数组中引入了标签化的变量名称和坐标索引，实现了更直观、更简洁和更加不容易出错的能力。该软件包包括一个庞大且不断增长的域无关功能库，用于使用这些数据结构进行高级分析和可视化。xarray
灵感来自同为解决数据分析任务而诞生的 pandas。

多维数组（张量）是计算科学的重要组成部分，它们涉及广泛的领域，包括物理学、天文学、地球科学、生物信息学、工程学、金融学和深度学习。在 Python
中，NumPy 提供了用于处理原始多维数组的基本数据结构和
API，但是，真实世界的数据集通常不仅仅是原始数据，它们有标签，用于编码有关数组值如何映射到空间、时间等位置的信息。所以有有了 xarray
这个项目，它在原始类 NumPy 多维数组中引入了标签化的变量名称和坐标索引，实现了更直观、更简洁和更加不容易出错的能力。

特性：

通过变量名操作多维数组，比如：x.sum(‘time’)
通过标签而不是位置选中值：x.loc[‘2014-01-01’] 或 x.sel(time=‘2014-01-01’)
基于维度名称而不是形状在多维数组上进行数学运算矢量化
灵活的 groupby split-apply-combine 操作：x.groupby(‘time.dayofyear’).mean()
基于坐标标签的数据库（例如 alignment），可以平滑地处理缺失值：x, y = xr.align(x, y, join=’outer’)
以Python字典的形式跟踪任意元数据：x.attrs

xarray 官网

http://xarray.pydata.org/en/stable/

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

RedHadoop 是一个持续优化的企业级Hadoop基础软件平台,让Hadoop大数据更简单! RedHadoop大数据工场企业版是RedHadoop公司第一款产品，简称BWE(RedHadoop BigData Works

来自 Mozilla 的 Heka 是一个用来收集和整理来自多个不同源的数据的工具，通过对数据进行收集和整理后发送结果报告到不同的目标用于进一步分析。

Apache HBase HFileHLogFile

HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC

Mincemeat-node 是使用Node.js实现的极简MapReduce框架，可以快速的部署投入工作，免去Hadoop繁琐的配置，享受随心大数据。

REEF 是微软开发的一个大数据框架。 REEF运行在YARN的上层。YARN是新一代Hadoop资源管理器，通过YARN，用户可以运行和管理同一个物理集群机上的多种作业，例如MapReduce批处理和图形处理作业。这样不仅可以巩固一个

Scribe旨在帮助Facebook处理服务器上的大量数据，正像Scribe网页所述“如经常访问Facebook，请使用Scribe。”具体而言，Scribe就是一台服务器，实时收集用网站日志信息。

HTools是一款专业的Hadoop管理工具，不管您是非专业IT人士，还是多年经验的技术人员，本工具都会为您提供优质的管理服务和轻松的操作过程，

hive让大数据飞了起来，不再需要专人写MR。平常我们都可以用基于thrift的任意语言来调用hive。

MapReduce是Google提出的一个软件架构，用于大规模数据集（大于1TB）的并行运算。概念”Map（映射）”和”Reduce（化简）”，和他们的主要思想，都是从函数式编程语言借来的，还有从矢量编程语言借来的特性。

Netflix 开源了一个叫做Suro的工具，它能够在数据被发送到不同的数据平台（如Hadoop、Elasticsearch）之前，收集不同应用服务器上的事件数据，这项创新技术具备成为大数据主流实践的潜力

小编推荐