如何解决如何对数字变量进行直方图?
我想生成一个简单的数值变量X
的直方图。
我很难找到一个清晰的例子。
由于直方图要比美观更有意义,这一点很重要,所以我宁愿指定bin大小而不是让工具决定。参见:Data Scientists: STOP Randomly Binning Histograms
解决方法
直方图是了解数据分布的主要工具。因此,Splunk默认情况下会自动为原始事件查询创建直方图。因此,Splunk应该为您提供工具来创建从查询结果中提取的自己的变量的直方图是有道理的。
这可能很难找到的原因是基本答案很简单:
(your query) |rename (your value) as X
|chart count by X span=1.0
选择“可视化”并将传统的竖线直方图的图表类型设置为“柱形图”。
docs中有一个示例,描述为“按持续时间绘制交易数量”。。
span
值用于控制数据的装箱。调整此值可优化可视化效果。
警告:省略span
是合法的,但是如果这样做,X轴将被非线性压缩以消除空箱-如果您不这样做,可能会造成混乱小心观察垃圾箱标签(假设它们甚至被绘制)。
如果您使用长尾分布,则将结果划分为关注的范围可能很有用。可以使用where:
(your query) |rename (your value) as X
|where X>=0 and X<=100
|chart count by X span=1.0
或者,使用钳位function来保存超出范围的计数:
(your query) |rename (your value) as X
|eval X=max(0,min(X,100))
|chart count by X span=1.0
处理长尾的另一种方法是使用对数span
模式-span
的特殊值包括log2
和log10
(documented作为 log-span )。
如果您想同时使用非默认的span
和压缩的X轴,则可能有一个参数-但文档是含糊的。
我发现这种两阶段的方法可以实现:
(your query) |rename (your value) as X
|bin X span=10.0 as X
|chart count by X
同样,如果您不仔细注意标签,这种图表可能会误导人。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。