如何解决SAS在小数点末尾舍弃一个数字
我正在尝试为每个记录添加一个具有相同值的变量。我创建了大约10个这些变量(每个变量都有不同的值)。对于其中一个,SAS不会保留最后一位(1)。我曾尝试过调整格式以使其更长,但与其添加1,不如将其添加到右侧。
这是代码示例:
data createnewvars;
set original;
variable1=39.5652749413775;
variable2=0.359365098601411;
format variable1 17.13 variable2 18.15;
run;
当我查看数据时,variable2的值= 0.359365098601410。 仅供参考,当我缩短variable2 = 0.3593650986014的格式值(例如17.13)时,可以预期。
有什么办法解决这个问题吗?
解决方法
首先:您问题的实际答案;那么如果您感兴趣的话,还可以讨论数字的存储方式。
SAS能够存储您所显示的数字(即使如此,也可以说足够好),但是它向您隐藏了一些精度,基本上是想变得很好-用第15个十进制数字进行数学运算很棘手,因为您在失去实际精度之前几乎没有空间。
但是,有一个选项可以告诉SAS表现自己并显示其全部功能。 DECIMALCONV系统选项。默认情况下,它设置为COMPAT,这与SAS的旧版本保持一致。但是,如果将其设置为STDIEEE,它将显示上述号码的所有数字。注意,它不会向您显示更多更多;您确实处于精度极限。这是在SAS 9.4中添加的,因此,如果您的营业地点仍然有9.3或更早版本,请勿使用此功能。该选项也可能被Sysadmin锁定,因此请与他们核对是否在服务器环境中,并且发现该选项不允许或不起作用。
查看正在执行的以下两个数据步骤:
options decimalconv=compat;
data _null_;
variable2=0.35936509860141;
variable3=0.359365098601411;
put variable2= best18. / variable3= best18.;
run;
variable2=0.35936509860141
variable3=0.35936509860141
options decimalconv=stdieee;
data _null_;
variable2=0.35936509860141;
variable3=0.359365098601411;
put variable2= best18. / variable3= best18.;
run;
variable2=0.35936509860141
variable3=0.359365098601411
就像魔术一样,现在会显示variable3和您要求的额外1。但是,我不能足够强调,这不会影响变量中存储的内容。它只会影响它在屏幕上的显示方式(以及您在其他任何地方使用它)-它的底下始终是相同的数字,并且与大多数浮点数一样,几乎是(但不是完全)您想要的。它也正处于精度的边缘,因此,如果您要进行进一步的数学运算,则“几乎但不是完全”可能会很重要。如果您需要更高的精确度,SAS可能不是您工作的理想语言。
现在,解释一下这里发生了什么。 SAS能够存储精度高达2 ^ 53的数字,该精度几乎为16个十进制数字。但是,当您将鼠标悬停在精度极限上时,SAS往往不会很整洁地显示 ,这是因为与二的幂相关的舍入问题-由于数字是以二进制形式存储的,因此并非如此整洁地存储精确的十进制数字,就像用十进制存储“ 1/3”一样不可行。但是数字仍然在那里,都一样。
在您的示例中,SAS确实以不同的方式存储了这两个数字,尽管事实并没有以不同的方式显示它们。请参见以下内容,从您的示例开始:
data createnewvars;
variable1=39.5652749413775;
variable2=0.35936509860141;
variable3=0.359365098601411;
put variable2= best18. / variable3= best18.;
put variable2= hex16. / variable3= hex16.;
put variable2= binary64. / variable3= binary64.;
equal = variable2 - variable3;
run;
结果是:
variable2=0.35936509860141
variable3=0.35936509860141
variable2=3FD6FFD67874479F
variable3=3FD6FFD6787447B1
variable2=0011111111010110111111111101011001111000011101000100011110011111
variable3=0011111111010110111111111101011001111000011101000100011110110001
请注意,十六进制表示在末尾略有变化。那就是尾数的结尾,即SAS存储的“精确”部分。 (顺便说一下,这是假设您在Linux / Unix / Windows上运行;在IBM Mainframe上,这会有所不同,但在高级概念上类似。)实际上,它相差约1x10 -15 ,当乘以两个适当的方次幂时-请看示例中的equal
,这个数字非常接近该数字-但我们稍后再讲。
不同的部分是最后6位数字:011111
代表较短的数字,110001
代表较长的数字。这些数字分别乘以由数字的符号部分定义的2的幂,在两种情况下均为01111111101
-十进制数1021,然后将其偏移-1023,最终结果为-2 。这意味着第一个数字(二进制表示形式中的第13个数字)代表2 -3 ,下一个数字2 -4 ,依此类推。
最后6位数字代表2 -49 到2 -54 。二进制中的110001 - 011111
是010010
,即2 -50 加2 -53 。这两个数字加起来并转换为十进制数是9.99x10 -16 ,或者恰好是您丢失的1x10 -15 。另外,还记得上面SAS代码中的equal
变量吗?看一下日志-实际上等于。
那么-为什么SAS无法显示您的最后一位数字?这是因为它与后1个不完全相同-并且其偏移量小于SAS可以干净存储的量(在您的示例中,小于2个 -54 )。因此,SAS不想对您说谎,因为它能够安全,准确地存储它,因此它向您隐藏了真相。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。