如何解决格式化模拟输出的良好做法
| 这几乎是一个编程问题,但面向物理学家。 假设我正在编写一个软件,该软件将一些系统参数作为输入,然后从中计算出一些东西,在我的例子中是频谱函数$ A(k,\\ omega)$。 当我只想获取输出并将其提供给gnuplot时,我应该使程序输出一个简单的表,其中一列表示$ k $值,一列表示$ \\ omega $,另一列表示$ A(k,\ \ omega)$。 但是,那时我无法在其中存储所有其他信息,例如使用了哪些参数。也许我想在输出中存储一些其他调试信息,例如中间数量。在我的示例中,频谱函数是从自能量获得的,因此在某些情况下,我可能希望直接查看自能量。 我不想根据我想要的输出来不断修改源代码。如果\“ run \”的所有相关数据都出现在单个文件/实体中会更好,但是这样仍然很容易提取我可以提供给gnuplot的表。 不想重新发明轮子并开发出完整的文件格式,在创建,处理和存储来自计算或仿真的数据时,是否有一些“标准”最适合使用?甚至是SQL数据库格式?解决方法
有很多方法,但都不是太好。我将分享两个:
如果程序值得,我可以添加一个小的配置文件解析器。然后,我只是制作一个cofig,假设为
SimA.in
,而模拟器会生成一堆文件,其数据分别为SimA.paths
,SimA.stats
,SimA.log
等。除非名称是唯一的,并且我添加了要记录的代码版本,否则结果完全可重现,并且仿真本身具有足够的可移植性,易于管理。
如果没有,我只是包装一下代码,然后使用R作为主机。然后,我只返回所有数组和标量(R数据结构非常灵活,并且很容易转换本机R或C结构),并使用R来管理,保存/加载以及当然可视化和分析数据。此外,借助Sweave和CacheSweave,可以将整个执行,分析和报告捆绑在一起,并可以通过一个命令完全重现。
如果要使用“企业”解决方案,请尝试使用NetCDF或HDF5。但我觉得这可能是一个过大的杀伤力。
当然,必须对模拟器代码进行版本控制。但这很明显=)
, 对于我目前正在使用Python和C ++(通过SWIG)进行的项目,我计划使用简短的python脚本作为输入文件。因此,以某种方式,我将“破解源代码”以更改参数,但使用一种解释性语言,而不是一种编译语言。
目前,我打算有一个输入文件,例如parameters.py
,并使用它像from parameters import params
。但这可能过于依赖正确的语法。
params = {
\"foods\" : [\"spam\",\"beans\",\"eggs\"],\"costs\" : [199,4,1],\"customerAge\" : 23,}
另一种选择是仅在ѭ7中的脚本级别定义变量。这样就失去了很好的字典包装,但使用户更难以将其弄乱。编写一个“ parser”将那些脚本级变量放入一个漂亮的字典中可能并不难。该方法的一个优点是,用户可以参数化最初不考虑的内容-8会覆盖这些参数的先前定义。当然,如果用户覆盖了重要的内容,这可能是不好的。
foods = [\"spam\",\"eggs\"]
costs = [199,1]
customerAge = 23
parameters3.py
会使用一个类,尽管Python对缩进的顽强禁忌。 from parameters3 import params
:
class params:
foods = [\"spam\",\"eggs\"]
costs = [199,1]
customerAge = 23
为了完整起见,我还应该提到我们的C ++代码还定义了一个参数类。也就是说,在我们的实际项目中,parameters.py是对应的C ++类的SWIG包装。您会像ѭ13那样使用。但是,这仅允许在C ++类中已经声明的参数。
import parameters
params = parameters.Parameters()
params.foods = [\"spam\",\"eggs\"]
params.costs = [199,1]
params.customerAge = 23
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。