格式化模拟输出的良好做法

如何解决格式化模拟输出的良好做法

| 这几乎是一个编程问题，但面向物理学家。假设我正在编写一个软件，该软件将一些系统参数作为输入，然后从中计算出一些东西，在我的例子中是频谱函数$ A（k，\\ omega）$。当我只想获取输出并将其提供给gnuplot时，我应该使程序输出一个简单的表，其中一列表示$ k $值，一列表示$ \\ omega $，另一列表示$ A（k，\ \ omega）$。但是，那时我无法在其中存储所有其他信息，例如使用了哪些参数。也许我想在输出中存储一些其他调试信息，例如中间数量。在我的示例中，频谱函数是从自能量获得的，因此在某些情况下，我可能希望直接查看自能量。我不想根据我想要的输出来不断修改源代码。如果\“ run \”的所有相关数据都出现在单个文件/实体中会更好，但是这样仍然很容易提取我可以提供给gnuplot的表。不想重新发明轮子并开发出完整的文件格式，在创建，处理和存储来自计算或仿真的数据时，是否有一些“标准”最适合使用？甚至是SQL数据库格式？

解决方法

有很多方法，但都不是太好。我将分享两个：如果程序值得，我可以添加一个小的配置文件解析器。然后，我只是制作一个cofig，假设为SimA.in，而模拟器会生成一堆文件，其数据分别为SimA.paths，SimA.stats，SimA.log等。除非名称是唯一的，并且我添加了要记录的代码版本，否则结果完全可重现，并且仿真本身具有足够的可移植性，易于管理。如果没有，我只是包装一下代码，然后使用R作为主机。然后，我只返回所有数组和标量（R数据结构非常灵活，并且很容易转换本机R或C结构），并使用R来管理，保存/加载以及当然可视化和分析数据。此外，借助Sweave和CacheSweave，可以将整个执行，分析和报告捆绑在一起，并可以通过一个命令完全重现。如果要使用“企业”解决方案，请尝试使用NetCDF或HDF5。但我觉得这可能是一个过大的杀伤力。当然，必须对模拟器代码进行版本控制。但这很明显=） , 对于我目前正在使用Python和C ++（通过SWIG）进行的项目，我计划使用简短的python脚本作为输入文件。因此，以某种方式，我将“破解源代码”以更改参数，但使用一种解释性语言，而不是一种编译语言。目前，我打算有一个输入文件，例如parameters.py，并使用它像from parameters import params。但这可能过于依赖正确的语法。

params = {
\"foods\" : [\"spam\",\"beans\",\"eggs\"],\"costs\" : [199,4,1],\"customerAge\" : 23,}

另一种选择是仅在ѭ7中的脚本级别定义变量。这样就失去了很好的字典包装，但使用户更难以将其弄乱。编写一个“ parser”将那些脚本级变量放入一个漂亮的字典中可能并不难。该方法的一个优点是，用户可以参数化最初不考虑的内容-8会覆盖这些参数的先前定义。当然，如果用户覆盖了重要的内容，这可能是不好的。

foods = [\"spam\",\"eggs\"]
costs = [199,1]
customerAge = 23

parameters3.py会使用一个类，尽管Python对缩进的顽强禁忌。 from parameters3 import params：

class params:
    foods = [\"spam\",\"eggs\"]
    costs = [199,1]
    customerAge = 23

为了完整起见，我还应该提到我们的C ++代码还定义了一个参数类。也就是说，在我们的实际项目中，parameters.py是对应的C ++类的SWIG包装。您会像ѭ13那样使用。但是，这仅允许在C ++类中已经声明的参数。

import parameters
params = parameters.Parameters()
params.foods = [\"spam\",\"eggs\"]
params.costs = [199,1]
params.customerAge = 23

格式化模拟输出的良好做法

如何解决格式化模拟输出的良好做法

解决方法

相关推荐