使用c#读取然后更新二进制文件中的记录的最佳方法是什么

如何解决使用c#读取然后更新二进制文件中的记录的最佳方法是什么

我正在尝试编辑二进制文件中的一些记录，但我似乎无法掌握它。

我可以读取文件，但找不到我想要编辑记录的位置，所以我可以替换。

这是我目前的代码：

public MyModel Put(MyModel exMyModel)
{
        List<MyModel> list = new List<MyModel>();

        try
        {
            IFormatter formatter = new BinaryFormatter();

            using (Stream stream = new FileStream(_exMyModel,FileMode.Open,FileAccess.Read,FileShare.Read))
            {
                while (stream.Position < stream.Length)
                {
                    var obj = (MyModel)formatter.Deserialize(stream);
                    list.Add(obj);
                }
            
                MyModel mymodel = list.FirstOrDefault(i => i.ID == exMyModel.ID);
                mymodel.FirstName = exMyModel.FirstName;
                mymodel.PhoneNumber = exMyModel.PhoneNumber;
                
                // Now I want to update the current record with this new object
                // ... code to update
            }

            return phoneBookEntry;
        }
        catch (Exception ex)
        {
            Console.WriteLine("The error is " + ex.Message);
            return null;
        }
}

我真的被困在这里了伙计们。任何帮助将不胜感激。

我已经检查了这些答案：

先谢谢你:)

解决方法

我建议只将所有对象写回流中。你也许可以只写改变的对象，然后再写一个，但我不会打扰。

首先重置流：stream.Position = 0。然后，您可以编写一个循环，使用 formatter.Serialize(stream,object)

序列化每个对象

如果这是一项编码任务，我想您在这件事上别无选择。但是你应该知道 BinaryFormatter 有各种各样的问题。它或多或少地以与存储在内存中相同的方式来保存对象。这是低效、不安全的，并且对类的更改可能会阻止您反序列化存储的对象。目前最常见的序列化方法是 json，但也有二进制替代方法，如 protobuf.net。

您如何更新文件将在很大程度上取决于您的记录是否序列化为固定长度。

变长记录

由于您在记录中使用字符串，因此字符串长度（作为序列化字节）的任何更改或影响序列化对象长度的任何其他更改都将导致无法对记录进行就地更新。

考虑到这一点，您将不得不做一些额外的工作。

首先，测试读取循环内的对象。在反序列化每个对象之前捕获当前位置，测试对象的等效性，在找到要查找的记录时保存偏移量，然后反序列化流中的其余对象......或将流的其余部分复制到MemoryStream 实例供以后使用。

接下来，将 stream.Position 和 stream.Length 设置为您正在更新的记录的起始位置，从而截断文件。将记录的新副本序列化到流中，然后将保存其余记录的 MemoryStream 复制回流中...或者捕获并序列化其余对象。

换句话说（未经测试但显示一般结构）：

public MyModel Put(MyModel exMyModel)
{
    try
    {
        IFormatter formatter = new BinaryFormatter();
        using (Stream stream = File.Open(_exMyModel))
        using (var buffer = new MemoryStream())
        {
            long location = -1;
            while (stream.Position < stream.Length)
            {
                var position = stream.Position;
                var obj = (MyModel)formatter.Deserialize(stream);
                if (obj.ID == exMyModel.ID)
                {
                    location = position;
                    stream.CopyTo(buffer);
                    buffer.Position = 0;
                    stream.Position = stream.Length = position;
                }
            }
            formatter.Serialize(stream);
            if (location > 0 && buffer.Length > 0)
            {
                buffer.CopyTo(stream);
            }
        }
        return phoneBookEntry;
    }
    catch (Exception ex)
    {
        Console.WriteLine("The error is " + ex.Message);
        return null;
    }
}

请注意，与反序列化记录然后再次序列化它们相比，保存序列化数据的 MemoryStream 通常会更快并且占用更少的内存。

静态长度记录

这不太可能，但如果您的记录类型以总是序列化为相同字节数的方式进行注释，那么您可以跳过与 {{1 }} 并截断二进制文件。在这种情况下，只需读取记录直到找到正确的记录，将流倒回该位置（读取后）并写入记录的新副本。

您必须自己检查类以查看字符串属性上的序列化修饰符属性类型，我建议使用不同的字符串值对其进行广泛测试，以确保您实际上获得相同的数据长度对于他们所有人。添加或删除单个字节会弄乱文件中的其余记录。

边缘情况 - 相同长度的字符串

由于用相同长度的数据替换记录只需要覆盖而不是重写文件，因此在获取文件的其余部分之前测试记录长度可能会有一些用处。如果你很幸运并且修改后的记录长度相同，那么只需返回到正确的位置并就地写入数据。这样，如果您有一个包含大量记录的文件，只要长度相同，您就会获得更快的更新。

正在更改格式...

你说这是一个编码任务，所以你可能不能选择这个选项，但如果你能改变存储格式......我们只能说 MemoryStream 绝对不是你的朋友。如果你可以选择的话，有很多更好的方法来做到这一点。 SQLite 是我选择的二进制格式 :)

实际上，由于这似乎是一个编码测试，因此您可能想要指出这一点。编写他们要求的代码，然后如果您有时间编写不依赖于 BinaryFormatter 的更好的格式，或者将 SQLite 用于解决问题。使用像 LinqToDB 这样的 ORM 使 SQLite 变得微不足道。向他们解释他们使用的文件格式本质上是不稳定的，应该用既稳定、受支持且高效的格式替换。