在C#中用于大量IO操作的线程类型

如何解决在C#中用于大量IO操作的线程类型

我的任务是更新操作中非常单线程的c#应用程序(非gui),并向其中添加多线程以使其更快地完成工作。

每个线程将需要执行非常少量的计算,但是大多数工作将在调用并等待SQL Server请求。因此,与CPU时间相比,有很多等待。

几个要求将是:

  • 在某些有限的硬件(即仅几个内核)上运行。当前系统在“推”入时仅占用约25%的CPU。但是,由于它主要是在等待SQL Server响应(不同的服务器),因此我们希望具有比核心更多线程的功能。
  • 能够限制线程数。我也不能只拥有无限数量的线程。我不介意通过数组,列表等来限制自己。
  • 能够跟踪这些线程何时完成,以便进行一些后处理。

在我看来,.NET Framework有许多不同的线程处理方式,我不确定在此任务中是否有一种方法优于另一种。我不确定是否应该使用TaskThreadThreadPool,还有其他一些东西……async \ await模型在这种情况下不是很好,因为它等待一项特定任务完成。

解决方法

我不确定是否应该使用Task,Thread,ThreadPool等其他东西...

对于您而言,这比您想像的要重要。您可以专注于最适合您(现有)代码样式和数据流的内容。

因为它主要是在等待SQL Server响应

您的主要目标是使尽可能多的SQL查询并行进行。

能够限制线程数。

不必担心太多。在拥有25%CPU的4核上,您可以轻松拥有100个线程。有关64位的更多信息。但是您不希望有数千个线程。 .net线程至少占用1MB的空间,估计可以节省多少RAM。

因此,这取决于您的应用程序,您可以同时运行多少个查询。首先要担心线程安全。

当并行查询的数量> 1000时,您将需要async / await在更少的线程上运行。

只要它Parallel.ForEach(),Parallel.Invoke()等看起来像是很好的工具。

100-1000范围是灰色区域。

,

为其添加多线程以使其更快地处理工作队列。

每个线程将需要执行非常少量的计算,但是大多数工作将在调用并等待SQL Server请求。因此,与CPU时间相比,有很多等待。

通过这种处理,还不清楚多线程如何使您受益。多线程是并发的一种形式,并且由于您的工作负载主要是受I / O约束的,因此异步(而非多线程)将是首先要考虑的问题。

在我看来,.NET Framework有许多不同的线程处理方式,我不确定在此任务中是否有一种方法比另一种更好。

的确。作为参考,ThreadThreadPool如今已成为传统。有更好的高级API。如果将Task用作委托任务(例如Task.Factory.StartNew),也应该很少。

在我看来,异步\等待模型在这种情况下并不适合,因为它等待一个特定任务完成。

await将一次等待一个任务 ,是的。 Task.WhenAll可用于合并 多个任务,然后您可以await处理合并的任务。

让它更快地完成工作队列。

能够限制线程数。

能够跟踪这些线程何时完成,以便我可以进行一些后处理。

在我看来,TPL Dataflow是您系统的最佳方法。数据流允许您定义数据流经的“管道”,其中某些步骤是异步的(例如,查询SQL Server),而其他步骤是并行的(例如,数据处理)。

我在问一个高层次的问题,试图找回高层次的答案。

您可能对my book感兴趣。

,

在我看来,异步\等待模型在这种情况下并不适合,因为它等待一个特定任务完成。

那是错的。异步/等待只是一种语法,用于简化异步代码的状态机机制。它等待而不消耗任何线程。换句话说,async关键字不会创建线程,await不会保留任何线程。

能够限制线程数

请参阅How to limit the amount of concurrent async I/O operations?

能够跟踪这些线程何时完成,以便我可以进行一些后处理。

如果您不使用“一劳永逸”模式,则只需编写await task

就可以跟踪该任务及其异常
var task = MethodAsync();
await task;
PostProcessing();

async Task MethodAsync(){ ... }

或者对于类似的方法,您可以使用ContinueWith

var task = MethodAsync();
await task.ContinueWith(() => PostProcessing());

async Task MethodAsync(){ ... }

了解更多:

Releasing threads during async tasks

https://docs.microsoft.com/en-us/dotnet/standard/asynchronous-programming-patterns/?redirectedfrom=MSDN

,

TPL Dataflow库可能是这项工作的最佳选择之一。这是构建一个由两个块组成的简单数据流管道的方法。第一个块接受一个文件路径并产生一些中间数据,这些中间数据随后可以插入数据库中。第二个块通过将它们发送到数据库来消耗来自第一个块的数据。

var inputBlock = new TransformBlock<string,IntermediateData>(filePath =>
{
    return GetIntermediateDataFromFilePath(filePath);
},new ExecutionDataflowBlockOptions()
{
    MaxDegreeOfParallelism = Environment.ProcessorCount // What the local machine can handle
});

var databaseBlock = new ActionBlock<IntermediateData>(item =>
{
    SaveItemToDatabase(item);
},new ExecutionDataflowBlockOptions()
{
    MaxDegreeOfParallelism = 20 // What the database server can handle
});

inputBlock.LinkTo(databaseBlock);

现在,每次用户上载文件时,您只需将文件保存在临时路径中,然后将该路径发布到第一块即可:

inputBlock.Post(filePath);

就是这样。数据将从流水线的第一个块自动流到最后一个块,并根据每个块的配置进行转换和处理。

这是一个故意简化的示例,用于演示基本功能。生产就绪的实现可能会定义更多的选项,例如CancellationTokenBoundedCapacity,它将监视inputBlock.Post的返回值以防万一该块不能接受作业,可能有completion propagation,请注意databaseBlock. Completion属性中的错误等。

如果您对遵循此方法感兴趣,那么最好对库进行一些研究,以熟悉可用的选项。例如,有一个TransformManyBlock可用,适用于从单个输入产生多个输出。 BatchBlock在某些情况下也可能有用。

TPL数据流内置在.NET Core中,并且可以作为package用于.NET Framework。它有一些学习曲线,需要注意一些陷阱,但这并不可怕。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-