OpenMP任务:使用二进制搜索在列表中搜索多个键

如何解决OpenMP任务:使用二进制搜索在列表中搜索多个键

我正在尝试使用OpenMP任务构造同时搜索数组中的多个键。但是我的并行代码似乎比串行代码要慢得多。
能否请您提出一些建议以使并行代码更快?

#include<stdio.h>
#include <stdlib.h>
#include <omp.h>

int binary_search(int array[],int key,int size){
  int low=0,high=size-1;
  while(low<=high){
    int mid = (low+high)/2;
    if(array[mid]==key){
      return 1;
    }else if(key<array[mid]){
      high = mid-1;
    }else{
      low = mid+1;
    }
  }
  return 0;
}

void main(){
  int size=10000000;

  int *array = (int*)malloc(size*sizeof(int));

  // Initializes the array
  for(int i=0;i<size;i++){
    array[i] = i;
  }

  // exists array stores if the ith key is in the Original array or not
  int *exists = (int*)calloc(size,sizeof(int));

  // SERIAL REGION
  double end,start = omp_get_wtime();
  for(int key=0;key<(size);key++){
      exists[key] = binary_search(array,key,size);
  }
  end = omp_get_wtime();

  printf("\nSerial execution time : %lf\n",end-start);


  // Reset the exists array to 0 values
  for(int i=0;i<size;i++){
    exists[i]=0;
  }

  // PARALLEL REGION
  start = omp_get_wtime();
  #pragma omp parallel default(none) shared(array,size,exists)
  {
    #pragma omp single
    {
      for(int key=0;key<(size);key++){
        #pragma omp task shared(array,exists) firstprivate(key)
        {
          exists[key]=binary_search(array,size);
        }
      }
    }
  }
  end = omp_get_wtime();

  printf("\nParallel execution time : %lf\n",end-start);
}

结果如下:

序列执行时间:1.383815
并行执行时间:10.438401

编译器:GCC 5.4.0
核心:8核心
谢谢你..
编辑:包括John Bollinger建议的更改。

解决方法

我看到的最大问题是#pragma omp critical。这将导致大量不必要的锁定。您不需要关键区域,因为并行区域内部的多个线程无法访问exists的任何元素。获取和释放锁的成本相当高,而且您要花很多钱,因此有可能完全解释性能问题。

此外,您不必在并行构造的末尾使用#pragma omp taskwait,因为可以保证绑定到并行区域的所有显式任务都可以在控制权移出该构造之前完成。但是我怀疑这会导致性能问题。

更新

我做了一些实验:

  • 对我来说,原始代码的性能差异比问题描述的还要明显:〜0.39 s vs 〜14.3 s。

  • 我从用于生成任务的omp single线程切换到omp for,在我的12个虚拟核心计算机上,并行性能提高了大约一个数量级。各个运行的并行性能差异很大,但是从0.1 s到1.8 s。

  • 也许并不奇怪,当我摆脱外部omp parallel区域并将循环注释为omp parallel for

    时,看到的性能与以前类似
  • 我摆脱了明确的任务,而仅仅依靠并行的for,从并行代码(〜0.09 s;偶尔

  • 我将原始代码中的问题大小缩小了两个,四个和 八,并观察到线性扩展的时间。

这告诉我,至少在我的实现中,显式任务会带来相当大的开销。我觉得这并不奇怪。认识到为了创建显式任务,执行此操作的线程必须分配并初始化一个纪念任务数据和执行环境的对象,并且必须将该对象排队在共享任务队列上(需要同步)。然后,执行此类任务的线程必须先使任务数据出队,并设置数据和执行环境,然后才能执行任务的实际工作。

在这种情况下,对于一项耗时约40纳秒的任务,所有这些似乎都花费了约一微秒的时间。带回家的消息是避免细粒度的显式任务。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-