南开大学物联网工程专业《并行程序设计》作业及答案5

SSE intrinsics_mm_store_ps命令的功能是()。

A.对齐向量存单精度浮点数

B.未对齐向量存单精度浮点数

C.对齐标量存单精度浮点数

D.未对齐标量存单精度浮点数

本题答案：
A

for (i=0;i<16;i+=1){L=A[i+0]-B[i+0];D=D+abs(L);}，此循环()。

A.可完全向量化

B.不可向量化

C.不确定

D.可部分向量化

本题答案：
D

对这样的循环for(i=0;i<100;i+=1) A[i+0]=A[i+0]+B[i+0]; 进行向量化，基本技术手段是()。

A.循环划分

B.循环消除

C.循环展开

D.以上皆错

本题答案：
C

MMX有()个专用寄存器。

A.4

B.8

C.16

D.32

本题答案：
B

编译器编译OpenMP并行循环时，会自动生成一些代码，其中不包括()。

A.创建和管理线程代码

B.循环划分给线程的代码

C.找出数据依赖的代码

D.线程同步的代码

本题答案：
C

创建线程时，我们通过()将线程号分别传递给每个线程。

A.全局变量

B.局部变量

C.动态分配变量

D.pthread_create的“线程函数参数”参数

本题答案：
D

下列哪项不是这门课程的目标?()

A.学会肯定能优化程序性能的方法

B.学会用并行思维思考问题

C.学会常用的并行编程工具

D.理解软件到并行架构的映射

本题答案：
A

编写n个数求和的OpenMP程序，最高效的方法是()。

A.多线程直接并发累加到共享变量

B.将累加操作设置为临界区

C.在累加操作前设置障碍

D.采用归约指令

本题答案：
D

静态线程编程模式的缺点是()。

A.线程管理开销高

B.系统资源利用率低

C.线程负载不均

D.线程通信开销高

本题答案：
B

采用MPI主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是()。

A.更有利于负载均衡

B.减少了通信开销

C.降低了计算次数

D.减少了从进程空闲

本题答案：
B

MPI收发各一条消息的API是()。

A.MPI_Sendrecv

B.MPI_Send

C.MPI_Recv

D.MPI_Replace

本题答案：
A

两个矩阵相乘，若矩阵规模大于cache大小，则优化访存的可行方法是()。

A.先将两个矩阵读入cache再进行乘法

B.先转置第一个矩阵再进行乘法

C.先转置第二个矩阵再进行乘法

D.以上皆错

本题答案：
C

多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是()。

A.读取x存在数据依赖，不能并发进行

B.累加顺序被改变，结果是错误的

C.加法操作是简单运算，无需同步

D.加法操作不是原子操作，需要同步保证数据依赖

本题答案：
D

记并行时间为T，串行时间为T'，处理器数量为p，则额外开销应如何计算?()

A.T'-T

B.T-T'

C.pT

D.pT-T'

本题答案：
D

编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行()路循环展开。

A.2

B.4

C.8

D.16

本题答案：
B

在下面问题中，SIMD并行更适合()。

A.搜索

B.排序

C.矩阵乘法

D.构建二叉排序树