并行计算导论(宝马娱乐在线原书第2版) 清晰PDF
并行计算导论系统介绍涉及并行计算的体系结构、编程范例、算法与应用和标准等。覆盖了并行计算领域的传统问题,并且尽可能地采用与底层平台无关的体系结构和针对抽象模型来设计算法。书中选择MPI(Message Passing Interface)、POSIX线程和OpenMP这三个应用*广泛的编写可移植并行程序的标准作为编程模型,并在不同例子中反映了并行计算的不断变化的应用组合。本书结构合理,可读性强,加之每章精心设计的习题集,更加适合教学。 本书论述清晰,示例生动,并附有大量习题,适合作为高等院校计算机及相关专业本科生和研究生的教材或参考书。原版自1993年出版第1版到2003年出版第2版以来,已在世界范围内被广泛地采用为高等院校本科生和研究生的教材或参考书。
关于“高性能计算(CPU/GPU)解决方案应用班”
通知
内容简介
各有关单位:
本书全面介绍并行计算的各个方面,包括体系结构、编程范例、算法与应用和标准等,涉及并行计算的新技术,也覆盖了较传统的算法,如排序、搜索、图和动态编程等。本书尽可能采用与底层平台无关的体系结构并且针对抽象模型来设计处落地。书中选择MPI、POSIX线程和OpenMP作为编程模型,并在不同例子中反映了并行计算的不断变化的应用组合。
随着人工智能AI、大数据Big Data、云计算Cloud
本书论述清晰,示例生动。并附有大量习题。适合作为高等院校计算机及相关专业本科生和研究生的教材或参考书。
Computing等计算机科学技术的发展和应用的普及,深度学习DL和人工智能AI成为当下最炙手可热的技术趋势,将成为技术行业基础设施的核心组成部分。GPU的价值不止体现在深度学习,在高性能计算、物联网、人工智能、生物信息、分子模拟、计算化学、材料力学、系统仿真、流体力学、机械设计、生物制药、航空动力、地质勘探、气候模拟等领域,算法越来越复杂,需要处理的海量数据越来越巨大,高性能计算能力就显得尤为重要。如今,乎所有的深度学习(机器学习)研究者都在使用GPU进行相关的研究,NVIDIA针对深度学习的计算,有一套完整的解决方案,cuDNN已经成为主流深度学习框架调用的深度学习GPU函数库,包含完整的矩阵乘法和卷积计算的实现。因此我单位举办“高性能计算(CPU/GPU)解决方案应用班”,具体由北京中科软培科技有限公司、北京并行科技股份有限公司、北京北龙超级云计算有限责任公司共同主办,由中国科学院计算机网络信息中心协办,本次培训班由权威师资主讲。
作者简介
[if !supportLists]一、[endif]培训目的:
Ananth Grama 普度大学计算机科学系的副教授,研究领域是并行和分布式系统和应用的不同方面。Anshul Gupta IBM T.3J.3Watson Research Center的研究人员,研究领域是并行算法和科学计算。George Karypis 明尼苏达大学计算机科学和工程系的副教授,研究领域是并行算法设计.数据挖掘和生物信息学等。Vipin Kumar 明尼苏达大学计算机科学与工程系的教授,美国军用高性能计算研究中心的主任,研究领域是高性能计算. 用于科学计算问题和数据挖掘的并行算法
现有硬件资源最大化利用,提供多种并行优化方案组合策略,提高并行程序设计与开发水平,熟悉常见的并行计算模式,了解深度学习的主流GPU加速解决方案;实际体验高性能计算环境,能够应对主流的超算环境;提供符合自身特点的工程计算解决方案,了解高性能计算和深度学习应用场景
目录
[if !supportLists]二、[endif]主讲专家:
第1章 并行计算介绍
1. 1 推动并行化
1. 1. 1 计算能力因素--从晶体管到
浮点运算速度
1. 1. 2 内存及磁盘速度的因素
1. 1. 3 数据通信因素
1. 2 并行计算适用范围
1. 2. 1 在工程及设计中的应用
1. 2. 2 科学计算中的应用
1. 2. 3 商业应用
1. 2. 4 计算机系统中的应用
1. 3 本书的组织及内容
1. 4 书目评注
习题
第2章 并行编程平台
2. 1 隐式并行:微处理器体系结构的
发展趋势*
2. 1. 1 流水线与超标量执行
2. 1. 2 超长指令字处理器
2. 2 内存系统性能的局限*
2. 2. 1 使用高速缓存改善有效内存延迟
2. 2. 2 内存带宽的影响
2. 2. 3 躲避内存延迟的其他方法
2. 2. 4 多线程与预取间的权衡
2. 3 并行计算平台剖析
2. 3. 1 并行平台的控制结构
2. 3. 2 并行平台的通信模型
2. 4 并行平台的物理组织
2. 4. 1 理想并行计算机的体系结构
2. 4. 2 并行计算机互连网络
2. 4. 3 网络拓扑结构
2. 4. 4 静态互连网络评价
2. 4. 5 动态互连网络评价
2, 4. 6 多处理器系统中的高速
缓存一致性
2. 5 并行计算机的通信成本
2. 5. 1 并行计算机的消息传递成本
2. 5. 2 共享地址空间计算机的通信成本
2. 6 互连网络的路由选择机制
2. 7 进程-处理器映射的影响和映射技术
2. 7. 1 图的映射技术
2. 7. 2 成本-性能平衡
2. 8 书目评注
习题
第3章 并行算法设计原则
3. 1 预备知识
3. 1. 1 分解. 任务与依赖图
3. 1. 2 粒度. 并发性与任务交互
3. 1. 3 进程和映射
3. 1, 4 进程与处理器
3. 2 分解技术
3. 2. 1 递归分解
3. 2. 2 数据分解
3. 2. 3 探测性分解
3. 2. 4 推测性分解
3. 2. 5 混合分解
3. 3 任务和交互的特点
3. 3. 1 任务特性
3. 3. 2 任务间交互的特征
3. 4 负载平衡的映射技术
3. 4. 1 静态映射方案
3. 4. 2 动态映射方案
3. 5 包含交互开销的方法
3. 5. 1 最大化数据本地性
3. 5. 2 最小化争用与热点
3. 5. 3 使计算与交互重叠
3. 5. 4 复制数据或计算
3. 5. 5 使用最优聚合交互操作
3. 5. 6 一些交互与另一些交互的重叠
3. 6 并行算法模型
3. 6. 1 数据并行模型
3. 6. 2 任务图模型
3. 6. 3 工作池模型
3. 6. 4 主-从模型
3. 6. 5 流水线模型或生产者-消费者
模型
3. 6. 6 混合模型
3. 7 书目评注
习题
第4章 基本通信操作
4. 1 一对多广播以及多对一归约
4. 1. 1 环或线性阵列
4. 1. 2 格网
4. 1. 3 超立方体
4. 1. 4 平衡二叉树
4. 1. 5 算法细节
4. 1. 6 成本分析
4. 2 多对多广播和归约
4. 2. 1 线性阵列和环
4. 2. 2 格网
4. 2. 3 超立方体
4. 2. 4 成本分析
4. 3 全归约与前缀和操作
4. 4 散发和收集
4. 5 多对多私自通信
4. 5. 1 环
4. 5. 2 格网
4. 5. 3 超立方体
4. 6 循环移位
4. 6. 1 格网
4. 6. 2 超立方体
4. 7 提高某些通信操作的速度
4. 7. 1 消息分裂和路由选择
4. 7. 2 全端口通信
4. 8 小结
4. 9 书目评注
习题
第5章 并行程序的解析建模
5. 1 并行程序中的开销来源
5. 2 并行系统的性能度量
5. 2. 1 执行时间
5. 2. 2 总并行开销
5. 2. 3 加速比
5. 2. 4 效率
5. 2. 5 成本
5. 3 粒度对性能的影响
5. 4 并行系统的可扩展性
5. 4. 1 并行程序的扩展特性
5. 4. 2 可扩展性的等效率度量
5. 4. 3 成本最优性和等效率函数
5. 4. 4 等效率函数的下界
5. 4. 5 并发度和等效率函数
5. 5 最小执行时间和最小成本
最优执行时间
5. 6 并行程序渐近分析
5. 7 其他可扩展性的度量
5. 8 书目评注
习题
第6章 使用消息传递模式编程
6. 1 消息传递编程的原理
6. 2 操作构件:发送和接收操作
6. 2. 1 阻塞式消息传递操作
6. 2. 2 无阻塞式消息传递操作
6. 3 MPI:消息传递接口
6. 3. 1 启动和终止MPI库
6. 3. 2 通信器
6. 3. 3 获取信息
6. 3. 4 发送和接收消息
6. 3. 5 实例:奇偶排序
6. 4 拓扑结构与嵌入
6. 4. 1 创建和使用笛卡儿拓扑结构
6. 4. 2 实例:Cannon的矩阵与矩阵相乘
6. 5 计算与通信重叠
6. 6 聚合的通信和计算操作
6. 6. 1 障碍
6. 6. 2 广播
6. 6. 3 归约
6. 6. 4 前缀
宝马娱乐在线, 6. 6. 5 收集
6. 6. 6 散发
6. 6. 7 多对多
6. 6. 8 实例:一维矩阵与向量相乘
6. 6. 9 实例:单源最短路径
6. 6. 10 实例:样本排序
6. 7 进程组和通信器
6. 8 书目评注
习题
第7章 共享地址空间平台的编程
7. 1 线程基础
7. 2 为什么要用线程
7. 3 POSIX线程API
7. 4 线程基础:创建和终止
7. 5 Pthreads中的同步原语
7. 5. 1 共享变量的互斥
7. 5. 2 用于同步的条件变量
7. 6 控制线程及同步的属性
7. 6. 1 线程的属性对象
7. 6. 2 互斥锁的属性对象
7. 7 线程注销
7. 8 复合同步结构
7. 8. 1 读-写锁
7. 8. 2 障碍
7. 9 设计异步程序的技巧
7. 10 OpenMP:基于命令的并行
编程标准
7. 10. 1 OpenMP编程模型
7. 10. 2 在OpenMP中指定并发任务
7. 10. 3 OpenMP中的同步结构
7. 10. 4 OpenMP中的数据处理
7. 10. 5 OpenMP库函数
7. 10. 6 OpenMP中的环境变量
7. 10. 7 显式线程与基于OpenMP编程
的比较
7. 11 书目评注
习题
第8章 稠密矩阵算法
8. 1 矩阵向量乘法
8. 1. 1 一维行划分
8. 1. 2 二维划分
8. 2 矩阵与矩阵的乘法
8. 2. 1 简单的并行算法
8. 2. 2 Cannon算法
8. 2. 3 DNS算法
8. 3 线性方程组求解
8. 3. 1 简单高斯消元算法
8. 3. 2 带部分主元选择的高斯消元算法
8. 3. 3 求解三角系统:回代法
8. 3. 4 求解线性方程组时的数值因素
8. 4 书目评注
习题
第9章 排序
9. 1 并行计算机中的排序问题
9. 1. 1 输入输出序列的存放位置
9. 1. 2 如何进行比较
9. 2 排序网络
9. 2. 1 双调排序
9. 2. 2 将双调排序映射到超立方体
和格网
9. 3 冒泡排序及其变体
9. 3. 1 奇偶转换
9. 3. 2 希尔排序
9. 4 快速排序
9. 4. 1 并行快速排序
9. 4. 2 用于CRCWPRAM的并行形式
9. 4. 3 用于实际体系结构的并行形式
9. 4. 4 主元选择
9. 5 桶和样本排序
9. 6 其他排序算法
9. 6. 1 枚举排序
9. 6. 2 基数排序
9. 7 书目评注
习题
第10章 图算法
10. 1 定义和表示
10. 2 最小生成树:Prim算法
10. 3 单源最短路径:Dijkstra算法
10. 4 全部顶点对间的最短路径
10. 4. 1 Dijkstra算法
10. 4. 2 Floyd算法
10. 4. 3 性能比较
10. 5 传递闭包
10. 6 连通分量
10. 7 稀疏图算法
10. 7. 1 查找最大独立集
10. 7. 2 单源最短路径
10. 8 书目评注
习题
第11章 离散优化问题的搜索算法
11. 1 定义与实例
11. 2 顺序搜索算法
11. 2. 1 深度优先搜索算法
11. 2. 2 最佳优先搜索算法
11. 3 搜索开销因子
11. 4 并行深度优先搜索
11. 4. 1 并行DFS的重要参数
11. 4. 2 并行DFS分析的一般框架
11. 4. 3 负载平衡方案分析
11. 4. 4 终止检测
11. 4. 5 试验结果
11. 4. 6 深度优先分支定界搜索的
并行形式
11. 4. 7 IDA*的并行形式
11. 5 并行最佳优先搜索
11. 6 并行搜索算法的加速比异常
11. 7 书目评注
习题
第12章 动态规划
12. 1 动态规划概述
12. 2 串行一元DP形式
12. 2. 1 最短路径问题
12. 2. 2 0/1背包问题
12. 3 非串行一元DP形式
12. 4 串行多元DP形式
12. 5 非串行多元DP形式
12. 6 综述与讨论
12. 7 书目评注
习题
第13章 快速傅里叶变换
13. 1 串行算法
13. 2 二进制交换算法
13. 2. 1 全带宽网络
13. 2. 2 有限带宽网络
13. 2. 3 并行快速傅里叶变换中的
额外计算
13. 3 转置算法
13. 3. 1 二维转置算法
13. 3. 2 转置算法的推广
13. 4 书目评注
习题
附录A 函数的复杂度与阶次分析
索引
张老师 计算所高性能中心工程师,本科毕业于华中科技大学,硕士毕业于中科院计算所,主要技术方向为并行计算,基因测序大数据处理。
并行计算导论(原书第2版) 清晰PDF可以从以下信息下载:
王老师 计算所高性能中心助理研究员,2006-2010清华大学工程力学学士;2010-2016清华大学流体力学博士;2016-至今从事并行算法优化研究工作。
点击这个http://www.linuxidc.com/Linux/2013-12/93755.htm 链接关注 Linux公社官方微信,关注后回复数字141882。即可得到网友的分享密码。
刘老师 中科院系统,研究领域:高性能计算,并行编程,生物医学图像处理。多年MPI/OpenMP/CUDA/OpenCL/OpenACC优化加速经验,多年大型项目移植优化经验。
如果取消关注Linux公社公众号,即使再次关注,也将无法提供本服务!
[if !supportLists]三、[endif]培训内容:
链接:http://pan.baidu.com/s/1nvJOQfR 密码:获得见上面的方法,地址失效请在下面留言。
[if !supportLists](1)[endif]CPU
------------------------------------------分割线------------------------------------------
也可以到Linux公社1号FTP服务器下载
FTP地址:ftp://ftp1.linuxidc.com
3月26日
用户名:ftp1.linuxidc.com
密码:www.linuxidc.com
在 2017年LinuxIDC.com/3月/并行计算导论(原书第2版) 清晰PDF/
下载方法见 http://www.linuxidc.com/Linux/2013-10/91140.htm
OpenMP提纲
------------------------------------------分割线------------------------------------------
本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-03/141882.htm
1、OpenMP基础:概念介绍、环境搭建、基本用法、编程模型、性能分析
2、OpenMP线程操作:线程同步、数据同步、多线程并发、并行循环计算详解
3、OpenMP任务和数据处理:数据共享模式、作用范围制导语句、task指令的使用
4、深入了解OpenMP的内存模型和硬件基础
OpenMP上机实践:
1、Hello_world、基本指令的使用、积分法计算PI
2、各种OpenMP指令实现并优化计算圆周率
3、section、task的使用、曼德博集合面积的计算、斐波那契数列
4、挑战题:利用蒙特卡洛算法计算PI、邻接列表的并行处理
3月27日
并行计算与编
基础
1、并行机体系机构与编程模型概述
[if !supportLists]①
[endif]共享存储结构
[if !supportLists]②
[endif]共享地址空间
[if !supportLists]③
[endif]消息传递
[if !supportLists]④
[endif]数据并行
[if !supportLists]⑤
[endif]SMP与GPU集群
2、 并行计算的模型与分析
[if !supportLists]①
[endif]并行执行时间评估模型
[if !supportLists]②
[endif]并行算法的效率特性
[if !supportLists]③
[endif]并行计算拓展性分析
3、MPI并行编程一
[if !supportLists]①
[endif]MPI基本概念与定义
[if !supportLists]②
[endif]MPI运行环境
[if !supportLists]③
[endif]MPI基础:MPI程序初始化与终止、进程设置与获取、消息发送与接
[if !supportLists]④
[endif]进程间的通讯:通讯模式、阻塞与非阻塞通讯
[if !supportLists]⑤
[endif]上机实践
4、MPI并行编程二
[if !supportLists]①
[endif]集合通信:数据广播、归约、分发、搜集、all
to all 通讯、归约操作
[if !supportLists]②
[endif]MPI派生数据类型
[if !supportLists]③
[endif]上机实践
[if !supportLists]5、
[endif] MPI并行编程三
[if !supportLists]①
[endif]进程组与通信子
[if !supportLists]②
[endif]虚拟拓扑:笛卡尔拓扑,图拓扑
[if !supportLists]③
[endif]上机实践
6、混合并行编程:MPI+OpenMP
[if !supportLists]①
[endif]多线程编程与openMP概述
本文由宝马娱乐在线城发布于互联网络,转载请注明出处:并行计算导论(宝马娱乐在线原书第2版) 清晰PDF
关键词: