本文共 2221 字,大约阅读时间需要 7 分钟。
多个数据,进行同类型计算,最后汇总结果,怎样用C++解锁此类问题?
这个最简单了,单线程循环处理每份数据好了。
这有何难,创建一块地方,针对每份数据创建个线程执行计算,将结果写入先前创建的数据的对应地方,等各线程结束,完活。
上面的说法都对,只是不够好。
对于单线程处理,在这个多核时代,未免大马拉小车,有点浪费CPU。当问题规模变大,你准备花多长时间计算。对于多线程这个说法,从策略上来说,没有问题。但问题是你不得不手动启动线程,把结果放到共享内存里,通过thread.join()等待结束。这点操作难度,对于我大C++开发来说算啥,分分钟就搞定了。但问题又来了,现在你的老板问你要针对单份数据的处理函数,返回结果。呵呵,原来的单份数据处理函数,十有八九长成这样:RetType deal(Indata t,Retdata& r){ r=balabala;}
为多线程搞的那个为向主线程传递结果,不得不处理共享内存,现在你又要函数式操作,这绝逼不能够啊,于是乎,你不得不又写了一个:
RetType deal(Indata t){Retdata r;deal(t,r);return r;}
呵呵,我似乎闻到了坏代码的味道。
C++11中提供了操作多线程的高层次特性。
- std::packaged_task 包装的是一个异步操作,相当与外包任务,好比我大阿里把电话客服外包给某某公司。
- std::future 提供了一个访问异步操作结果的机制,这个是底层机制,在packaged_task和promise内部都有future来访问结果。
说的比较干巴,还是上代码吧!
#include#include #include using namespace std;long long jiechen(int n){ long long ret=1; for (int i=1;i<=n; i++) ret*=i; return ret;}int main(){ vector data={9,11,13,17,19}; vector > fus; for (auto i:data) { packaged_task pt(bind(jiechen,i)); fus.push_back(std::move(pt.get_future())); std::thread(std::move(pt)).detach(); } for(auto& i:fus) { i.wait(); cout< <
比较简单,就没必要解释了。跟“古老”的方案比,还是有些不同的
1. 不关心线程创建和结束2. 使用层面无共享数据,这个意味着写子线程函数时你不用小心翼翼担心线程安全问题。3. 抽象层次不同,古老方案本质上还是依靠负作用编程,新标准异步方式则某种程度上跳出了这个范畴。4,如有异常发生,新方案可以在外层处理异常。
上面说了那么多,肯定还是有同学说,引入概念(计算机领域的概念真是多啊),变的难理解了,那有我直接操作线程干活爽。我又想要好处,又想好理解,有简单的方式吗,有简单的方式吗,有简单的方式吗?
还真有:std::asyncstd::async的原型async(std::launch::async | std::launch::deferred, f, args...)
std::launch::async:在调用async就开始创建线程。
std::launch::deferred:延迟加载方式创建线程。调用async时不创建线程,直到调用了future的get或者wait时才创建线程。
std::async是让大家透懒的,工作过程是这样的:async先将异步操作用packaged_task包装起来,然后将异步操作的结果放到std::promise中,这个过程就是创造未来的过程。外面再通过future.get/wait来获取这个未来的结果。完全可以理解为:
async(func,args).get()
就是启动线程执行func并获取返回值。应用这个特性,上面的主线程代码变为: int main(){ vector data={9,11,13,17,19}; vector> fus; for (auto i:data) fus.push_back(std::async(jiechen,i)); for(auto& i:fus) { i.wait(); cout< <
std:async 不是弄出来捣乱的玩意,真的是异步编程利器,至少,在跨平台时不用改代码不是。在项目中,大家应该尽力避免直接调用低层次接口,直接调用async创建新线程。
以上是一家之言,难免偏颇,欢迎探讨。转载地址:http://zcwal.baihongyu.com/