用C语言加速程式进而加速硬件速度
2008-02-23 05:26:15来源:互联网 阅读 ()
以软件配置的处理器
大多数高性能IC产品的市场都在不断地变动,追寻更先进的标准,及满足永远都在变化的系统需求。基于ASIC的架构,虽然提供了所需的性能,但却不能快速及经济地满足这些变化着的应用规格,因此,许多研发者不得不转向以软件方式配置的架构,其可在应用型处理器中融入可编程逻辑。
以软件配置的架构,其优势在于,可编程的门电路可作为应用型处理器,有机地集成进同一流水线,而作为参考对比基于协处理器的架构,通常是使用FPGA或ASSP这样单独的系统部件来减轻系统负载的,这种使用协处理器的做法,带来的是复杂的、应用上的分割,并且在应用型处理器等待结果时,造成延迟,或需实现复杂的调度机制。加之对FPGA的设计需要一个单独的研发环境,和另一支研发队伍,所带来成本上的开销也是非同一般的。
因为以软件配置的处理器可作为应用型处理器,在同一流水线中实现了可编程逻辑,所以,编译器可把算法分为硬件和软件部分,由此也降低了相关的依赖性,其结果是,您可把"硬件"当成"软件",并在单一研发环境中编写代码,使硬件和软件更优化地一同工作。无需花费巨大的研发资源来手工调校代码,只需高亮标出运算热点,编译器就会以硬件的形式实现他。这些热点区域作为扩展指令实现,应用型处理器可将其视为传统的指令,并在同一流水线中执行。此处的差异在于,扩展指令可表现为成百上千条C指令,在单一时钟周期内高效地执行和计算。
基本FIR转换器
FIR转换器可把热点区域以并行的方式实现,在此,我们讨论的重点是对一个转换器,怎样通过C的实现来硬件加速,这种优化的理念也可应用于其他算法。
可用以下方程式来描述一个FIR转换器:
t=T-1 y(n)=SUM ((h(t)*x)(n-t)) for n=0,...N-1 t=0 |
x(n)在此是输入信号,y(n)是输出信号,h(t)是FIR转换器系数,图1为一个直观的FIR函数示意图,格子内的每一点,代表了系数h(t)和数据点x(n-t)的乘积,而每条斜线上的任何乘积全部相加才能得到输出的y(n)。例1是对FIR转换器一个直接用C语言的实现方法。利用此实现,一个使用T=64和N=80的64路转换器执行完,将大约需要27230个时钟周期。而这种固有的并行架构,使他成为一个很适合于实际应用中硬件加速的候选方案。
图1:FIR函数示意图 |
例1:
void fir(short *X, short *H, short *Y, int N, int T) { int n, t, acc; short *x, *h; /* 转换器输入 */ for (n = 0; n < N; n ) { x = X; h = H; acc = (*x--) * (*h ); for(t = 1; t < T; t ) { acc = (*x--) * (*h ); } *Y = acc >> 14; X ; Y ; } } |
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
上一篇: 绝对能够测试您的C语言功力的几个问题
下一篇: C语言程式研发经典实例之一
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash