基于Karatsuba和Vedic算法的快速单精度浮点乘法器

易清明; 符清杆; 石敏; 骆爱文; 陈嘉文

doi:10.12178/1001-0548.2020161

基于Karatsuba和Vedic算法的快速单精度浮点乘法器

doi: 10.12178/1001-0548.2020161

易清明^{1, 2,},
符清杆¹,
石敏¹,
骆爱文¹,
陈嘉文¹

1.
暨南大学信息科学技术学院　广州　510632
2.
泰斗微电子科技有限公司　广州　510663

基金项目: 中央高校基本科研业务费专项(21620353)

详细信息

作者简介:
易清明(1965-)，女，博士，教授，主要从事信号处理、图像、SoC开发等方面的研究. E-mail：tyqm@jnu.edu.cn

中图分类号: TP332

A Fast Single-Precision Floating-Point Multiplier Based on Karatsuba and Vedic Algorithms

1.
School of Information Science and Technology, Jinan University　Guangzhou　510632
2.
Taidou Microelectronic Science and Technology Co., Ltd.　Guangzhou　510663

摘要: 针对现有的单精度浮点乘法器存在运算速度慢的问题，该文设计了一种融合Karatsuba算法和Vedic算法两者优点的快速单精度浮点乘法器。该文利用Karatsuba算法减少单精度浮点乘法器的乘法运算次数，将24 bit尾数的乘法运算分解为少位数乘法运算，获得基于3 bit和4 bit的尾数乘法架构；进一步地，利用Vedic算法对单精度浮点乘法器的尾数乘法架构进行优化，利用复杂度低、速度快的加法器实现了Karatsuba算法分解后的3 bit和4 bit的两个基本乘法运算，提高了运算速度。仿真及FPGA验证结果表明，该文设计的单精度浮点乘法器相对于基于传统的Karatsuba算法的单精度浮点乘法器、基于Vedic算法的单精度浮点乘法器，其最大运行时钟频率分别提高了约5倍和2倍。
- Karatsuba算法 /
- 乘法运算 /
- 最大运行时钟频率 /
- 单精度浮点乘法器 /
- Vedic算法
Abstract: To deal with the slow operation speed in the existing single-precision floating-point multiplier, a fast Karatsuba-based single-precision floating-point multiplier which combines the advantages of Karatsuba algorithm with the Vedic algorithm is designed in this paper. The fast Karatsuba-based multiplier decreases the multiplication-operation times of the conventional single-precision floating-point multiplier by splitting the multiplication of 24-bit mantissa into that of fewer mantissa. An improved multiplication architecture composed of the 3-bit and 4-bit mantissa is constructed and further optimized by employing the Vedic algorithm. The 3-bit and 4-bit multipliers are respectively achieved by the corresponding adders with low complexity and fast speed, leading to faster processing speed. The results of simulation and FPGA verification imply that the designed single-precision floating-point multiplier achieves approximately 5 times and 2 times higher performance in the maximum operating clock frequency, comparing to the conventional Karatsuba-based and the Vedic-based single-precision floating-point multiplier, respectively.
- Karatsuba algorithm /
- multiplication-operation /
- maximum operating clock frequency /
- single-precision floating-point multiplier /
- Vedic algorithm

图 1 浮点数乘法运算的流程框图

下载: 全尺寸图片幻灯片

图 2 浮点数乘法器的整体结构

下载: 全尺寸图片幻灯片

图 3 Vedic算法设计3 bit乘法器的流程图

下载: 全尺寸图片幻灯片

图 4 9 bit乘法器的硬件设计框图

下载: 全尺寸图片幻灯片

图 5 24 bit乘法器的硬件设计框图

下载: 全尺寸图片幻灯片

图 6 浮点数乘法器的仿真结果

下载: 全尺寸图片幻灯片

表 1 5种浮点乘法器的性能参数对比

器件类型	实现方法	逻辑单元(LE)使用数/ 逻辑单元总数 (使用率/%)	寄存器使用数/ 寄存器总数 (使用率/%)	LUTs	功耗/mW	最大时钟频率/MHz	延时拍数
Cyclone II EP2C5F256C6	基于三级流水线Karatsuba算法^[1]	1147/4608(25)	440/4608(10)	1079	41.06	59.11	8
	基于并行全加器Vedic算法^[3]	1877/4608(48)	1145/4608(25)	1767	40.73	148.28	9
	浮点数乘法IP核	917/4608(20)	530/4608(12)	864	40.59	145.79	5
	二次复用Karatsuba算法	1682/4608(37)	381/4608(8)	1592	40.88	73.86	6
	Karatsuba算法+Vedic算法	1 846/4608(40)	815/4608(18)	1691	40.38	313.58	5
Cyclone IV EEP4CE6F17C6	基于三级流水线Karatsuba算法^[1]	1157/6272(18)	440/6272(7)	1091	84.30	62.31	8
	基于并行全加器Vedic算法^[3]	1 883/6272(30)	1145/6272(18)	1776	84.48	159.06	9
	浮点数乘法IP核	922/6272(15)	530/6272(8)	868	77.27	185.74	5
	二次复用Karatsuba算法	1695/6272(27)	381/6272(6)	1592	73.29	80.89	6
	Karatsuba算法+Vedic算法	1 870/6272(30)	815/6272(13)	1597	75.27	331.35	5

下载: 导出CSV

[1]	MEHTA A, BIDHUL C B, JOSEPH S, et al. Implementation of single precision floating point multiplier using Karatsuba algorithm[C]//2013 Int Conf on Green Computing, Communication and Conservation of Energy (ICGCE). [S.l.]: IEEE, 2013: 254-256.
[2]	PALDURAI K, HARIHARAN K. FPGA implementation of delay optimized single precision floating point multiplier[C]//2015 Int Conf on Advanced Computing and Communication Systems. [S.l.]: IEEE, 2015: 1-5.
[3]	HAVALDAR S, GURUMURTHY K S. Design of Vedic IEEE 754 floating point multiplier[C]//2016 IEEE Int Conf on Recent Trends in Electronics, Information & Communication Technology (RTEICT). [S.l.]: IEEE, 2016: 1131-1135.
[4]	MAHAKALKAR S S, HARIDAS S L. Design of high performance IEEE754 floating point multiplier using Vedic mathematics[C]//2014 Int Conf on Computational Intelligence and Communication Networks. [S.l.]: IEEE, 2014: 985-988.
[5]	GOWREESRINIVAS K V, SAMUNDISWARY P. Comparative performance analysis of multiplexer based single precision floating point multipliers[C]//2017 Int Conf of Electronics, Communication and Aerospace Technology (ICECA). [S.l.]: IEEE, 2017, 2: 430-435.
[6]	KODALI R K, GUNDABATHULA S K, BOPPANA L. FPGA implementation of IEEE-754 floating point karatsuba multiplier[C]//2014 Int Conf on Control, Instrumentation, Communication and Computational Technologies (ICCICCT). [S.l.]: IEEE, 2014: 300-304.
[7]	PALEKAR S, NARKHEDE N. High speed and area efficient single precision floating point arithmetic unit[C]//2016 IEEE Int Conf on Recent Trends in Electronics, Information & Communication Technology (RTEICT). [S.l.]: IEEE, 2016: 1950-1954.
[8]	JAIN A, DASH B, PANDA A K, et al. FPGA design of a fast 32-bit floating point multiplier unit[C]//2012 International Conf on Devices, Circuits and Systems (ICDCS). [S.l.]: IEEE, 2012: 545-547.
[9]	MONTGOMERY P L. Five, six, and seven-term Karatsuba-like formulae[J]. IEEE Trans on Computers, 2005, 54(3): 362-369. doi: 10.1109/TC.2005.49
[10]	WEIMERSKIRCH A, PAAR C. Generalizations of the Karatsuba algorithm for efficient implementations[J]. IACR Cryptology ePrint Archive, 2006, 2006: 224.
[11]	ZURAS D, COWLISHAW M, AIKEN A, et al. IEEE standard for floating-point arithmetic[J]. The Institute of Electrical and Electronics Engineers, 2008, 754(2008): 1-70.
[12]	POORNIMA M, PATIL S K, SHIVUKUMAR S K P, et al. Implementation of multiplier using vedic algorithm[J]. International Journal of Innovative Technology and Exploring Engineering (IJITEE), 2013, 2(6): 219-223.

[1]	朱颖洁, 张武雄, 易辉跃, 许晖. 基于改进Chrip-Z变换的高精度频率估计算法 . 电子科技大学学报, 2024, 50(5): 1-7. doi: 10.12178/1001-0548.2022332
[2]	柏果, 程郁凡, 唐万斌. 基于两阶段加窗插值的多音信号频率估计算法 . 电子科技大学学报, 2021, 50(5): 682-688. doi: 10.12178/1001-0548.2021066
[3]	多滨, 罗俊松, 贾勇, 钟晓玲, 郭勇. 基于子空间分解类算法的高精度频率估计 . 电子科技大学学报, 2020, 49(1): 42-48. doi: 10.12178/1001-0548.2018060
[4]	王维博, 孙敬欢, 董蕊莹, 郑永康. 基于小样本的高精度室内停车场指纹定位算法 . 电子科技大学学报, 2019, 48(1): 32-38. doi: 10.3969/j.issn.1001-0548.2019.01.006
[5]	岳光荣, 刘志特, 杨国胜, 王军. 水下甚低频MSK信号最大似然多符号差分解调算法 . 电子科技大学学报, 2016, 45(4): 528-532. doi: 10.3969/j.issn.1001-0548.2016.04.005
[6]	刘怡光, 赵晨晖, 黄蓉刚, 第宝峰. 勿需图像矫正的高精度窄基线三维重建算法 . 电子科技大学学报, 2014, 43(2): 262-267. doi: 10.3969/j.issn.1001-0548.2014.02.020
[7]	杜正聪, 祝俊, 唐斌. 基于近似核DFT的多正弦信号快速检测和频率估计算法 . 电子科技大学学报, 2012, 41(2): 192-197. doi: 10.3969/j.issn.1001-0548.2012.02.004
[8]	申家全, 闫怀志. 基于DCT的探地雷达频率波数偏移优化算法 . 电子科技大学学报, 2012, 41(1): 21-24. doi: 10.3969/j.issn.1001-0548.2012.01.004
[9]	张和发, 李立萍. 含噪独立分量分析的期望最大化算法 . 电子科技大学学报, 2012, 41(4): 527-531. doi: 10.3969/j.issn.1001-0548.2012.04.009
[10]	李允, 陈昊, 晏华. 下一代汽车软件系统运行时环境通信算法的研究 . 电子科技大学学报, 2012, 41(3): 429-434. doi: 10.3969/j.issn.1001-0548.2012.03.021
[11]	魏镇韩, 陈鸣, 赵洪华. AS关系快速推断算法 . 电子科技大学学报, 2010, 39(2): 266-270,292. doi: 10.3969/j.issn.1001-0548.2010.02.024
[12]	蔡复青, 何友, 宋杰. 平移不变模式双基地SAR频率变标算法 . 电子科技大学学报, 2010, 39(2): 164-168. doi: 10.3969/j.issn.1001-0548.2010.02.002
[13]	罗岚, 秦志光, 万国根, 魏正耀. 分组密码算法认证运算模式的注记及可证安全性 . 电子科技大学学报, 2009, 38(4): 600-604. doi: 10.3969/j.issn.1001-0548.2009.04.029
[14]	孙科, 刘皓. 结合二阶负反馈环路的OFDM频率同步算法 . 电子科技大学学报, 2008, 37(3): 366-369.
[15]	黄大贵, 金振林, 冯代伟, 王强. ARM运动控制平台下高精度高速插补算法的研究 . 电子科技大学学报, 2008, 37(5): 785-788.
[16]	徐雅静, 闫晓东, 徐惠民. 高密度WLAN环境下动态频率选择算法的研究 . 电子科技大学学报, 2007, 36(5): 892-895.
[17]	杨德才, 陈光礻禹, 谢永乐. 进位保留阵列乘法器的一种内建自测试 . 电子科技大学学报, 2007, 36(4): 751-754.
[18]	李庆嵘, 马争. 虹膜定位算法研究 . 电子科技大学学报, 2002, 31(1): 7-9.
[19]	孙仁云, 焦士蓉. 一种计算汽车制动油压波动频率的算法 . 电子科技大学学报, 2001, 30(3): 267-270.
[20]	谭扬波, 陈光. 一种基于最大模糊熵的高斯聚类算法 . 电子科技大学学报, 2000, 29(3): 269-272.

点击查看大图

图(6) / 表(1)

计量

文章访问数: 4989
HTML全文浏览量: 1757
PDF下载量: 52
被引次数: 0

全文HTML

单精度浮点数乘法运算的耗时主要集中在24 bit的尾数相乘部分。为了提高单精度浮点数乘法运算的速度，研究者提出了各种单精度浮点乘法器的改进方法^[1-8]。文献[1]提出了基于Karatsuba算法^[9-10]的改进设计，通过数学运算的公式变换，用加法器代替乘法器，相比于24 bit尾数直接相乘的单精度浮点乘法器的设计，该设计减少了3个乘法器，只使用了6个乘法器。但是乘法器的使用限制了单精度浮点乘法器运算速度的进一步提高。文献[2]提出了一种基于Vedic算法^[3-4]的单精度浮点乘法器设计方法，该设计沿用了24 bit尾数直接相乘的设计思路，通过使用Vedic算法设计3 bit的乘法器，迭代复用，实现24 bit的尾数相乘运算，从而避免乘法器的使用，提高单精度浮点乘法器的运算速度。但是简单使用Vedic算法设计单精度浮点乘法器，导致Vedic算法设计的3 bit乘法器迭代次数过多，硬件资源增多。文献[3]沿用了Vedic算法的思想，利用流水线设计方法对单精度浮点乘法器结构进行优化，同时减少单精度浮点乘法器的组合逻辑延时，提高单精度浮点乘法器的运算速度，但是同样存在Vedic算法设计的3 bit乘法器迭代次数过多，硬件资源增多的问题；文献[5]在Vedic算法的基础上，通过全加器的复用来简化单精度浮点乘法器的设计结构，提高单精度浮点乘法器的运行速度，但是依然无法满足目前的运算需求。

以上文献提出的改进方法对单精度浮点乘法器的运算速度均有一定的提高，但是人工智能的兴起对浮点数乘法运算的速度提出了更高的要求，数以百万计的浮点数乘法运算造成深度学习的训练时间过长，限制了人工智能的研究与实用性。为了进一步提高单精度浮点乘法器的运算速度，本文利用Vedic算法改进了Karatsuba算法，并把该算法应用于单精度浮点乘法器设计。

5. 结束语

本文优化了Karatsuba算法并利用该算法设计了基于IEEE754标准的单精度浮点乘法器。设计充分利用了Karatsuba算法可以减少乘法器数量的优点和Vedic算法可以用简单的加法器实现乘法功能而门延迟和面积增加很缓慢的优点，通过二次复用Karatsuba算法来减少乘法器的数量，降低单精度浮点乘法器复杂度；再通过Vedic算法设计的3 bit、4 bit Vedic乘法器来替换本文设计中需要用到的3 bit乘法器和4 bit乘法器，并在Vedic算法设计的3 bit乘法器、4 bit的乘法器中运用了流水线设计方法来优化结构，提高设计的运行时钟频率、运算效率及运算速度。在相同的平台和芯片型号下，本文设计的单精度浮点乘法器的最大时钟频率相比于文献[1]、文献[3]、浮点数乘法IP核分别平均提高了5.30倍、2.10倍、1.97倍。

本文研究工作得到羊城创新创业领军人才支持计划的资助(2019019)，在此表示感谢。

参考文献 (12)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于Karatsuba和Vedic算法的快速单精度浮点乘法器

doi: 10.12178/1001-0548.2020161

作者简介:
易清明(1965-)，女，博士，教授，主要从事信号处理、图像、SoC开发等方面的研究. E-mail：tyqm@jnu.edu.cn

A Fast Single-Precision Floating-Point Multiplier Based on Karatsuba and Vedic Algorithms

计量

基于Karatsuba和Vedic算法的快速单精度浮点乘法器

doi: 10.12178/1001-0548.2020161

1. 暨南大学信息科学技术学院　广州　510632

2. 泰斗微电子科技有限公司　广州　510663

作者简介:
易清明(1965-)，女，博士，教授，主要从事信号处理、图像、SoC开发等方面的研究. E-mail：tyqm@jnu.edu.cn

English Abstract

A Fast Single-Precision Floating-Point Multiplier Based on Karatsuba and Vedic Algorithms

1. School of Information Science and Technology, Jinan University　Guangzhou　510632

2. Taidou Microelectronic Science and Technology Co., Ltd.　Guangzhou　510663

全文HTML

目录

期刊在线

编辑办公

友情链接

留言板

基于Karatsuba和Vedic算法的快速单精度浮点乘法器

doi: 10.12178/1001-0548.2020161

作者简介: 易清明(1965-)，女，博士，教授，主要从事信号处理、图像、SoC开发等方面的研究. E-mail：tyqm@jnu.edu.cn

A Fast Single-Precision Floating-Point Multiplier Based on Karatsuba and Vedic Algorithms

计量

出版历程

基于Karatsuba和Vedic算法的快速单精度浮点乘法器

doi: 10.12178/1001-0548.2020161

1. 暨南大学信息科学技术学院 广州 510632 2. 泰斗微电子科技有限公司 广州 510663

作者简介: 易清明(1965-)，女，博士，教授，主要从事信号处理、图像、SoC开发等方面的研究. E-mail：tyqm@jnu.edu.cn

English Abstract

A Fast Single-Precision Floating-Point Multiplier Based on Karatsuba and Vedic Algorithms

1. School of Information Science and Technology, Jinan University Guangzhou 510632 2. Taidou Microelectronic Science and Technology Co., Ltd. Guangzhou 510663

全文HTML

目录

期刊在线

编辑办公

友情链接

作者简介:
易清明(1965-)，女，博士，教授，主要从事信号处理、图像、SoC开发等方面的研究. E-mail：tyqm@jnu.edu.cn

1. 暨南大学信息科学技术学院　广州　510632

2. 泰斗微电子科技有限公司　广州　510663

作者简介:
易清明(1965-)，女，博士，教授，主要从事信号处理、图像、SoC开发等方面的研究. E-mail：tyqm@jnu.edu.cn

1. School of Information Science and Technology, Jinan University　Guangzhou　510632

2. Taidou Microelectronic Science and Technology Co., Ltd.　Guangzhou　510663