哼唱曲调识别与记谱的迭代改进算法

杨岱锦; 帅子恒; 罗文博

doi:10.12178/1001-0548.2019210

哼唱曲调识别与记谱的迭代改进算法

doi: 10.12178/1001-0548.2019210

电子科技大学电子科学与工程学院　成都　610054

基金项目: 国家自然科学基金(51602039)

详细信息

作者简介:
杨岱锦(1998-)，男，主要从事电子科学与技术方面的研究

通讯作者: 罗文博，E-mail：luowb@uestc.edu.cn

中图分类号: TP311.1

An Improved Iterative Algorithm for Humming Tune Recognition and Notation

School of Electronic Science and Engineering, University of Electronic Science and Technology of china　Chengdu 　610054

摘要: 哼唱记谱是音乐创作谱曲的重要方法与过程。该文分析了受多种环境因素影响的复杂哼唱音频基本特征；基于加窗傅里叶变换方法，以音符为单位对哼唱音频进行区域性的划分、定义和特征提取，提出了以相对振幅为依据快速提取基频的方法，设计出一种可变区域的傅里叶变换迭代算法。采用Python 3.6编程实现了上述迭代算法，自动获取哼唱音符的音高和音长并形成数字乐谱，实验测试准确率达到84.3%。上述结果表明，该算法能更加精确地识别哼唱曲调，为开发精准辅助作曲软件提供了一种可行的识别与记谱算法，具有较好的应用前景。
- 音频识别 /
- 基频提取 /
- 哼唱记谱 /
- 迭代算法 /
- 加窗傅里叶变换
Abstract: Humming notation is an important method and process of composing music. Considering the complexity of humming audio and the influence of various environmental factors, this paper analyzes the basic characteristics of humming audio. On the basis of windowed Fourier Transform, the humming audio is regionally divided, defined and extracted according to the notes. A method of fast extraction of fundamental frequency is proposed based on relative amplitude of humming audio. And further a variable-region Fourier Transform iteration algorithm is designed and implemented programmatically by Python 3.6. This iteration algorithm can recognize humming melody more accurately, obtain the pitch and length of each note of humming, and automatically form a digital music score. The accuracy of the experimental test reached 84.3%. The achieved results show that the algorithm can identify humming tunes more accurately, thus it would be a feasible recognition and notation algorithm for developing composing-assisting software with good application prospects.
- audio recognition /
- fundamental frequency extraction /
- humming notation /
- iterative algorithm /
- windowed Fourier Transform

图 1 0.1 s、147 HZ哼唱音频中的$f'$和$[{f_{1/10}}]$频率

下载: 全尺寸图片幻灯片

图 2 哼唱音频识别处理流程

下载: 全尺寸图片幻灯片

图 3 有效哼唱音符音长区域切分算法

下载: 全尺寸图片幻灯片

图 4 已切分音长可变区域的傅里叶精确识别迭代算法

下载: 全尺寸图片幻灯片

图 5 少音随意哼唱1每帧对应的基频

下载: 全尺寸图片幻灯片

图 6 少音随意哼唱1音符音长区域切分F、R矩阵计算输出图

下载: 全尺寸图片幻灯片

图 7 少音随意哼唱1最终时长划分实际效果图

下载: 全尺寸图片幻灯片

表 1 10个哼唱音频原始数据表

数据名称	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍
少音低音音阶	E3\|1	F3\|1	G3\|1	A3\|1	None	None	None	None
多音低音音阶	C3\|1	D3\|1	E3\|1	F3\|1	G3\|1	A4\|1	B4\|1	C4\|1
少音高音音阶	B5\|1	A5\|1	G4\|1	F4\|2	None	None	None	None
多音高音音阶	C4\|1	D4\|1	E4\|1	F4\|1	G4\|1	A5\|1	B5\|1	C5\|1
少音随意哼唱1	A3\|3	B3\|3	D3\|1	F3\|1	D3\|1	None	None	None
少音随意哼唱2	A3\|1	B3\|1	D3\|1	A3\|1	None	None	None	None
多音随意哼唱1	A5\|1	G4\|1	A5\|1	C5\|1	B5\|1	A5\|1	G4\|1	None
多音随意哼唱2	B3\|1	D3\|1	A4\|1	F3\|1	E3\|1	C3\|1	D#3\|1	E3\|1
少音合成人声	F4\|5	G4\|2	F4\|5	None	None	None	None	None
多音合成人声	G4\|5	F4\|1.5	D4\|1	A5\|2	G4\|3.5	F4\|1.5	C4\|1	D4\|3

下载: 导出CSV

表 2 10个哼唱音频识别输出记谱表

数据名称	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍
少音低音音阶	E3\|4	F3\|2	F3\|4	A4\|3	None	None	None	None
多音低音音阶	C3\|1	C3\|2	D3\|4	F3\|4	G3\|1	C#3\|4	B^b4\|1	B4\|4
少音高音音阶	B5\|2	Bb5\|2	G#4\|3	E4\|8	None	None	None	None
多音高音音阶	G3\|5	D4\|5	E4\|5	F#4\|2	G4\|2	G#4\|2	A5\|4	C5\|6
少音随意哼唱1	A3\|9	B3\|2	C#3\|3	E3\|3	C#3\|3	None	None	None
少音随意哼唱2	A4\|2	C3\|7	D3\|4	A4\|6	None	None	None	None
多音随意哼唱1	A5\|2	F#4\|2	F#4\|2	A5\|3	B5\|5	G#4\|3	G4\|3	None
多音随意哼唱2	B3\|3	C3\|2	D3\|6	E3\|3	D3\|3	C#3\|5	C#3\|3	E^b3\|3
少音合成人声	F4\|7	G4\|2	F4\|9	None	None	None	None	None
多音合成人声	G4\|5	E^b4\|2	B^b5\|1	G4\|2	F4\|3	C4\|1	E^b4\|1	E^b4\|1

下载: 导出CSV

[1]	佟雪娜, 朗云迪. 中国数字音乐产业发展报告[C]//两岸创意经济研究报告. 北京: 社会科学文献出版社, 2017: 49-67. TONG Xue-na, LANG Yun-di. China digital music industry development report[C]//Cross-Strait Creative Economy Research Report. Beijing: Social Science Literature Press, 2017: 49-67.
[2]	周泉. 简介歌曲写作的方法[J]. 科教文汇, 2009(4): 270. doi: 10.3969/j.issn.1672-7894.2009.04.221 ZHOU Quan. A brief introduction to the method of song writing[J]. The Science Education Article Collects, 2009(4): 270. doi: 10.3969/j.issn.1672-7894.2009.04.221
[3]	张杰, 龙子夜, 张博, 等. 语音信号处理中基频提取算法综述[J]. 电子科技大学学报, 2010(s1): 99-102. ZHANG Jie, LONG zhi-ye, ZHANG Bo, et al. Summary of fundamental frequency extraction algorithms in speech signal processing[J]. Journal of University of Electronic Science and Technology of China, 2010(s1): 99-102.
[4]	秦静. 基于内容和语义的音乐检索技术研究与应用[D]. 大连: 大连理工大学, 2018. QIN Jing. Research and application of music retrieval technology based on content and semantics[D]. Dalian: Dalian University of Technology, 2018.
[5]	KWOK H K, JONES D L. Improved instantaneous frequency estimation using an adaptive short-time Fourier transform[J]. IEEE Transactions on Signal Processing, 1995, 48(10): 2964-2972.
[6]	DRESSLER K. Sinusoidal extraction using an efficient implementation of a multi-resolution FFT[C]//Proc of the Int Conf on Digital Audio Effects DAFx. Montréal: McGill University, 2006: 247-252.
[7]	鲁佳. 用于哼唱的音乐检索技术研究与实现[D]. 上海: 上海海事大学, 2007. LU Jia. Research and implementation of music retrieval technology for humming[D]. Shanghai: Shanghai Maritime University, 2007.
[8]	张文歆. 基于多基频提取的歌曲主旋律提取研究[D]. 北京: 北京邮电大学, 2014. ZHANG Wen-xin. Extraction of the main melody of a song based on multi-fundamental frequency extraction[D]. Beijing: Beijing University of Posts and Telecommunications, 2014.
[9]	HERMES D J. Measurement of pitch by subharmonic summation[J]. Journal of the Acoustical Society of America, 1988, 83(1): 257-264. doi: 10.1121/1.396427
[10]	CAO C, LI M, LIU J, et al. Singing melody extraction in polyphonic music by harmonic tracking[C]//International Conference on Music Information Retrieval, Ismir 2007. Vienna, Austria: DBLP, 2008: 373-374.
[11]	徐坤玉, 张彩珍, 药雪崧. 语音信号的加窗傅里叶变换研究[J]. 山西师范大学学报(自然科学版), 2011, 25(3): 79-82. doi: 10.3969/j.issn.1009-4490.2011.03.020 XU Kun-yu, ZHANG Cai-zhen, YAO Xue-jing. Research on windowed Fourier transform of speech signals[J]. Journal of Shanxi Normal University(Natural Science Edition), 2011, 25(3): 79-82. doi: 10.3969/j.issn.1009-4490.2011.03.020
[12]	汪伟, 谢皓臣, 梁光明, 等. 加窗离散傅里叶变换性能分析和比对[J]. 现代电子技术, 2012, 35(3): 115-118. doi: 10.3969/j.issn.1004-373X.2012.03.032 WANG Wei, XIE Hao-chen, LIANG Guang-ming, et al. Performance analysis and comparison of windowed discrete Fourier transform[J]. Modern Electronics Technique, 2012, 35(3): 115-118. doi: 10.3969/j.issn.1004-373X.2012.03.032
[13]	GABOR D. Theory of communication[J]. J Inst Electr Eng, 1946, 93: 429-457.
[14]	王恩成, 苏腾芳, 袁开国, 等. 哼唱检索中联合音高与能量的音符切分算法[J]. 计算机工程, 2012, 38(9): 4-7. doi: 10.3969/j.issn.1000-3428.2012.09.002 WANG En-cheng, SU Teng-fang, YUAN Kai-guo, et al. Symbol segmentation algorithm combining pitch and energy in humming retrieval[J]. Computer Engineering, 2012, 38(9): 4-7. doi: 10.3969/j.issn.1000-3428.2012.09.002
[15]	Python Software Foundation. The python standard library[EB/OL]. [2018-08-16]. https://docs.python.org/3.6/library.
[16]	杨丽娟, 张白桦, 叶旭桢. 快速傅里叶变换FFT及其应用[J]. 光电工程, 2004, 31(b12): 1-3. YANG Li-juan, ZHANG Bai-hua, YE Xu-zhen. Fast fourier transform FFT and its application[J]. Opto-Electronic Engineering, 2004, 31(b12): 1-3.

[1]	张少东, 杨兴耀, 于炯, 李梓杨, 刘岩松. 基于对比学习和傅里叶变换的序列推荐算法 . 电子科技大学学报, 2023, 52(4): 610-619. doi: 10.12178/1001-0548.2022164
[2]	柏果, 程郁凡, 唐万斌. 基于两阶段加窗插值的多音信号频率估计算法 . 电子科技大学学报, 2021, 50(5): 682-688. doi: 10.12178/1001-0548.2021066
[3]	包昕, 陆佩忠, 游凌. 基于伽罗华域傅里叶变换的RS码识别方法 . 电子科技大学学报, 2016, 45(1): 30-35. doi: 10.3969/j.issn.1001-0548.2016.01.004
[4]	邢玲, 马强, 朱敏. 基于神经网络的数字音频双重语义水印算法 . 电子科技大学学报, 2013, 42(2): 260-265. doi: 10.3969/j.issn.1001-0548.2013.02.016
[5]	谢锘, 王晓君, 葛建华. DFT测频的加窗插值算法与实现 . 电子科技大学学报, 2011, 40(2): 192-196. doi: 10.3969/j.issn.1001-0548.2011.02.006
[6]	李建勋, 唐斌, 吕强. 双谱特征提取在欺骗式干扰方式识别中的应用 . 电子科技大学学报, 2009, 38(3): 329-332. doi: 10.3969/j.issn.1001-0548.2009.03.003
[7]	张扬, 徐建平. 变步长极化对消迭代滤波算法 . 电子科技大学学报, 2009, 38(1): 1-4.
[8]	杨莉. Hilbert空间中κ-严格伪压缩的强收敛定理 . 电子科技大学学报, 2009, 38(4): 546-548. doi: 10.3969/j.issn.1001-0548.2009.04.017
[9]	唐续, 魏平, 肖扬灿. 单频估计的自相关混合算法 . 电子科技大学学报, 2008, 37(3): 378-381.
[10]	裴小东, 何遵文, 匡镜明. Turbo-DFH迭代译码算法 . 电子科技大学学报, 2007, 36(1): 57-59.
[11]	张世富. 用傅里叶变换分析圆孔夫琅和费衍射 . 电子科技大学学报, 2006, 35(6): 939-941.
[12]	王田, 杨士中. 带包络约束的优化滤波器设计方法 . 电子科技大学学报, 2006, 35(3): 298-301.
[13]	杨莉. Banach空间中Fuzzy多值隐拟变分包含 . 电子科技大学学报, 2005, 34(5): 703-705.
[14]	杨莉. Fuzzy映象的完全广义非线性隐拟变分包含 . 电子科技大学学报, 2003, 32(6): 770-774.
[15]	周亮. 一种LOG-MAP算法的改进迭代实现及其结构 . 电子科技大学学报, 2003, 32(5): 574-577.
[16]	王雪颖, 秦志光. 加窗技术的改进证书吊销机制 . 电子科技大学学报, 2002, 31(5): 517-522.
[17]	王忠, 柴贺军, 刘浩吾. 关于进化遗传算法的几点改进 . 电子科技大学学报, 2002, 31(1): 76-79.
[18]	钟尔杰. 散乱数据插值的迭代算法 . 电子科技大学学报, 2001, 30(1): 91-94.
[19]	尚明生, 孙世新, 王庆先. 一类集值拟变分包含解的存在性定理 . 电子科技大学学报, 2001, 30(5): 525-528.
[20]	李强, 刘亚康, 朱学勇. 一种基音提取算法 . 电子科技大学学报, 2000, 29(5): 495-498.

点击查看大图

图(7) / 表(2)

计量

文章访问数: 6851
HTML全文浏览量: 2026
PDF下载量: 45
被引次数: 0

全文HTML

音乐是构建人类文明、传承文化、表达思想情感的艺术和重要途径，人类社会发展离不开音乐。随着网络的发展，数字音乐用户逐渐普及。仅2015年，中国数字音乐市场规模就达近500亿^[1]，音乐创作步入了数字时代。在音乐创作中，通过哼唱形成曲谱是音乐创作过程中必不可少的重要过程与方法^[2]。哼唱曲调人工写作曲谱难度大，一般只有专业音乐人才能完成，且目前没有成熟的通用辅助软件。如果可以通过手机APP软件完成哼唱直接转换为乐谱，无疑将会帮助更多人进入音乐创作行业。因此，设计一种快速精准识别哼唱曲调的算法与软件，实现自动记谱具有广阔的应用前景和市场。

对哼唱的曲调的识别，通常的方法是采用寻找音频频率的突变点，并对音符音长进行切分，然后提取切分段的频率。频率的提取主要有时域、频域以及统计3种方法^[3]。当前应用较多的是频域分析方法，主要有离散小波变换(DWT)和加窗傅里叶变换(WFT)2种。离散小波变换主要的特征是灵活性、快速性、双域性和深刻性^[4]，但是对音高频率相差只有几赫兹的人声低频部分，提取误差较大。而加窗傅里叶变换通过简单调整窗长，可以较好地满足需求。

在使用加窗傅里叶变换提取基频的方法中，国内外已经做了较多的报导。文献[5]提出了自适应的短时傅里叶变换(ASTFT)，利用自适应关系调整窗长；但自适应调整需要提前知道目标参数，与哼唱基频提取的目标相悖。文献[6]提出了多分辨率快速傅里叶变换(FFT)的正弦提取；虽然提高了和弦音频的提取能力，但准确度只有71.4%，并且与哼唱记谱的基频提取要求仍有差距。文献[7]采用了加窗傅里叶变化提取人声哼唱音高，通过对谐波分组来确定基频；但其固定窗长的提取方法无法同时满足高频和低频提取的精确度。文献[8]采用多分辨率短时离散傅里叶变换(STDFT)对音频的主旋律进行提取，并指出应在局部区域对频率不断变化的音频进行频率测量；但该工作追求对谐波的提取，适合对一般音乐信号的处理，含有大量的乐器噪声，与哼唱记谱中的基频提取背景不符。人声哼唱的能量很难固定，波动较大，因此，对哼唱的音符度量(频率、音高、音长)的精确识别，成为解决辅助作曲软件的技术关键点，也是难点。不同人的发音标准、声音大小、节奏情况相对不同，再加上哼唱环境影响导致音频组成更加复杂，节奏变化模糊，随机性更大，因此在对人声哼唱的音频的精确提取方面，更具挑战性。

综上所述，对于人声哼唱的自动识别记谱方面，当前并没有成熟且完美的解决方案。本文在基于加窗傅里叶变换基础上，提出了一种新的符合哼唱特征的加窗傅里叶变换改进算法，较好地解决了对哼唱作曲过程中音频的分析与提取，为开发精准的哼唱作曲软件，提供了一种关键技术和解决方案。

参考文献 (16)

姓名
邮箱
手机号码
标题
留言内容
验证码

数据名称	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍
少音低音音阶	E3\|1	F3\|1	G3\|1	A3\|1	None	None	None	None
多音低音音阶	C3\|1	D3\|1	E3\|1	F3\|1	G3\|1	A4\|1	B4\|1	C4\|1
少音高音音阶	B5\|1	A5\|1	G4\|1	F4\|2	None	None	None	None
多音高音音阶	C4\|1	D4\|1	E4\|1	F4\|1	G4\|1	A5\|1	B5\|1	C5\|1
少音随意哼唱1	A3\|3	B3\|3	D3\|1	F3\|1	D3\|1	None	None	None
少音随意哼唱2	A3\|1	B3\|1	D3\|1	A3\|1	None	None	None	None
多音随意哼唱1	A5\|1	G4\|1	A5\|1	C5\|1	B5\|1	A5\|1	G4\|1	None
多音随意哼唱2	B3\|1	D3\|1	A4\|1	F3\|1	E3\|1	C3\|1	D#3\|1	E3\|1
少音合成人声	F4\|5	G4\|2	F4\|5	None	None	None	None	None
多音合成人声	G4\|5	F4\|1.5	D4\|1	A5\|2	G4\|3.5	F4\|1.5	C4\|1	D4\|3

数据名称	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍
少音低音音阶	E3\|4	F3\|2	F3\|4	A4\|3	None	None	None	None
多音低音音阶	C3\|1	C3\|2	D3\|4	F3\|4	G3\|1	C#3\|4	B^b4\|1	B4\|4
少音高音音阶	B5\|2	Bb5\|2	G#4\|3	E4\|8	None	None	None	None
多音高音音阶	G3\|5	D4\|5	E4\|5	F#4\|2	G4\|2	G#4\|2	A5\|4	C5\|6
少音随意哼唱1	A3\|9	B3\|2	C#3\|3	E3\|3	C#3\|3	None	None	None
少音随意哼唱2	A4\|2	C3\|7	D3\|4	A4\|6	None	None	None	None
多音随意哼唱1	A5\|2	F#4\|2	F#4\|2	A5\|3	B5\|5	G#4\|3	G4\|3	None
多音随意哼唱2	B3\|3	C3\|2	D3\|6	E3\|3	D3\|3	C#3\|5	C#3\|3	E^b3\|3
少音合成人声	F4\|7	G4\|2	F4\|9	None	None	None	None	None
多音合成人声	G4\|5	E^b4\|2	B^b5\|1	G4\|2	F4\|3	C4\|1	E^b4\|1	E^b4\|1

数据名称	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍
少音低音音阶	E3\|1	F3\|1	G3\|1	A3\|1	None	None	None	None
多音低音音阶	C3\|1	D3\|1	E3\|1	F3\|1	G3\|1	A4\|1	B4\|1	C4\|1
少音高音音阶	B5\|1	A5\|1	G4\|1	F4\|2	None	None	None	None
多音高音音阶	C4\|1	D4\|1	E4\|1	F4\|1	G4\|1	A5\|1	B5\|1	C5\|1
少音随意哼唱1	A3\|3	B3\|3	D3\|1	F3\|1	D3\|1	None	None	None
少音随意哼唱2	A3\|1	B3\|1	D3\|1	A3\|1	None	None	None	None
多音随意哼唱1	A5\|1	G4\|1	A5\|1	C5\|1	B5\|1	A5\|1	G4\|1	None
多音随意哼唱2	B3\|1	D3\|1	A4\|1	F3\|1	E3\|1	C3\|1	D#3\|1	E3\|1
少音合成人声	F4\|5	G4\|2	F4\|5	None	None	None	None	None
多音合成人声	G4\|5	F4\|1.5	D4\|1	A5\|2	G4\|3.5	F4\|1.5	C4\|1	D4\|3

数据名称	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍	音名\|时长/拍
少音低音音阶	E3\|4	F3\|2	F3\|4	A4\|3	None	None	None	None
多音低音音阶	C3\|1	C3\|2	D3\|4	F3\|4	G3\|1	C#3\|4	B^b4\|1	B4\|4
少音高音音阶	B5\|2	Bb5\|2	G#4\|3	E4\|8	None	None	None	None
多音高音音阶	G3\|5	D4\|5	E4\|5	F#4\|2	G4\|2	G#4\|2	A5\|4	C5\|6
少音随意哼唱1	A3\|9	B3\|2	C#3\|3	E3\|3	C#3\|3	None	None	None
少音随意哼唱2	A4\|2	C3\|7	D3\|4	A4\|6	None	None	None	None
多音随意哼唱1	A5\|2	F#4\|2	F#4\|2	A5\|3	B5\|5	G#4\|3	G4\|3	None
多音随意哼唱2	B3\|3	C3\|2	D3\|6	E3\|3	D3\|3	C#3\|5	C#3\|3	E^b3\|3
少音合成人声	F4\|7	G4\|2	F4\|9	None	None	None	None	None
多音合成人声	G4\|5	E^b4\|2	B^b5\|1	G4\|2	F4\|3	C4\|1	E^b4\|1	E^b4\|1

留言板

哼唱曲调识别与记谱的迭代改进算法

doi: 10.12178/1001-0548.2019210

作者简介:
杨岱锦(1998-)，男，主要从事电子科学与技术方面的研究

通讯作者: 罗文博，E-mail：luowb@uestc.edu.cn

An Improved Iterative Algorithm for Humming Tune Recognition and Notation

计量

哼唱曲调识别与记谱的迭代改进算法

doi: 10.12178/1001-0548.2019210

电子科技大学电子科学与工程学院　成都　610054

作者简介:
杨岱锦(1998-)，男，主要从事电子科学与技术方面的研究

通讯作者: 罗文博，E-mail：luowb@uestc.edu.cn

English Abstract

An Improved Iterative Algorithm for Humming Tune Recognition and Notation

School of Electronic Science and Engineering, University of Electronic Science and Technology of china　Chengdu 　610054

全文HTML

2.1. 哼唱音频识别流程

2.2. 有效哼唱音符音长区域切分

2.3. 哼唱可变区域傅里叶精确识别迭代算法

目录

期刊在线

编辑办公

友情链接

留言板

哼唱曲调识别与记谱的迭代改进算法

doi: 10.12178/1001-0548.2019210

作者简介: 杨岱锦(1998-)，男，主要从事电子科学与技术方面的研究

通讯作者: 罗文博，E-mail：luowb@uestc.edu.cn

An Improved Iterative Algorithm for Humming Tune Recognition and Notation

计量

出版历程

哼唱曲调识别与记谱的迭代改进算法

doi: 10.12178/1001-0548.2019210

电子科技大学电子科学与工程学院 成都 610054

作者简介: 杨岱锦(1998-)，男，主要从事电子科学与技术方面的研究

通讯作者: 罗文博，E-mail：luowb@uestc.edu.cn

English Abstract

An Improved Iterative Algorithm for Humming Tune Recognition and Notation

School of Electronic Science and Engineering, University of Electronic Science and Technology of china Chengdu 610054

全文HTML

2.1. 哼唱音频识别流程

2.2. 有效哼唱音符音长区域切分

2.3. 哼唱可变区域傅里叶精确识别迭代算法

目录

期刊在线

编辑办公

友情链接

作者简介:
杨岱锦(1998-)，男，主要从事电子科学与技术方面的研究

电子科技大学电子科学与工程学院　成都　610054

作者简介:
杨岱锦(1998-)，男，主要从事电子科学与技术方面的研究

School of Electronic Science and Engineering, University of Electronic Science and Technology of china　Chengdu 　610054