声音是怎样产生的，四年级科学声音是怎样产生的

2022年12月27 03:07 • • 阅读 263

引言最近接手了一个EOL(EndofLine)的项目,用高斯混合模型GMM(GaussianMixtureModel)作生产线上产品的质量检测。虽然提取特征的过程很痛苦,不过还是很有意思。也是因为兴趣

引言

最近接手了一个EOL (End of Line)的项目，用高斯混合模型GMM (Gaussian Mixture Model)作生产线上产品的质量检测。虽然提取特征的过程很痛苦，不过还是很有意思。也是因为兴趣，去年在Coursera上了吴恩达的Machine Learning，算是对机器学习的入门。随着机器学习的兴起，各个学科都在积极蹭热度，四年级科学声音是怎样产生的，寻找和机器学习的契合点。这个系列就和大家聊聊机器学习在声学上的应用，标题略显浮夸，有蹭人工智能热度的嫌疑，其实主要是谈机器学习。对机器学习的了解有限，欢迎交流指正。

背景

机器学习现在已经被广泛应用到计算机视觉、图像处理、语音处理、地球物理等领域。和其他技术，比如压缩感知等类似，在计算机和图像处理领域掀起热潮之后，机器学习开始在声学崭露头角。虽然起步不早，但是发展很快。在人类语言语音、动物发声、水下声源定位等声学子领域都有应用。

吴恩达教授给出的监督学习的定义：

In supervised learning，we are given a data set and already know what our correct output should look like，having the idea that there is a relationship between the input and the output[2].

无监督学习：

Unsupervised learning allows us to approach problems with little or no idea what our results should look like. We can derive structure from data where we don't necessarily know the effect of the variables.

简单说就是监督学习对于输出我们已经有了预期，知道他们长什么样；无监督学习是不知道输出应该是什么，最后用数据来判断。比如同样是分类，垃圾邮件分类是监督学习；把同质类的新闻分类就是无监督学习，因为我们并不知道要分成几类，也没有具体分类标准。

声学是物理学分支，人们几百年来一直致力于发展声学的物理模型，如下图的x轴所示；随着数据量的增大，以数据为驱动的方法也逐渐被运用，如图的y轴。右上角方向就是声学发展的方向：更先进完备的物理模型和大数据驱动的机器学习的结合[3]。机器学习中，数据特征是关键。

机器学习的常见方法

机器学习有海量的学习资料，我一个外行就不再班门弄斧讲基础知识。在这里简单列几个比较常用的机器学习方法。

监督学习

1. 回归和分类

用吴恩达老师在Coursera的Machine Learning里面的一张图展示什么是回归。横坐标房子面积，纵坐标房价，我们可以用各种曲线来代表房价趋势，从而由面积预测房价。

不管它们具有何种形式,都是由于物体的振动所引起的：敲鼓时听到了鼓声,同时能摸到鼓面的振动；人能讲话是由于喉咙声带的振动；汽笛声、喷气飞机的轰鸣声,是因为排气时气体振动而产生的.总之,物体的振动是产生声音的根源。

分类很好理解，一个简单的例子

[Machine Learning，Coursera]

其他的方法还有支持向量机SVM (Support Vector Machine)、神经网络等。其中支持向量机要比回归更灵活，而神经网络可以利用非线性模型进行预测或分类。

声音是由物体振动产生，正在发声的物体叫声源。声音以声波的形式传播。声音只是声波通过固体或液体、气体传播形成的运动。声波振动内耳的听小骨，这些振动被转化为微小的电子脑波，它就是我们觉察到的声音。

神经网络非线性分类 [Machine Learning，Coursera]

无监督学习

主要方法有：

1. 主成分分析 PCA (Principal components analysis)

PCA: 通过正交变换把数据转化成线性无关的主成分，对数据进行降维打击，让特征更具代表意义 [Wikipedia]

2. K-means

k-mean: 通过迭代找到不同类数据的中心点，从而对数据分类 [Wikipedia]

3. GMM 和最大期望Expectation Maximization (EM)

和k-mean类似，也是一种聚类分析。通过混合几个不同的高斯分布，对特征分类。

GMM []

其他方法还有字典学习 Dictionary learning，Autoencoder network、深度学习（包括卷积神经网络）等。

机器学习在声学中的应用

1. 音频处理中的声源定位

在音频处理中，对声源或者发声者的语音增强是核心问题。机器学习和声学的结合，在手机、汽车、助听器和智能家居等领域都有广泛应用。虽然这个方向的发展非常迅猛，但是在高背景噪声和房间混响的环境下准确识别声源依然是最大的挑战。LOCATA项目最近发起了一项声源定位和追踪的挑战，建立了一个基于现实生活录音的数据库可以用来训练声源定位算法[4]。现在国内外各大语音相关企业都在开展这方面的研究。

GMM结合EM提高定位精度 [3]

2. 海洋声学中的声源定位

海洋声源定位主要利用声呐系统结合Matched field processing (MFP)算法。由于空间中声源绝大多数为稀疏分布（不是空间里布满了声源），所以压缩感知（Compressive sensing）在近十几年被引入声学。正如前述所说，声学一般都是滞后引入其他学科中的新技术，这似乎是声学学科的特点。

神经网络被用到过准确定位货轮位置[5]。对于浅海和倾斜的海洋环境，需要针对不同的海水深度训练time delay neural network (TDNN)模型从而避免mismatch [6]。今年又有学者成功利用单个水听器hydrophone结合deep residual CNN (Res-Net)预测声源范围和深度[7]。随着计算机能力的提升（比如量子计算机，虽然不知道还要多少年才能商用），结合机器学习和物理模型，有望实现更精准的实时海洋声源定位。

声音是由物体振动产生,正在发声的物体叫声源.声音以声波的形式传播.声音只是声波通过固体或液体、气体传播形成的运动.声波振动内耳的听小骨,这些振动被转化为微小的电子脑波,它就是我们觉察到的声音.内耳采用的原理与麦克风捕获声波或扬声器。

三个船不同时间的时频图 [5]

声音是由物体振动产生的声波。是通过介质传播并能被人或动物听觉器官所感知的波动现象。声音产生的原因物理中声音是由物体振动发生的，正在发声的物体叫做声源。物体在一秒钟之内振动的次数叫做频率，单位是赫兹，字母Hz。

嵌入式物联网需要学的东西真的非常多，千万不要学错了路线和内容，导致工资要不上去！

无偿分享大家一个资料包，差不多150多G。里面学习内容、面经、项目都比较新也比较全！某鱼上买估计至少要好几十。

3. 生物声学

这个方向的应用比较有意思，主要研究自然界生物对各种声音的产生和感知，这里的声音不仅仅局限于语音。机器学习已经用于回答以下问题：为什么动物会发声？为什么会出现喊叫和歌声？这些声音之间有什么联系？这些方面有丰富的数据，可供机器学习使用。

几个有趣的生物声学数据库：

Sharing bird sounds from around the world

MobySound.org

British Library - Sounds

在医学领域机器学习和声学也有结合，用来做疾病诊断。比如澳大利亚的Noisy Guts（）公司用声学信号结合机器学习，诊断肠道疾病。

还有对语音信号进行情感情绪分析，来预判危险行为的发声，提前介入防止暴力发生，可以用在幼儿园和监狱等场所。荷兰的一家公司就在做这方面的研究。

通过语音时频谱可以看出人的突然发生很大变化 []

4. 地质探测

对碳水化合物的地质探测主要通过收集发射的地震波的反射波，来分析地表下反射层是否存在不连续，从而探测地下是否存在碳水资源。这个领域传统方法是结合信号和图像处理，利用声学做地质探测也是近期的事情。

5. 混响和环境声

人类每天都在和复杂的声环境打交道，各种各样的声源包括语音、音乐、冲击、摩擦、流动、动物、机器等。每个声源发出的声音和其他声源以及周围环境发生交互，导致传到人耳里面的声音非常复杂，并不包含声源的原始声音。像之前提到的，去混响和反射、提取声源声音都是声学和机器学习结合面临的挑战，如何在混合信号中提取出声源声。比如，我们需要让助听器能够在背景噪声中分辨出人声，自动驾驶的汽车能在嘈杂的街道上听出警笛并让道（虽然这个功能在国内应该是鸡肋）。

在自然环境中，声源辨别面临以下几个问题：

声音的产生声音是由振动产生的。当你说话时，就引起空气振动，振动传播出去，只要某人的耳朵接收到了这种振动，他就会听到你的声音。声音能够在固体、液体中传播，也可以通过空气或其他气体传播。随着声音的传播，空气中的。

声源种类繁多；

每种声源又有很大多样性；

自然环境中都是多个声音时间同时发生并互相干扰。

现在有好多的数据库来提供自然界的录音来训练classifier，比如DCASE challenges，ESC，TUT，Audio set，Urban Sound and scene classication (DCASE; TUT)。

通过声学结合先进的图像处理来进行声音场景和声源分类识别可以增强识别效果。还可以通过物理模型来模拟声音，用来方便产生更多数据来提取特征，训练模型[9]。

人体的声音产生主要是因为声带的震动引起的。由声带振动，发出声音的人的发声器官在喉头，由声带、软骨韧带结构的支架、控制声带位置和张力的肌肉组成。肌肉的活动由神经来支配。当空气从肺部经气管呼出时，呈一定张力的声带，由。

通过物理模型合成大型对比声音数据库 [9]

文章链接：

转载自：嵌入式Linux

ppt怎么调整字间距，ppt调整字间距快捷键

上一篇 2023年02月07 22:07

RalphStacey《Complexity and Creativity in Organizations》作品简介与读书感悟

下一篇 2022年12月16 11:26

教育

严阵以待造句，严阵以待造句简短

部编本人教版二年级上册知识点第一单元知识要点①小蝌蚪找妈妈（1）好词积累：大大的脑袋黑灰色的身子长长的尾巴碧绿的衣裳雪白的肚皮快活地游来游去（2）数量词积累：一群小蝌蚪四条腿一只乌龟两只大眼睛一对大眼

2022年12月12 232
教育

怎样办理档案人事代理，毕业4年档案没有办人事代理

国家规定个人学籍档案是必须得存放到学校进行保管的。但是档案我们大学毕业后,毕业4年档案没有办人事代理,就有可能看到或者拿到自己的学籍档案。也有可能在我们参加工作后,拿到自己的人事档案。那么档案如何托管

2023年01月07 283
教育

怎样分解质因数，怎样把一个数分解因数

质因数分解是小学数学五年级重点考点之一,通过质因数分解,可以将复杂的数字问题进行化简并最终求得结果,下面我们来看看它的庐山真面目！何为质因数？一个自然数的因数中,为质数的因数叫做这个数的质因数。那么,

2022年12月26 230
教育

C.S.刘易斯(Lewis.C.S.)《沉寂的星球》作品简介与读书感悟

各位吧友好！时光荏苒,转眼间2021年已经临近尾声。回顾这一年NBA赛场上发生的种种,有欢乐,有泪水,有震撼,也有感动。今天,小编整理了本年度最让球迷们惊喜的8支球队（排名不分先后）,和大家一起回味他

2022年12月14 279
教育

最打动女孩子的话

最容易让女生感动的十句话。女生遇到困难,一筹莫展的时候,你的一句“别担心,一切有我”最让女生感动女生迷路慌乱,向你求救的时候,你的一句“站着别动,我去找你”最让女生感动女生独自一人,充满孤独感的时候,

2022年12月09 241
教育

春节怎么画，7一10岁儿童画春节

2023中国声音中国年特派员兔吉祥出场！兔吉祥寻“兔”之旅第四站来到著名的“中国民间文化艺术之乡”天津见证一幅杨柳青木版年画作品——《玉兔生辉》的诞生兔吉祥说木版年画音频：00:0001:06红锦鲤、

2023年02月09 252
教育

怎样保护黄河，中学生保护黄河的措施

“黄河宁,天下平。”10月30日,十三届全国人大常委会第三十七次会议表决通过《中华人民共和国黄河保护法》,将于2023年4月1日起施行。继长江保护法后,我国江河流域保护再添标志性立法,为在法治轨道上推

2023年01月01 216
教育

大点怎么打，・大一点的符号

北京人的幽默是出了名的,这种幽默在一颦一笑之间,在行动坐卧之间,在言谈话语之间,・大一点的符号,更在那说不尽道不完的俏皮话,歇后语之间！下面小编就精心为您总结了那些脍炙人口,让您耳熟能详的北京俏皮话！

2023年02月05 333
教育

第一个月工资怎么算，第一个月工资是按天数算吗

试用期是每个公司都有的这么一个阶段,也是让新入职的员工用来与公司内部进行磨合以便转正的时候能够快速的融入公司群体的一个阶段。那么2021年试用期工资怎么算?试用期未满一个月工资该如何计算?试用期工资不

2023年01月23 248
教育

舍本逐末造句，舍本逐末造句对话

1.哀鸿遍野：比喻呻吟呼号、流离失所的灾民到处都是。哀鸿,哀鸣的大雁,比喻悲哀呼号的灾民。2.安步当车：古代称人能安贫守*。现多用以表示不乘车而从容不迫地步行。安,安闲。3.安土重还：安于本乡本土,不

2022年12月12 292
教育

阿卡索怎么样，外教课阿卡索不错

近两年,跟着外教在线学英语成为了家有小孩家庭们的必备。不仅方便快捷、教学资源丰富,教学效果还丝毫不输线下,可在报读在线外教课程时,家长们都会遇到一个问题：这么多课程,我该给孩子选哪一门呢？经过亲身测评

2023年01月17 269
教育

横杠怎么打，小横杠符号

在处于文字输入状态时,十指需要分别摆放于固定位置,小横杠符号,并负责不同分区,按下相应的按键后,手指仍然需要回到最初的位置。除左右手的拇指外,其他手指所处的最初位置被我们称为“基本键位”也叫,“原键位

2023年01月16 246
教育

怎么插入文档，Word为什么英文改不了格式

很多朋友们在使用Word软件进行编辑的时候,总是会出现一些操作不懂的问题,Word为什么英文改不了格式,当我们需要在Word文档中插入另一个Word文档的时候,这让大家都比较郁闷,不知如何去做。如何在

2023年02月10 207

声音是怎样产生的，四年级科学声音是怎样产生的

相关推荐