SpringBoot是现在最热门的企业级开发微服务框架,其部署速度快、使用简单,是可以用来当饭碗的一门技术。
数据结构是重中之重,但是由于我在练习或比赛时一直对stl的频繁使用,似乎让我越来越对基础数据结构的代码能力越来越薄弱,由此重新开始练习基础。 以《数据结构C(第二版)》严蔚敏、李冬梅老师书为训练基础。
数据结构和算法是程序员的基本功,也是各大学校各大厂十分看重的敲门砖,本人参与过一些竞赛,竞赛除了考察对数据结构的掌握其实还存在许多的套路,这里进行一个总结与归纳,希望可以在日后参加竞赛时去得更好的成绩。
朴素贝叶斯、最大似然估计和EM算法的作用在于对HMM中的B也就是发射概率进行求解,当时提到B的求解与高斯混合分布的两个参数有关, miu 和 sigema方 前者在于对多维求均值,后者用到协方差矩阵,这三个算法应该对我们的求解有帮助。
MySQL是当下最流行的DMBS,它开源且强大,这次大创在经历了IOS的app开发碰壁后转战安卓,而我主要负责数据库的应用,数据库本事接下来的这个学期开始学的课程,现在就要开始自学,而且我发现数据库的课程可能MySQL教的不是很多,现在学学也挺好。
Awk是一种便于使用且表达能力强的程序设计语言,可应用于各种计算和数据处理任务。初识实在kaldi的清华数据集里面,在准备数据阶段使用到Awk来对文件名文字进行拆分和,老师提到那是十分强大的文本处理工具,机缘巧合在和斌哥在所里聊天时斌哥也提到了,正巧这次有了个关于Awk的任务给我,斌哥写的差不多了,我们先来看看吧。
我在学生会有时面临复杂的数据要处理,我可没有耐心去人工核对,程序是很好实现的,尤其是使用Python,比如上次用了十几行的代码就从三百多个人中找出没有签到的人,涉及到了Python的集合减法。但其中我是使用把人名数据复制粘贴到IDLE里,作为input让程序跑,output也是在交互环境中简单的输出人名,这时我就想,如果能把Excel中的数据直接读入就好了,输出也成规范化的Excel就更好了,这一直是在我心理想去学习和实践的一个操作。
run.sh的第二块内容就是创建提取mfcc特征,对应着又是几个脚本文件,包括make_mfcc.sh,ompute_cmvn_stats.sh等,分析过后发现还是为了确保数据准确性所做的检查数据集的文件操作,并不是就约等于所做的理论分析内容。
语音特征参数MFCC的提取过程是确保语音识别准确的关键步骤。 MFCC全称Mel-scaleFrequency Cepstral Coefficients,中文名叫梅尔倒谱系数。 是在Mel标度频率域提取出来的倒谱参数,Mel标度描述了人耳频率的非线性特性,它与频率的关系可用下式近似表示:
大致了解了HMM后,我们迈进进kaldi的源码大门,目的在于大致理解kaldi如何实现,还有MFCC如何提取特征的。
To record the growth of Vachel
2020新冠肺炎记忆:报道、非虚构与个人叙述(持续更新) Memory of 2020 nCov: Media Coverage, Non-fiction Writings, and Individual Narratives (Continuously updating)
This is the official location of the Kaldi project.
学习基于协同过滤算法的推荐app