“睛”彩“视”界-智能语音汉字转换系统构想研究

(整期优先)网络出版时间:2021-12-30
/ 2

“睛”彩“视”界 -智能语音汉字转换系统构想研究

李云峰 曹林 崔芝彬 宫琳琳

山东协和学院 山东济南 250109



摘要:当前,我国正在全面建设小康社会。但是残疾人员的工作一直是个难题,想要解决这个难题就要从科技力量为基础为残疾人提供帮助。2021年全国助残日主题是“巩固残疾人脱贫成果,提高残疾人生活质量”,指出要继续落实“两不愁、三保障”扶持政策,进一步加大残疾人的稳岗就业帮扶,提高生活质量。习近平在河北唐山市考察时说过“残疾人也可活出精彩人生”。本文面向失聪人员提出了一种语音汉字转换系统的构想,提出了构建智能转换眼镜的设计理念;对智能语音汉字转换系统进行了研究,为失聪人员提供了未来工作的生活保障,具有一定的社会意义和实践价值。

关键词:智能转换眼镜 智能语音汉字转换系统

1 智能转换眼镜功能分析

对现在市场上大部分智能眼镜进行研究,智能眼镜利用的是光学反射投影原理,即微型投影仪先是将光投到一块反射屏上。举个例子,比如华为所推出的智能眼镜是为用户显示虚拟图像,并使用户与虚拟图像进行交互。而现有的方法通常是利用算法对原始图像与设备的当前姿态信息进行处理,并将处理后的虚拟图像与原始图像合成供给用户观看。但是在实践中,由于算法处理和图像合成等模块消耗的时延较大,导致用户的体验效果不佳;因此他们在这种智能眼镜的基础之上申请了一项名为“图像处理方法、相关设备及计算机存储介质”的发明专利使得它的技术进一步完善。而后通过一块凸透镜折射到人体眼球,实现所谓的一级放大,在人眼前形成一个足够大的虚拟屏幕,可以显示简单的文本信息和各种数据。

在智能眼镜基础上将智能语音汉字转换系统植入到当中去,失聪人员带上眼镜后就可以和人们正常交流;植入该功能后眼镜就有了语音识别功能,它可以将所收听到的语音转变成文字呈现在眼镜片中,而眼镜片可以自动调节成人眼所能看到的大小,这样当失聪人员看完所呈现的文字后就可以知道其他人跟自己说的什么,使其交流畅通无阻。

2 智能转换眼镜的技术研究

智能转换眼镜使用到的技术主要包含五个方面。

一是在智能眼镜的基础之上将智能语音汉字转换系统植入其中,智能语音汉字转换系统:语音到汉字的转换通过马尔科夫模型来识别随机汉字文本语句,结合了逆向最大匹配分词法进行汉语文本的语句分词,利用词组字典与GB2312进行词组或单字的匹配,实现语音到汉字的转换。同时,通过音码字典解决了语音转文字的问题;LD3320语音识别模块负责进行语音信息的采集与识别等。

二是采用USB充电口并且支持无线充电;支持热插拔操作采用超低耗电池,用数据线将其链接在智能手机或者电脑上可查看该眼镜功耗与电量以及可以检测眼镜是否有无故障。无线充电技术对人体安全无害处,无线充电使用的共振原理是磁场共振,只在以同一频率共振的线圈之间传输,而其他装置无法接受波段,另外,无线充电技术使用的磁场本身就是对人体无害的。但无线充电技术毕竟是新型的充电技术,以迈源科技的无线充电器来说,很多人都会担忧无线充电技术会像当初Wi-Fi和手机天线杆刚出现一样,其实技术本身是无害的。

三是运用了航天隔热技术;利用防热层本身的材料(烧蚀材料)在受热后发生的物理化学过程中产生的阻塞、辐射、吸热等效应来达到防热目的。

四是拥有AI引擎声音传感器;该传感器内置一个对声音敏感的电容式驻极体话筒。声波使话筒内的驻极体薄膜振动,导致电容的变化,而产生与之对应变化的微小电压。这一电压随后被转化成0-5V的电压,经过A/D转换被数据采集器接受,并传送给智能语音汉字转换系统。

五是具有光学反射投影将声音传感器所识别到的语音形成文字照射到镜片上面,从而产生影像,最后调整的合适的大小即可供人眼观看。

3 智能转换眼镜的市场模式

根据智能眼镜功能需要进行市场分析:它是最近几年被提出而且是最被看好的可穿戴智能设备之一。其具有使用简便,体积较小等,特点公众普遍认为智能眼镜的出现将会方便人们的生活,因此它得到了谷歌,微软等重点研发,被视为未来智能科技产品的重要增长点。目前,我国智能眼镜行业规模较小,市场份额偏低,行业整体处于发展初期状态,国内智能眼镜生产企业普遍呈现生产技术落后,设计能力欠缺的状况。许多企业没有自己的品牌,即使有自己的品牌,在国际消费市场的品牌知名度也较低。国内智能眼镜企业整体竞争力不足,要想取得长足发展,还需要在行业标准、产业方向和商业模式上有所改进,并建立相应的行业人才培养机制,为产业发展创造良好的环境。

由上述分析我们可以看出智能眼镜这个行业并没有完全发展开来,所以我们要以线上和线下两种方式来进行发展,线上主要以网店,知名度高的电商带货以便于起到良好的宣传作用,现阶段不求盈利只求知名度,知名度一旦上涨随之而来的也正是利润,线下进行定点投放试用,在一些特殊教育类学校以及各个地区调查所研究出来的失聪人员普遍较多的城市开设摊位甚至门店,专门供他(她)们试用以及提出不良,以便我们的产品加以改进,如果效果好的话我们将逐步开展如何使用智能转换眼镜的培训班进行培训。

4 智能转换眼镜技术创新

(1)创新了汉字智能转换系统,使用专属模型,不断对模型进行优化。

将汉字智能转换系统技术应用到智能眼镜中,该系统基于大量垂直领域的语料,制定详细的训练方案,不断对模型进行训练,相对于普通的智能眼镜,增添了新技术,使眼镜更具卖点。对于项目产品生产技术方案的选用,遵循“技术上先进可行,经济上合理有利,综合利用资源”的进步原则。

(2)具备了高效识别功能,能快速响应、毫秒返回。

采用了行业先进的语音识别技术。汉字转换功能不仅限于普通话和英文,还支持 30 多个语种、20 几种方言。通过逐字和逐句分段识别,能提供对普通话和方言的混合识别。实时输出文字,响应速度可达毫秒级,用户边说边返回文字。

(3)提高了标点预测、动态修正功能。

根据语音内容理解可以将数字序列、小数、时间、分数、基础运算符正确转换为数字格式,使得识别的数字结果更符合使用习惯,直观自然。采用先进的集散型控制系统,由计算机统一控制整个生产线的各工艺参数,使产品质量稳定在高水平上。

5 结语

本文主要为智能转换眼镜的开发提供了新型思路和研究途径,具有一定的社会意义和实践价值。下一步的工作是对语音汉字转换系统进行深入研究,进一步提高智能转化眼镜的产品质量。

参考文献:

[1]臧瑾,李泳龙,陈雪玉,鲍思成,胡寅.基于Android的智能眼镜的设计与开发[J]电声技术,2015(4):32-35.

[2]周昌盛.基于智能眼镜的阅读认知状态识别与辅助系统[d].深圳大学,2018.

[3] 蔡东风,赵奇猛,饶齐等.基于马尔科夫逻辑网的中文专利最大名词短语识别[J].中文信息学报,2016,30(4):21-28.

[4]高知新,徐林会.基于隐马尔科夫模型与语义融合的文本分类[J].计算机应用与软件,2017,34(7):303-307.

科研项目:


山东省大学生创新创业训练计划项目“‘睛’彩‘视’界—一种失聪人与正常人沟通交流的工具”,项目编号:S202113324202

作者简介:

李云峰(2001.01),男,山东东营,本科,山东协和学院学生,专业:计算机科学与技术

曹林(2001.03),男,山东临沂,本科,山东协和学院学生,专业:计算机科学与技术

崔志彬(2001.01),男,山东东营,本科,山东协和学院学生,专业:计算机科学与技术

宫琳琳(1983.04),女,山东青岛,硕士,副教授,研究方向:软件技术