One - One Code All

Blog Content

语音识别加上专业级录音设备

EP-Geek   2018-04-07 12:10:18

感恩这个时代,人工智能,语音识别发展之迅速,让生活和工作有了更多的可能。


2017年在全球互联网大会上,看科大讯飞展示了他们的语音识别成果,当时我在会场,科大讯飞的演示人拿着麦克风一边说话,身后的大屏幕就出现文字即时翻译。


在平时的生活中,手机也可以做到这样,语音输入法,但是拾音距离太短了,远一点,效果就很差劲。普通的耳机或蓝牙也做不到这一点。因为拾音距离满足不了要求。


那么我想,提供几个方案。


  1. 专业级的录音设备的芯片移植到蓝牙或者麦克风设备上;

  2. 出一款内置专业录音芯片的麦克风手机;比如类似好易通出国翻译那样的那样的。

  3. 将专业级的录音麦克风进行改造。中关村产品商城可以查找。录音专用麦克风:http://detail.zol.com.cn/maikefeng/p13208/  ,http://detail.zol.com.cn/maikefeng/index205989.shtml 

  4. 或者出专业的录音笔:类似 搜狗旅行翻译宝,搜狗速记翻译笔。介绍里面是这么说的:搜狗速记翻译笔:集录音速记翻译于一身 外语学习好帮手。针对外语学习场景的搜狗速记翻译笔,满足了人们在学习生活中对实时课堂笔记,外教授课实时翻译的需求,同时还解决了距离授课人远,听不清讲课内容等问题。搭载与旅行翻译宝一样的双麦克风阵列系统,可以进行6米远场拾音,确保声音输入,语音识别准确率超过97%。http://www.sohu.com/a/219633668_792551

    “王小川现场讲到,境外旅游现在很火,市面上有很多提供翻译服务的App,但大都不好用。这类产品主要有两大痛点:1、信号不稳定,过于依赖在线服务;2、翻译不准确,翻译技术和语音识别紧密相关,语音识别中有一点小错,会把错误放大。搜狗给出的对应解决方法是:1、离线翻译技术,使其在终端设备中能够执行,解决存储问题和识别延迟问题;2、阵列技术,能够找到最强音源,实现降噪,使语音识别达到最高水准。两种技术结合,搜狗推出一款新产品:搜狗旅行翻译宝。产品外观是一个黑色小盒子,和手机一般大小,支持17种语言翻译,可用于点餐、问路、看展等用途。定价1498元,3月12日京东首发。
    王小川在现场发布的第二款产品,是搜狗速记翻译笔,可以远场拾音、蓝牙连接和即录即转,支持17种语言,形态小巧、不带屏幕,使用时需要和手机配合。定价299元,3月12日京东首发。”

  5. 市场上有一些产品,但功能还不够全面。其实问题不大。如纽曼扫描翻译笔:https://item.jd.com/6099236.html  扫描翻译笔利用的是图像识别,那语音识别自然也是可以的。设备硬件上改进一下。



上一篇:mac开启输入法语音转文本
下一篇:MAC连接蓝牙麦克风

The minute you think of giving up, think of the reason why you held on so long.