Alans 雅兰仕 TT50 (搜音机)语音控制的微型音响测评报告
夏昆冈 于 2010.08.29 10:33:20 | 源自:www.soomal.com | 版权:原创 | 平均/总评分:09.75/39

多媒体音箱操控技术的发展,经过多年发展,依然还是以线控(数字、模拟)为主,红外遥控也占有一定的比率,极少数高档型号还支持触摸。有无更多操控方式引入呢?2010年2月,雅兰仕发布了一款型号为TT10的产品。

  • 这款音箱貌不惊人,但它却在操控方面有所突破,你可以对着音箱发出语音命令,音箱便会做出相应的操作。例如“随便来几首”,便会随机播放音乐,也可以点歌,例如喊“许巍”,便会播放许巍的歌(如果曲库中有的话),语音识别能力较强,能识别中文和英文。

  • 这款产品并不完善,它必须通过USB连接电脑,并且在PC端安装相应的软件,才能实现语音控制,其工作流程大概是这样的:

    • 音箱上的麦克风采集语音信号
      通过USB将麦克风采集到的信号送到PC端
      PC上的专用软件分析信号并“翻译”成相应的命令
      软件操控专用的播放器播放对应的音乐

    TT10基本就是按照这个工作流程实现语音控制,但它有着非常明显的局限性,它不能脱离电脑来实现语音控制,电脑是命令处理核心,离开这个核心,TT10就失去了特点。仔细看工作流程,会发现,音箱只不过在采集的时候起到了作用,其他环节的操作与TT10并没什么关系。虽然实用性不强,但雅兰仕终于迈出了语言控制的第一步。

  • 8月份的时候,雅兰仕再度发布了一款语音控制的产品TT50,并且给这款产品单独命了一个名——搜音机,与TT10相比,它进步不小,它完全可以脱离电脑使用。

  • 这种变化归功于语音处理&控制器的使用,我们收到的样品并不是量产型,这颗芯片被打磨掉了原始标记,我们估计这颗芯片可能是一款ARM或者是FPGA这类可编程芯片,在配套了相应的算法后,成为了一颗能对语音进行识别的芯片。有人觉得打磨不妥,但我们觉得无妨,真正的技术核心不是芯片本身而是语音识别技术,但如果正式产品中还是这种粗糙的处理,就显得太不正式了。

  • TT50还有一些其他的改进,它支持SD卡直读,当插入SD卡后,系统会分析SD卡上的MP3、WMA文件,并提取这些文件的一些基础信息,例如所在文件夹名、文件名、歌手名、歌曲名等,这相当于实时创建一个小型的数据库。当用户发出语音命令时,系统会根据命令创建列表并播放。由于内置了MP3、WMA解码功能,TT50相比TT10有了非常重要的变化,它已经变音箱为音响了。

    再来看看TT50的工作流程

    • 音箱上的麦克风采集语音信号
      内部的数据总线传输信号到内置的语音处理器
      处理语音信号并“翻译”成相应的命令
      根据命令检索数据,创建列表
      利用本地的解码功能播放列表中的音乐

    比起TT10的流程,TT50已经有着很大的不同,它不再需要借助体外设备来实现全功能,所有的处理、解码功能全都集成。

  • TT50还有一个比较有趣的设计,它采用锂电池供电,电池型号为BL-5C,这个型号的电池,曾经被N多型号的诺基亚手机采用,它拥有巨大的保有量,也就是说,很多用户可以让TT50和手机共享电池,这对降低使用成本大有好处。

  • 在声学设计上,TT50随了主流,采用一体式的设计,并采用了一张空纸盆来增加低频量感。这种设计已经在多款产品中出现过,这里就不再详细介绍。在实际使用当中,我们重点关注一下语音控制的有关体验。

    语音控制的方法

  • 在TT50的左侧顶部有一组按钮,其中有个“ST”,这个ST即Search Talk的缩写,意思为搜索和交谈,按住这个按钮,系统会提示一些语音信息,例如“您想听点什么”这类的,此时,TT50即进入到了语音捕捉的状态,此时用户说“汪峰”,系统就会将目录名、或文件名、或歌手们、或歌曲名为汪峰的歌曲组成一个列表进行播放。

    用户还可以说一些其他命令,例如:

    • 有什么目录
      有什么歌手
      有什么歌曲
      某目录有什么歌曲
      某歌手有什么歌曲
      ……

    语音控制的识别率

    TT50支持普通话和英语识别,实际使用时,会发现语音的识别率相当不错,对于与普通话相近的北方方言,识别率一样相当的高,对于南方方言,例如长沙话也具有较好的识别率,与普通话发音差异较大的词,识别率就低于普通话。举例郭德纲,长沙话发音guo de gan,虽然长沙话没有后鼻音,但TT50能正确识别,但例如汪峰,长沙话发音为wan hen,这个发音与普通话差异就很大了,TT50会识别失败。如果用户使用粤语,识别率就几乎为零了。我们建议雅兰仕能加入粤语支持,作为最大的方言语种,粤语不应该被忽视。

    基本上,要保持较高的识别率,最好使用普通话,普通话也并不需要太标准,但这对南方的用户,可能会有些困难,如果你对你的普通话没有信心,可能这套产品与你无缘。

    语音的识别率还和环境噪声有关,如果使用TT50的环境比较嘈杂,识别率会降低,越嘈杂,识别率就越低,反之,越安静,识别率也就越高,不过我们觉得这个倒不是问题,TT50也不适合在嘈杂环境使用。

    语音控制的实用性

    对于微型音响而言,如何快速创建播放列表是个问题。假设插入一张2G的SD卡,以平均8M一首的文件大小,能容纳200多首歌曲,而微型音响因为体积问题,不大可能加入大尺寸的显示屏和菜单系统,如何快速的实现选曲,变成了一个难题,而语音控制恰恰是解决之道。

    虽然还需要按住一个特定的按钮才能进入到语音捕捉模式,但比起上一首下一首的去翻歌曲,已经要高效太多了。我们认为,TT50的语音控制已经具备实用性。

    语音控制的错误处理机制

    产生错误一般会有两种情况,第一种就是语音识别的错误,例如前面提到用方言发出命令导致的错误,还有一种就是语音识别正确,但无法返回正确结果,例如用户报“周杰伦”,但TT50找不到SD卡中有周杰伦的歌,于是随机给了一首歌曲并播放。这种处理机制,让用户不知道出错到底是发音不正确还是因为音乐库中不存在预期的音乐导致创建列表失败,这种模糊的处理,会降低用户对TT50的信任度。这个问题已经返给雅兰仕方面,正式产品当中,会修改错误处理机制。

  • 这款产品能独成体系,应用上能获得很大的空间,这款产品可以用于卧室、厨房、阳台等等环境,偶尔带到户外也是可以的(还是大了点),在看书时、做饭时等等不适合听音乐的时候派上用场,在这些地方使用,对音质的需求并不会太高。打去年起,朗琴涉足微型音响,是因为瞅准了这个应用上的空挡,大获成功,如果雅兰仕运营得当,这款产品以及后续产品获得成功也是情理之中的事情。

    TT50音质水平谈不上多好,如果要把TT50当电脑音箱使用,也是可以的,但音质并没有竞争力,而作为移动的微型音响使用时,其音质就显得比较突出了,这个层面的产品,音质并不是最重要的,而是便利性,TT50在实际使用中,可以大幅的提高选曲的效率,而且使用中还不乏趣味性,这是技术进步的结果。

    虽然还有需要完善的地方,但已经做得不错了,其售价也不算贵,预计售价为200元人民币左右,Soomal给予雅兰仕TT50以推荐评级

    关于TT50的改进意见

    • 支持大方言语种的支持,例如粤语。
      增加语音控制的FM电台功能
      适当改善错误处理机制
    请评分
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    03
    发表于2011.09.22 16:28:12
    30
    113.113.***.***
    113.113.***.***
    市场上没有见到啊!
    数码多给咱们搞个试用活动吧!
    发表于2010.09.04 11:29:30
    29
    03
    发表于2010.09.03 00:30:44
    28
    03
    各位叔叔阿姨兄弟姐妹,我知错了。请别再鄙视继续我了,行么?
    发表于2010.08.30 12:43:34
    25
    116.016.***.***
    116.016.***.***
    诺基亚的音乐搜索,也有这个功能,运行程序后,喊:梁静茹,便会把手机上梁静茹的歌曲独立做一个播放列表。而进入播放器,一样可以很方便的搜索,输入“qkds”,就可以直接找到“旗开得胜”。当然,我的是qwer键盘。虽说google手机很红,但诺基亚多年的积累也不差呀。
    发表于2010.08.30 00:52:30
    24
    113.114.***.***
    113.114.***.***
    6楼和13楼啊,文章看的不认真。
    TT10是第一代产品,需要接电脑用,而TT50做为第二代是不需要接电脑的。
    另,这个TT50是可以识别英语的。
    最后,感觉使用粤语的人数并不多,广东省虽然有九千多万人,但是大部分人,尤其年青一代,基本上都能说普通话的。
    发表于2010.08.30 00:31:42
    23
    03
    首先,我是看错型号了。第二,我承认我看的不认真,今天必尽用的是一台普通手机在看和回复,不像在电脑上那么舒服。其实对于语音识别,能通过电脑自定义写入自己需要的语言,是很不错的

    发表于2010.08.29 19:25:59
    17
    03
    蛮新奇的玩意........呵呵呵!提出的改进意见很实在..........200元能体验一下语音控制的乐趣,确实不错......希望雅兰仕能继续发展下去,做大做强!

    发表于2010.08.29 17:10:17
    15
    10
    国外本来就严格区分cantonese和mandarin,在国外语音播放设备上,比如GPS,就是这么分的。
    发表于2010.08.29 16:03:40
    14
    03
    要识别粤语好像有点难哦,不如识别英语吧。 很多国外的音乐在这里面放还是需要英语的,比如Michael Jackson应该能被识别啊。
    发表于2010.08.29 15:10:16
    12
    提示
    本贴不可匿名回复,回复等级为:1 ,您现在正处在潜水状态
    回复
    验证码
    2878 为防止广告机贴垃圾,不得已而为之
    表情
    正文
    京ICP备11010137号 京ICP证110276号 京公网安备110114000469号