|
不甘落后 facebook语音助手技术从vr头显开始 |
绍兴装监控:www.hao9588.com 来源:绍兴监控安装 发表时间:2017-7-8 15:55:02 点击:424 |
oculus虚拟现实头显
凤凰科技讯据cnbc北京时间7月8日报道,苹果有siri,亚马逊有alexa,微软开发了小娜,alphabet发布了谷歌助手。
科技巨头竞相通过硬件产品和应用向消费者提供语音识别技术,但很奇怪的是一家公司缺席了:facebook。
虽然马克·扎克伯格(mark zuckerberg)已经使facebook应用在全球范围内得到普及——上周facebook全球活跃用户突破20亿、whatsapp活跃用户达到12亿,但是,在语音助手方面,facebook落后于竞争对手。
语音助手太过重要,facebook不会对此无动于衷。市场研究公司markets and markets去年预测,2022年全球语音识别市场可能达到100亿美元。除利润外,互联网公司需要大量用户使用它们的语音工具,以积累大量数据,进一步改进服务。
在发布语音技术方面,硬件厂商有很大优势,因为它们直接面向消费者。不同于苹果、亚马逊和alphabet的是,facebook没有被亿万消费者广泛使用的硬件产品或移动操作系统。
facebook旗下一款硬件产品是oculus虚拟现实头显。facebook要进军语音识别市场,oculus成为了试验田之一。
facebook的想法是,在佩戴虚拟现实头显时,用户可以说出“hey oculus”和自己的问题,然后收到反馈信息。例如,用户可以要求打开一款特定游戏或搜索应用商店。这一米乐网页的技术支持oculus rift和三星gear vr头显——后者使用了oculus技术。
facebook应用机器学习集团负责人杰奎因·奎因尼罗·坎德拉(joaquin quinonero candela)上周在接受采访时说,“要操纵任何无需动手的界面,用户肯定需要用到语音。”
facebook对语音识别技术的应用不仅仅局限于oculus。它还部署了一个系统,自动地生成视频字幕。facebook在开发更多采用语音识别技术的产品。
2013年从纽约大学挖来扬·乐库恩(yann lecun),标志着facebook涉足人工智能领域。乐库恩是人工智能专家,领导着新成立的facebook人工智能研究部门。
push和pull
数个月内,facebook以乐库恩研究部门的技术为基础,开发出适合在市场上发布的产品。facebook后来成立了应用机器学习部门,负责人是坎德拉——曾在微软研究院任职。
尽管最近数年alphabet、苹果和微软一直在大肆宣扬系统精度的提升,但facebook在语音识别领域却相当低调。
坎德拉表示,约2年半前,他的部门开始开发语音增强产品,并得到jibbigo——facebook 2013年收购的一家创业公司——的帮助。
坎德拉说,facebook的研发活动分为两大类:push和pull。“push”指认为某一技术未来会有多方面用途,然后开始开发;“pull”指工程师提出需要开发的技术。语音识别属于“push”类技术。
研究人员提到的语音识别技术的一种使用场景,是自动生成视频字幕。谷歌在2009年就开始这一方面的研究。
发现问题
facebook最初专注于广告。当时的情况是,用户在关闭声音的情况下翻看自己的信息流,为了使广告更容易被用户注意到,广告客户需要在视频中添加文本。
facebook语音架构集团工程师雷娜·菲利普(reena philip)表示,通过与广告团队合作,“我们开发出了原型产品”。
facebook去年第二季度发布了这一功能。facebook则继续深挖这一技术,自动为发布到其服务中的视频生成字幕。
坎德拉说,“我们进行过试验——增添字幕后,视频观看量增长了2位数。”
与视频字幕生成系统不同的是,oculus语音识别功能是“pull”的一个案例。
随着应用和游戏越来越多,gear vr用户要找到喜欢的内容越来越困难。大声说出来成为获得具体内容的一种方法。
facebook还需要确保与gear vr配套的三星智能手机也能响应“hey oculus”命令。与oculus rift不同的是,gear vr由配套手机提供运算能力,它本身没有强大的运算能力。
苹果和谷歌已经把语音激活开关整合到手机中,现在facebook也要这样做。
菲利普表示,语音识别技术第四季度登陆oculus时,它只支持美国英语,但团队已经开始为它增添更多种类的英语“方言”。
菲利普说,随着时间推移,facebook可能使oculus语音识别技术能在线下运行。facebook还可能最终支持英语之外的其他语言。
除此之外,facebook员工并不清楚公司在语音识别技术领域未来的发展。
目前,facebook主要业务是社区。这可能决定facebook语音识别技术的未来发展方向。facebook产品经理默林·邓(merlyn deng)说,“我们未来的语音识别技术必须与公司使命,以及我们掌握的数据相契合。(编译/霜叶)
新鲜有料的产业新闻、深入浅出的企业市场分析,轻松逗比的科技人物吐槽。 |
|
|
|
|
|
|