钱江晚报 数字报纸


b0012版:乌镇时间·论剑

首秀实时机器同传,让大咖们纷纷拿下了耳机

搜狗CEO王小川叫板李彦宏

本报记者詹丽华采访王小川。

  本报讯 跟差点被网友们“玩坏”的网红丁磊、周鸿祎、雷军相比,搜狗公司CEO王小川的画风明显不同,他不玩直播,很少为产品站台。

  这次在乌镇,王小川担任了移动互联网论坛的主持兼压轴演讲人,他演示了全场最精彩的“黑科技”——机器同传,首秀了实时机器语音识别并同步中英文翻译、显示,让杰瑞·卡普兰等人工智能领域的大咖都纷纷摘下同传耳机,感受这不同寻常的“同传”。

  可结果,他居然忘记说这是全球首次基于神经网络的实时机器翻译技术演示,白白错失技术首次曝光的最佳传播窗口。“记忆力是我最不擅长的。”一见到记者,王小川就万分懊恼地吐槽自己记性特别差,随后又偷着乐,“幸好我还有更牛的技术藏着。”

  在王小川现场演讲时,他身后的屏幕上一直实时滚动出现中英文双语的文字显示,比如当他说到“搜索的未来就是人工智能时代的皇冠”时,屏幕上实时显示出了“In the future,search will be the Crown of the AI Era”。而且,随着他的话语逐渐完整,屏幕上显示的内容也自动修改。

  “你看屏幕上的内容在变,是因为机器会随着我讲的内容逐渐完整,根据语义自动修改调整之前识别的内容,做更准确的传译。”王小川说,从现场演示效果来看,搜狗语音识别准确率已超过95%,机器翻译准确率在90%左右。“我们近期做人工评测时,搜狗机器翻译在演讲、旅游、闲聊、日常口语等领域,采用五分制人工评分能达到4.4分。”

  4.4分听起来似乎不是那么完美,但搜狗的这次演示已经是目前公开进行的机器同声传译中第一个成功的了,此前,也有公司做过尝试,但都没有经受住现场语音识别同传的考验。

  “我还有一个小玩意儿,但目前还不准备发布。”说得兴起,王小川拿起手机给记者看他独一份的DEMO程序,“这也是搜狗自主研发的,端到端神经机器翻译技术,比如你输入中文,一按发送,对方收到的内容其实是英文。或者你用中文说一句话,对方听到的却是英文。用循环神经网络生成翻译结果,比传统机器翻译更加流畅,也更准确。”

  王小川说做语音识别同声中英文传译他们的团队大概花了两三个月时间。“那是因为在此之前我们已经积累了大量的数据资源。”

  同样是做搜索,同样也做输入法,甚至同样开始研究人工智能的现实应用,王小川信心十足地说:“随着百度的衰退,总要有人顶上去。”言下之意是:顶上去的为什么不能是搜狗呢? 本报记者 詹丽华


钱江晚报 乌镇时间·论剑 b0012 搜狗CEO王小川叫板李彦宏 2016-11-18 钱江晚报2016-11-1800023;12982315| 2 2016年11月18日 星期五