56net亚洲必赢游戏 > 地方 > 英混合和六大方言语音轻松识别百度输入法让你

原标题:英混合和六大方言语音轻松识别百度输入法让你

浏览次数:78 时间:2019-01-28

  当所有的“发声”都得到回应,越来越多的普通人拥有了深切感受AI的机会。去年1月,百度输入法用实力拉开了“AI·输入全感官输入1.0”的序幕,今年1月,百度输入法再次召开以“AI·新输入全感官输入2.0”为主题的发布会。短短一年之后,百度输入法就再次基于科技创新与功能创新,推出了一款主打全语音交互的AI输入法产品。

  据悉,当天发布的“百度输入法AI探索版”,是一款集合了多项AI能力、面向未来的全新输入产品。不仅在输入形态上,充分调动了语音、表情、动作等多方面感官,让“输入”变得便捷有趣;还在使用场景上,带来科幻电影般的新鲜体验。发布会现场,百度高级副总裁王海峰再次强调了输入法“AI落地的桥头堡”的效用,他指出,一方面,输入法是离用户最近的产品之一,另一方面,百度全方位的AI能力也在不断赋能输入法。通过AI技术的加持,用户通过文字、语音、表情、动作都能进行交互,还能实现一些更科幻的场景,高效便捷的同时也展现了未来智能蓝图。

  当用户开启百度输入法AI探索版后,点击语音按钮,除了可以说出你要记录的内容,让输入法帮你直接录入转文字,还可以呼唤“小度小度”语音助手,并说出相应指令。即可实现语音修改、发表情、发弹幕、发文件等一系列操作,满足与输入相关的周边需求,可以说,百度输入法AI探索版的核心亮点之一就是语音能力。

  百度输入法的语音能力,在过去一年中不仅有着世界领先的重大技术性突破,更有着功能性创新突破。首先,百度输入法洞察到年轻圈层的“中英文混合”表达方式,以及不同地区用户的“方言输入”需求,因此通过不断优化技术和训练新的识别模型,从而实现了“中英文混合识别”与“方言自动识别”两大功能突破。让用户可以自由地使用自己熟悉的表达方式。据悉,百度输入法是目前唯一实现了高精准中英文混合语音输入、唯一实现了方言免切换语音输入的输入法产品。

  此外,据国内产品负责人蔡玉婷现场介绍,百度输入法团队还针对网络不畅、无网络的情况,优化了输入法上嵌入式识别的Deep Peak2系统,大幅提升了离线语音识别准确率,让用户在地铁、电梯等地也可以不中断的使用语音输入,轻松搞定各种场景下的输入需求。目前,百度输入法的“离线语音”输入准确率已高于行业平均水平35%。

  而在技术层面上,百度语音技术部负责人高亮再次带来了语音识别技术的重大突破——“流式截断的多层注意力建模Streaming trancated multi-layer attention(SMLTA)”。传统的attention模型,无法做到在线语音交互的大规模实时服务,会引入较大的用户等待时间。而此次百度语音技术,在业界第一次创新性的提出的SMLAT技术,可实现层层递进的更精准的特征选择,使得语音识别的识别率超越传统的attention建模;同时,其计算速度和传统CTC技术持平,实现全CPU流量的大规模线上服务,这让百度输入法的“在线语音”相对准确率依然领先最优竞品15%。据悉,这项技术是全世界范围内,第一次基于attention技术的“在线语音识别服务”的大规模上线,标志着百度语音在线识别技术的世界领先,更是中文在线语音识别历史上的又一次突破!

  如今用户的表达方式已不只局限在文字表达上,表情包成为网络社交中不可或缺的存在。2018年百度输入法发布会上亮相的“AR表情”功能受到了众多用户的喜爱,截止目前使用量突破1亿,20%的用户都使用并分享过AR表情。

  基于领先的人脸识别技术和 AR 技术,百度输入法今年又带来了更多AR表情的新玩法。“百度输入法 AI探索版”中不仅有能操控照片中人物或动物表情的“拍立活”功能;还有将人物置身于虚拟场景的“秀场”功能;并开辟了“表情秀”社区供用户分享自制的表情包作品,社区已经有多个明星、网红及民间高手入驻。

  在大会现场,凭借发际线红遍网络的表情达人“小吴”演示了AR表情的新功能“拍立活”。当他站在体验装置前,分别作出眨眼、惊讶和咧嘴笑等各种表情时,照片中的动物也被驱动着同步做出了相同表情。除了这样玩,“小吴”还在照片中叠加了“眉有办法”“锦鲤在此”“skr”等各种表情贴纸。AR表情将“小吴”超强的表现力生动再现于图片中,让现场观众连连鼓掌。

  “百度输入法 AI探索版”中最具“未来感”的功能莫过于“凌空手写”,百度输入法技术负责人秦添也在发布会现场演示了这一功能。

  当他在空中手写下“凌空手写”四个字时,大屏幕上同步显示着一笔一划的输入轨迹,与轨迹转换成文字的过程。主持人张绍刚忍不住想尝试自己的名字,秦添又写出了“张绍刚”三个字,大屏幕再次显示着输入轨迹转换成字的过程。据百度输入法技术负责人秦添介绍,这项“凌空手写”来自全新的文字识别技术,不需要特殊的手写笔、深度摄像头或多目摄像头等硬件,最普通的RGB摄像头就可以完美支持。书写起来顺滑流畅,识别率也达到了大规模应用的要求。在“百度输入法 AI探索版”中,用户可以说“小度小度,打开凌空手写”来开启体验。

  “百度输入法 AI探索版”的语音输入、AR表情、手势识别刷新了公众对于“输入法”的认知,在AI技术的持续突破与赋能下,百度输入法还可以变得更聪明,先一步去探索全感官输入的2.0时代!(一鸣)

  中国工程院院士、中国探月工程总设计师吴伟仁此前向媒体透露,得知中国要发射“鹊桥”中继星并探测月背时,美国科学家向中方提出了多项合作请求。

  研究人员还指出,新技术也可以用于神经科学以外的研究,如艾滋病病毒如何逃避免疫系统、癌细胞如何与周围细胞相互作用等问题。

  在世界舞台上与同行高手竞技,我们必须要自创一派“中国功夫”科研道路没有捷径可走,只有脚踏实地,一步一个脚印,积累到一定程度,才有可能实现创新。

  在支持结束后,设备备份功能将延长3个月至2020年3月10日;照片上传和现有设备恢复备份等功能则可能延长1年时间。

  如果大气透明度足够好的话,公众可于当日清晨欣赏到双星“欢聚”天空、“星星相吸”争俏天宇的美丽画面。

  内华达山脉公司称,从这次测试中收集的数据将有助于帮助“追梦者”号的最终设计。

  1月16日,被誉为“中国氢弹之父”的于敏院士与世长辞,享年93周岁,为了祖国的国防事业,他隐姓埋名28年,连妻子都不知道他从事的是“这么高级的保密工作”。

  这款机器人可在有黏性或快速流动的液体中移动,并不会引起身体的排斥反应。在通过狭窄的血管等曲折的系统时,它的速度、方向和可控性都不受影响。

  综上来看,月球基地可以开展科学实验,可以为人类登陆火星提供测试场地;另一方面,私人企业也可以通过采掘氧气和氢气作为燃料来获利。

  天文学家迄今一直未弄清楚“奥陌陌”究竟是何方神圣,因为它兼具彗星和小行星的特性。

  豪斯曼称,这项研究的意义还在于,原料纤维素是地球上最丰富的天然聚合物,结晶纳米纤维素的使用方法简便且成本低廉。

  输入你想要的材料性能,新的理论会告诉你需要合成什么材料,这一概念也可以用来研发具有卓越抗菌性能或其他特性的新材料。

  记者从北京世园局了解到,世园会将充分展示5G技术在远程医疗、无人驾驶、无人物流和无人机等多行业的创新型应用示范。

  毛有东介绍,这些三维结构展现了惊人的时空连续性,生动呈现了原子水平的蛋白酶体和底物相互作用的动态过程。

  海宏号的启用,意味着跨海隧道工程领域,中国又掌握了一项绝技,给海底长大隧道施工开辟了新天地,因此被媒体广泛关注。

  2019年气象部门将发展智慧气象服务,推动智能生产、双向互动、集约高效的气象服务能力建设,试点开展面向公众的个性化、定制化气象信息服务。

  据了解,这款列车是目前国内最轻的铝合金地铁车辆,采用B型铝合金车体,每列车共六节车厢,最高时速达80公里,最大载客量为2062人。

  IPCC此前认为,稻田秸秆还田对甲烷排放的促进效应仅与还田量有关,与还田年限无关。该成果不仅可为全球稻田温室气体排放估算提供重要参数,更可以矫正社会对稻田秸秆还田的认识。

  基因测序技术是生命科学和生物科技的核心技术之一,目前正处在从主流的二代测序技术向三代技术进行产业升级的过渡阶段。

  沙门氏菌是一种全球性的重要的食源性人畜共患病致病菌。目前,能够消除细胞内沙门氏菌的有效方法仍然非常有限。

本文来源:英混合和六大方言语音轻松识别百度输入法让你

上一篇:超市门摇摇乐”英语怎么说

下一篇:语发音阅读提升小技巧