图片 3

打造世界级人工智能开放平台

自然语言处理技术也在持续创新突破。如百度近期发布的基于知识增强的ernie模型,通过建模海量数据中的实体概念等先验语义知识,学习真实世界的语义关系。这种融合知识的语义建模大幅增强了模型的语义表示能力,在包括语言推断、语义相似度、命名实体识别、情感分析、问答匹配等自然语言处理各类任务上的多个公开中文数据集上,均取得了优于谷歌bert模型的效果。百度的语言与知识技术已经广泛应用于机器翻译、智能搜索、智能写作等产品中。

他提到,近年来深度学习的崛起及其与大数据的结合,使人工智能得到飞跃式的发展。在自然语言处理领域,深度学习模型具有比传统机器学习模型更强的数据学习能力,使得基于深度学习的依存句法分析等自然语言处理系统准确率得到大幅提升。目前,深度学习领域主要有强化学习、监督学习、无/自监督学习三种学习范式,而无/自监督学习可以类比人类学习,是一种重要的学习方式。

在演讲结束后,王海峰还参与了“技术引领+产业引领”高峰对话,与中国工程院院士樊邦奎、中国电子科技集团公司首席科学家陆军、中科大信息科学技术学院执行院长吴枫教授、阿里巴巴技术委员会主席王坚等在内的学界、产业界人士,就人工智能技术如何推动和引领科技与产业发展进行了探讨。他表示,未来,百度还将持续发力,推动AI技术创新,为国家创新驱动发展战略和各行各业的智能化升级持续贡献力量。

综合领先的人工智能技术,用户可以体验到流畅、便捷的多模态交互。用说话的方式搜索想了解的信息,返回的答案准确、直观,可以听到和看到。进一步地,融合语音、视觉、知识图谱和语言理解等技术,人工智能核心技术发展进入“多模态深度语义理解”阶段。以基于知识图谱的视频语义理解为例,结合知识图谱,从视频中抽取结构化语义知识,进行关联与计算,形成对视频的结构化理解。

语言理解技术持续发展,并通过与知识图谱、深度学习等技术融合,正不断提高各种应用的智能化程度。王海峰在演讲中介绍,百度创新地融合知识图谱、自然语言处理及深度学习技术,研发了能够深刻理解用户意图、精准满足搜索需求、提供更丰富知识内容的智能搜索引擎,并结合语音、图像、增强现实等感知技术能力,更便捷地与用户交互,为用户提供更精准高效的信息服务。

百度领先的语言与知识技术,不仅广泛应用于智能搜索、深度问答、对话系统、智能写作、机器翻译等领域,为广大用户提供更智能的体验,满足用户对信息和服务的需求,还通过百度大脑平台全面开放,促进行业应用和创新。

王海峰介绍,百度构建了世界上最大的多元异构知识图谱,在包含数亿实体、千亿级事实,能够满足90%用户需求的实体图谱的基础上,针对不同的应用场景和知识形态建立起关注点图谱、行业知识图谱、poi图谱、事件图谱等多种知识图谱,“知识图谱与深度学习技术相结合,会对人工智能进一步发展产生巨大的推动作用。”

4月20日,第十四届中国电子信息技术年会上,“百度大脑核心技术及开放平台”荣获2018年度中国电子学会科学技术奖科技进步奖一等奖。评议认为,百度大脑突破了听觉、视觉和语言一体化的多模态语义理解技术难题,成果支持零门槛深度学习定制化训练和千亿特征的神经网络训练,打造了一个完整的人工智能技术开放体系,并通过统一人工智能开放平台向社会共享,带动了互联网行业技术创新,推动了传统行业的智能化转型。

百度大脑扎实领先的技术实力,也在通过开放赋能深入与实体经济融合,服务各行各业和亿万用户。百度大脑已对外开放了160多项领先的AI能力,广泛应用于互联网、交通、工业、医疗、零售、金融等诸多领域。比如,在医疗领域,基于百度大脑能力打造的百度灵医,布局诊疗全流程,帮助提升诊疗效率,从而惠及更多患者;在农业领域,智能摇杆拍摄光谱可以借助图像识别技术精准估算不同田地的农药使用量,有针对性地施药杀虫,减少了用药浪费的情况,也更符合环保需求;工业应用方面,基于百度深度学习平台PaddlePaddle打造的智能零件分拣机,分拣精度可达到90%,预测速度较同类产品快20%。同时,百度大脑与政府合作,如与雄安新区管委打造智能城市、与天津市政府打造“天津智港”等,提升公共服务和城市管理能力,让AI惠及大众。

作为国内投入最早、技术最强、布局最完整的领军ai企业,百度在ai技术领域保持领先优势,积极建设人工智能开源开放平台,推动应用落地,促进产业智能化的发展。

百度领先的语言与知识技术,不仅广泛应用于智能搜索、深度问答、对话系统、智能写作、机器翻译等领域,为广大用户提供更智能的体验,满足用户对信息和服务的需求,还通过百度大脑平台全面开放,促进行业应用和创新。

百度高级副总裁、AI技术平台体系和基础技术体系总负责人王海峰

在认知技术上,百度建立了完整的、包含知识图谱、语言理解、语言生成等在内的语言和知识技术布局。

例如,用户用自然语言搜索“林徽因的丈夫的父亲是谁”,智能搜索引擎能够理解用户的意图,并结合知识图谱以图文并茂的形式把答案“梁启超”精准呈现给用户。又如,用户搜索“上面草字头下面句子的句是什么字”,智能搜索引擎能够为用户提供“苟”的读音、笔画、释义等丰富的信息。

百度大脑是百度AI技术多年积累的集大成,包含语音、视觉、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台。从2016年百度世界大会上宣布百度大脑完成基础能力搭建和核心技术初步开放,到2018年7月百度AI开发者大会发布百度大脑3.0,百度大脑已经构建起AI全栈技术布局,发展进入“多模态深度语义理解”阶段。在应用层面,百度大脑在全面支持百度业务的同时,全方位对外开放,通过赋能开发者和合作伙伴,发展AI技术生态,加速
AI 技术落地应用并与实体经济相融合,助力各行各业转型升级。

在数据、算法和算力三要素的共同作用下,尤其是深度学习的突破,人工智能技术取得巨大进步。

除了智能搜索方面的应用,百度还基于语言理解和生成技术提供智能写作等能力。智能写作适用于财经、体育、天气、热点与娱乐事件等多领域的辅助与自动写作,大幅提升创作效率。比如,基于结构化的股票数据,可以生成关于股市的快讯新闻。结合视觉技术的智能春联,可通过刷脸检测出人物性别、年龄、微笑程度、性格特征等,生成特征词,然后基于神经网络生成技术创作出应景的春联,让人工智能技术融入大众的文化娱乐生活。

例如,用户用自然语言搜索“林徽因的丈夫的父亲是谁”,智能搜索引擎能够理解用户的意图,并结合知识图谱以图文并茂的形式把答案“梁启超”精准呈现给用户。又如,用户搜索“上面草字头下面句子的句是什么字”,智能搜索引擎能够为用户提供“苟”的读音、笔画、释义等丰富的信息。

王海峰表示,我们正身处以人工智能为核心驱动力量的第四次工业革命浪潮中,国家高度重视,认为人工智能是新一轮科技革命和产业革命的重要驱动力量。美国、欧盟、日本等也在纷纷布局人工智能,从国家战略层面推动人工智能技术快速发展和应用。

百度大脑是百度ai技术多年积累的集大成,包含语音、视觉、自然语言处理、知识图谱、深度学习等ai核心技术和ai开放平台。从2016年百度世界大会上宣布百度大脑完成基础能力搭建和核心技术初步开放,到2018年7月百度ai开发者大会发布百度大脑3.0,百度大脑已经构建起ai全栈技术布局,发展进入“多模态深度语义理解”阶段。在应用层面,百度大脑在全面支持百度业务的同时,全方位对外开放,通过赋能开发者和合作伙伴,发展ai技术生态,加速
ai 技术落地应用并与实体经济相融合,助力各行各业转型升级。

智能客服是结合自然语言处理、知识图谱和语音等技术打造的行业解决方案。在智能客服场景中,基于语音语义一体化技术,百度大脑可以准确识别出用户的话语,理解用户意图,进而通过行业知识图谱的赋能理解业务流程,为用户提供相应的服务。整个服务过程流畅自然,实现了与用户无障碍沟通,提升业务效率并满足用户需求。

计算机视觉技术也越来越实用化,形成适用于不同应用场景的技术矩阵,如图像检测、细粒度图像识别、图像处理,以及文字识别、人脸/人体识别、人体追踪、视频理解、图像生成等。比如门禁、支付等场景中的“刷脸”技术、爱奇艺等视频平台广泛应用的视频理解等技术。近期业界热议的图像生成技术,可以合成人说话的形象及声音,“ai虚拟主持人”正是基于这一技术得以登上荧幕。

自监督学习让基于大规模无标记语料的语言模型得到了长足的发展。近期,
谷歌、百度分别提出了无监督文本的预训练语言模型bert、ernie,将自然语言处理任务的性能提升到新高度。百度提出的基于知识增强的ernie
模型,通过建模海量数据中的实体概念等先验语义知识,学习真实世界的语义关系。相较于谷歌
bert基于字单元的语义建模,ernie直接对先验语义知识单元进行建模,并通过海量文本数据学习实体间的语义关系。这种融合知识的语义建模大幅增强了模型语义表示能力,在包括语言推断、语义相似度、命名实体识别、情感分析、问答匹配等自然语言处理各类任务上的多个公开中文数据集上,ernie均取得了优于bert的效果。

如何理解和运用自然语言,是人工智能需要解决的核心问题之一。当下,大数据、知识图谱、机器学习、深度学习等技术快速发展,并与自然语言处理密切结合,推动语言智能持续发展和突破,并越来越多地应用于各个行业。

基于完整的技术布局和领先的ai核心技术,百度构建了全体系、功能丰富的人工智能开源开放平台,包括算法的开源和数据的开放、通用及定制ai能力的开放、硬件开放平台、端部署平台、私有化部署平台等,从而支撑第三方服务和行业应用。其中,深度学习框架,下接芯片、大型计算集群,上承各种业务模型、行业应用,尤为重要,相当于“智能时代的操作系统”。百度打造了国内唯一完整、全套的深度学习平台paddlepaddle,通过包括核心框架、工具组件和服务平台在内的一整套框架和服务,帮助广大开发者和企业利用工具化、平台化的方式,进一步降低深度学习应用门槛,推动产业智能化变革。

百度从诞生之日就和ai息息相关,多年来持续大力投入ai技术研发,推动百度大脑不断取得突破。截至目前,百度大脑已获相关技术发明专利授权200余项,在国际期刊和学术会议上发表相关论文100多篇,多次在webvision、activitynet、nips、semeval等国际知名人工智能竞赛或测试中夺得桂冠。百度连续三年上榜全球知名科技媒体《麻省理工科技评论》“全球十大突破性技术”榜单。国际期刊《自然》评价称“百度已成长为以ai技术为重心的科技巨头”。

中国电子学会科学技术奖是国内电子信息技术发展的风向标。作为新一轮科技革命和产业变革的重要驱动力量,人工智能正在给国家社会经济发展、社会生产关系变革和普通大众的日常生活带来深远影响。今年两会《政府工作报告》中首提“智能+”战略,各行各业也都掀起了运用人工智能技术推动创新发展的热潮。作为国内最早布局人工智能的企业之一,百度不断进行AI技术的研究探索和应用落地实践,并通过开放赋能,为推动AI技术应用和创新积极贡献力量。

在2019全球人工智能产品应用博览会主论坛上,百度高级副总裁、深度学习技术及应用国家工程实验室主任王海峰发表《新一代人工智能技术与应用》主题演讲,表示“新一代人工智能技术正在越来越深入地与产业相融合,促进产业智能化。”

多模态知识与语言、视觉等技术结合,发展进入“多模态深度语义理解”阶段。例如,基于知识图谱的视频理解技术,能够从视频中抽取结构化语义知识,真正“看懂”视频。

图片 1

语音识别的准确率不断提升,在很多场景中已经超过人类。王海峰展示了基于百度语音识别技术的百度输入法“中英自由说”能力,这是目前唯一实现高精度中英文混合语音输入的产品。语音合成也取得巨大进展。百度近期上线的并行wavernn模型,解决了wavenet模型需要大量计算资源的问题,合成效果大幅提升,同时能够满足在线的实时需求。结合麦克风阵列、低功耗语音芯片、高精度唤醒,以及模型波束等技术,百度领先的语音技术,应用于智能家居、车载设备、手机等,软硬结合,发挥出越来越大的价值。

依托深度学习技术的发展,语音、图像等感知技术取得了巨大进步,但认知技术的突破会越来越依赖知识,需要提升对知识和大规模知识图谱的运用。在物理世界、人类社会和网络空间中,汇聚了大量的多元、异构、多模态的数据,百度借助无标签大数据开放域知识挖掘、知识体系自动扩展、知识整合等技术,基于海量数据构建起了超大规模知识图谱。目前,百度拥有世界上最大的多元异构知识图谱,除了包含数亿实体、千亿级事实,能够满足90%用户需求的实体图谱,针对不同的应用场景和知识形态,百度还建立起关注点图谱、行业知识图谱、poi图谱、事件图谱等多种知识图谱。比如在医疗领域,能够从病历等原始文本中,抽取出实体及多元关系,并进行文本结构化,最终构建起医疗图谱,同时结合医疗大数据、医疗认知计算,应用于医疗临床辅助决策服务中。

4月20日,第十四届中国电子信息技术年会上,“百度大脑核心技术及开放平台”荣获2018年度中国电子学会科学技术奖科技进步奖一等奖。评议认为,百度大脑突破了听觉、视觉和语言一体化的多模态语义理解技术难题,成果支持零门槛深度学习定制化训练和千亿特征的神经网络训练,打造了一个完整的人工智能技术开放体系,并通过统一人工智能开放平台向社会共享,带动了互联网行业技术创新,推动了传统行业的智能化转型。

王海峰是人工智能技术研究及产业化应用的领军人物,在国内外学界和工业界享有盛誉。他领导的百度人工智能,布局全面,技术成果业界领先,并逐步在各行各业落地应用,他也由此被评价为“既有前瞻视野,又擅长将人工智能技术与实际应用相结合”的科学家。

《中国科学报》 (2019-04-22 第7版 能源化工.综合)

多模态知识与语言、视觉等技术结合,发展进入“多模态深度语义理解”阶段。例如,基于知识图谱的视频理解技术,能够从视频中抽取结构化语义知识,真正“看懂”视频。

图片 2

百度大脑扎实领先的技术实力,也在通过开放赋能深入与实体经济融合,服务各行各业和亿万用户。百度大脑已对外开放了160多项领先的ai能力,广泛应用于互联网、交通、工业、医疗、零售、金融等诸多领域。比如,在医疗领域,基于百度大脑能力打造的百度灵医,布局诊疗全流程,帮助提升诊疗效率,从而惠及更多患者;在农业领域,智能摇杆拍摄光谱可以借助图像识别技术精准估算不同田地的农药使用量,有针对性地施药杀虫,减少了用药浪费的情况,也更符合环保需求;工业应用方面,基于百度深度学习平台paddlepaddle打造的智能零件分拣机,分拣精度可达到90%,预测速度较同类产品快20%。同时,百度大脑与政府合作,如与雄安新区管委打造智能城市、与天津市政府打造“天津智港”等,提升公共服务和城市管理能力,让ai惠及大众。

当然,自然语言理解技术也面临着数据稀疏、知识未被有效利用、结合场景的语用研究等挑战。但王海峰表示:“随着技术发展,我们会越来越深入地理解自然语言、掌握知识,推动人工智能发挥更大的价值,为人类社会发展提供更大的助力。”

不同的行业,都在应用人工智能技术提升质量和效率,加速智能化进程。例如,百度地图基于深度学习技术实现路线规划和时间预估,方便用户的出行。深度学习应用于国家重大工程用地的变化情况检测,辅助政府对土地资源的利用进行有效管理与控制,让ai技术利国利民。在钢铁行业中,基于深度学习预测、大数据分析和图像识别打造的智能钢包管理系统,实现了对运转温度、压力等数据的实时采集和分析处理,帮助钢铁企业推进钢包管理的智能化和自动化。

百度高级副总裁、ai技术平台体系和基础技术体系总负责人王海峰

百度从诞生之日就和AI息息相关,多年来持续大力投入AI技术研发,推动百度大脑不断取得突破。截至目前,百度大脑已获相关技术发明专利授权200余项,在国际期刊和学术会议上发表相关论文100多篇,多次在WebVision、ActivityNet、NIPS、SemEval等国际知名人工智能竞赛或测试中夺得桂冠。百度连续三年上榜全球知名科技媒体《麻省理工科技评论》“全球十大突破性技术”榜单。国际期刊《自然》评价称“百度已成长为以AI技术为重心的科技巨头”。

新一代人工智能技术蓬勃发展,已经在逐步变革人们的生产、生活方式,越来越多地与传统产业相结合,推动产业智能化的持续发展。王海峰表示,百度将持续推动人工智能发挥更大的价值,为促进国家社会经济发展和各行各业的智能化升级贡献力量。

智能客服是结合自然语言处理、知识图谱和语音等技术打造的行业解决方案。在智能客服场景中,基于语音语义一体化技术,百度大脑可以准确识别出用户的话语,理解用户意图,进而通过行业知识图谱的赋能理解业务流程,为用户提供相应的服务。整个服务过程流畅自然,实现了与用户无障碍沟通,提升业务效率并满足用户需求。

他提到,近年来深度学习的崛起及其与大数据的结合,使人工智能得到飞跃式的发展。在自然语言处理领域,深度学习模型具有比传统机器学习模型更强的数据学习能力,使得基于深度学习的依存句法分析等自然语言处理系统准确率得到大幅提升。目前,深度学习领域主要有强化学习、监督学习、无/自监督学习三种学习范式,而无/自监督学习可以类比人类学习,是一种重要的学习方式。

当然,自然语言理解技术也面临着数据稀疏、知识未被有效利用、结合场景的语用研究等挑战。但王海峰表示:“随着技术发展,我们会越来越深入地理解自然语言、掌握知识,推动人工智能发挥更大的价值,为人类社会发展提供更大的助力。”

自监督学习让基于大规模无标记语料的语言模型得到了长足的发展。近期,
谷歌、百度分别提出了无监督文本的预训练语言模型BERT、ERNIE,将自然语言处理任务的性能提升到新高度。百度提出的基于知识增强的ERNIE
模型,通过建模海量数据中的实体概念等先验语义知识,学习真实世界的语义关系。相较于谷歌
BERT基于字单元的语义建模,ERNIE直接对先验语义知识单元进行建模,并通过海量文本数据学习实体间的语义关系。这种融合知识的语义建模大幅增强了模型语义表示能力,在包括语言推断、语义相似度、命名实体识别、情感分析、问答匹配等自然语言处理各类任务上的多个公开中文数据集上,ERNIE均取得了优于BERT的效果。

中国电子学会科学技术奖是国内电子信息技术发展的风向标。作为新一轮科技革命和产业变革的重要驱动力量,人工智能正在给国家社会经济发展、社会生产关系变革和普通大众的日常生活带来深远影响。今年两会《政府工作报告》中首提“智能+”战略,各行各业也都掀起了运用人工智能技术推动创新发展的热潮。作为国内最早布局人工智能的企业之一,百度不断进行ai技术的研究探索和应用落地实践,并通过开放赋能,为推动ai技术应用和创新积极贡献力量。

《中国科学报》 (2019-04-22 第7版 能源化工.综合)

■苏超

依托深度学习技术的发展,语音、图像等感知技术取得了巨大进步,但认知技术的突破会越来越依赖知识,需要提升对知识和大规模知识图谱的运用。在物理世界、人类社会和网络空间中,汇聚了大量的多元、异构、多模态的数据,百度借助无标签大数据开放域知识挖掘、知识体系自动扩展、知识整合等技术,基于海量数据构建起了超大规模知识图谱。目前,百度拥有世界上最大的多元异构知识图谱,除了包含数亿实体、千亿级事实,能够满足90%用户需求的实体图谱,针对不同的应用场景和知识形态,百度还建立起关注点图谱、行业知识图谱、POI图谱、事件图谱等多种知识图谱。比如在医疗领域,能够从病历等原始文本中,抽取出实体及多元关系,并进行文本结构化,最终构建起医疗图谱,同时结合医疗大数据、医疗认知计算,应用于医疗临床辅助决策服务中。

在演讲结束后,王海峰还参与了“技术引领+产业引领”高峰对话,与中国工程院院士樊邦奎、中国电子科技集团公司首席科学家陆军、中科大信息科学技术学院执行院长吴枫教授、阿里巴巴技术委员会主席王坚等在内的学界、产业界人士,就人工智能技术如何推动和引领科技与产业发展进行了探讨。他表示,未来,百度还将持续发力,推动ai技术创新,为国家创新驱动发展战略和各行各业的智能化升级持续贡献力量。

会上,百度高级副总裁、AI技术平台体系和基础技术体系总负责人王海峰发表以《语言与智能》为题的主旨演讲,结合语言与知识相关技术的发展变化,以及百度在相关技术领域创新和应用发展的经验,阐释语言与智能的关系及技术趋势。

会上,百度高级副总裁、ai技术平台体系和基础技术体系总负责人王海峰发表以《语言与智能》为题的主旨演讲,结合语言与知识相关技术的发展变化,以及百度在相关技术领域创新和应用发展的经验,阐释语言与智能的关系及技术趋势。

除了智能搜索方面的应用,百度还基于语言理解和生成技术提供智能写作等能力。智能写作适用于财经、体育、天气、热点与娱乐事件等多领域的辅助与自动写作,大幅提升创作效率。比如,基于结构化的股票数据,可以生成关于股市的快讯新闻。结合视觉技术的智能春联,可通过刷脸检测出人物性别、年龄、微笑程度、性格特征等,生成特征词,然后基于神经网络生成技术创作出应景的春联,让人工智能技术融入大众的文化娱乐生活。

如何理解和运用自然语言,是人工智能需要解决的核心问题之一。当下,大数据、知识图谱、机器学习、深度学习等技术快速发展,并与自然语言处理密切结合,推动语言智能持续发展和突破,并越来越多地应用于各个行业。

打造世界级人工智能开放平台 百度大脑获中国电子学会科技进步奖一等奖

图片 3

语言理解技术持续发展,并通过与知识图谱、深度学习等技术融合,正不断提高各种应用的智能化程度。王海峰在演讲中介绍,百度创新地融合知识图谱、自然语言处理及深度学习技术,研发了能够深刻理解用户意图、精准满足搜索需求、提供更丰富知识内容的智能搜索引擎,并结合语音、图像、增强现实等感知技术能力,更便捷地与用户交互,为用户提供更精准高效的信息服务。

发表评论