澳门新葡亰平台官网

百度联合发布全球最大中文自然语言处理数据共建计划“千言”

  层面的技术突破将进一步促进AI深入发展。语言与知识技术是人工智能认知能力的核心。2010年,百度成立自然语言处理部,在前瞻技术与格局上实现引领和创新。十年来,百度大脑语言与知识技术获得包括国家科技进步奖在内的20多个奖项,30多项国际竞赛冠军,发表学术论文超过300篇,申请专利2000多项。

  百度CTO王海峰介绍,知识图谱是机器认知世界的重要基础,百度已经打造了世界上最大规模知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新。百度知识图谱应用于各行各业,每天的调用次数超过400亿次。同时,在融入知识的基础上,语言理解能力不断增强。基于预训练技术的成功经验,百度还提出基于多流机制的语言生成预训练技术,兼顾词、短语等不同粒度的语义信息,提升生成效果。

  同日,百度集团副总裁吴甜接续发布语义理解技术与平台文心、智能文档分析平台TextMind和AI同传会议解决方案3大新产品,同时发布了6项升级,包括智能创作平台的3个场景方案、以及智能对话定制与服务平台UNIT的3项全新升级。

  据悉,百度推出的语义理解技术与平台文心,基于深度学习平台飞桨打造,依托语义理解核心技术,集成预训练模型、全面的NLP算法集、端到端开发套件和平台,提供一站式NLP开发与服务,让开发者更简单、高效地定制企业级NLP模型。全新发布的智能文档分析平台TextMind,基于OCR、NLP技术,以文档解析为核心能力,支持文档对比与文档审核,具备“多快好省”的核心优势,促进企业办公智能升级。

  百度大脑智能创作平台针对媒体应用场景再升级,全新推出智能策划、智能采编、智能审校三大媒体场景方案,进一步助力媒体人更快、更好地创作。智能对话定制与服务平台UNIT升级3大特性:更智能的任务式对话理解、极致便捷的表格问答和融合通用的新对话引擎。此次UNIT全新升级的三大能力,将进一步降低任务式对话、智能问答的定制成本,并融合通用对话能力,提升交互体验。

  同时,百度联合中国计算机学会、中国中文信息学会发起中文自然语言处理数据共建计划——千言,解决数据稀缺问题。千言一期由来自国内11家高校和企业的数据资源研发者共同建设,已涵盖开放域对线余个中文开源数据集。

  百度技术委员会主席吴华表示,“未来我们希望有更多的数据集作者能够参与共建千言,共同推动中文信息处理技术的进步,建设世界范围的中文信息处理影响力。我们计划在未来3年,面向20多个任务,收集和建设不少于100个中文自然语言处理数据集,覆盖语言与知识技术全部领域。”

上一篇:评价环节:语言、表格评价课例:中学英语《What do you like?》【焦

下一篇:没有了