医疗知识中台白皮书画册-KPMG_百度智能云__48页_6mb.pdf
医疗知识中台白皮书序近年来,随着经济的快速发展和社会的不断进步,人民群众对医疗服务的质量及精细化程度要求不断提高。与此同时,当前医疗资源在配置方面仍存在着诸如优质医疗资源分布过度集中、基层医疗诊疗能力薄弱等问题。随着中国医疗卫生领域体制改革的不断深化,具有中国特色的创新型医疗健康服务体系正在逐步形成。同时,在云计算、大数据和人工智能等技术的驱动下,互联网线上问诊、临床辅助诊疗、病案质控等创新性医疗业务场景已经从概念走向实际应用,为缓解医疗资源供需矛盾带来新的解决思路。百度是拥有强大互联网基础的领先 AI 公司,在云计算、大数据和人工智能等领域具有深厚的技术积累和丰富的产业实践,形成了从技术到平台、应用、生态和人才培养的完整产业发展赋能体系。在技术创新方面,突破知识增强的跨模态深度语义理解关键技术,形成超大规模知识图谱和知识增强大模型;同时,为降低行业生态伙伴应用 AI 技术的门槛,打造平台,自主研发了飞桨产业级深度学习开源开放平台,为产业智能化升级提供支撑。在医疗健康领域,百度携手人民卫生出版社、中华医学会等权威医疗知识服务机构,进行医疗行业的数据积累和知识沉淀,打造“数据+知识”双驱动的智慧医疗整体解决方案,构建权威、专业、可循证的医疗知识服务平台,并广泛应用在医疗健康服务和诊疗业务场景,已经为 400余家医疗机构、超过 1,500 万的患者提供医疗知识服务。在可以预见的未来,新兴技术驱动的创新型医疗健康服务体系将日趋完善。医疗知识服务的智能化开放平台,将具有更多的应用场景和更大的市场空间。衷心希望,新技术能够带来更多积极力量,推动医疗行业发展,为人民群众的健康生活带来更多幸福。01引言目录CONTENTS03一、医疗行业发展面临的新挑战0407091.1 医疗健康服务需求不断攀升,对医疗资源分布配置提出新挑战1.2 人均医疗资源供给依旧不足,优质医疗资源分布过于集中1.3 政策推陈出新解决供需矛盾,推动优质医疗资源扩容下沉11二、新兴技术助力医疗行业向知识化、智能化、中台化迈进1214162.1 医疗知识是医疗行业的根基,显性化表达将成为新趋势2.2 AI技术加速提升机器认知能力,为医疗行业智能化发展注入新活力2.3 构筑中台是医疗机构智能化升级的关键抓手,也是能力沉淀的有效途径17三、医疗知识中台遵循医疗逻辑的智能化开放平台181921273.1 基本定位3.2 架构分层3.3 产品功能3.4 产品特征35五、未来发展展望36375.1 建设路径5.2 生态发展38结束语29四、赋能用户3132334.1 医疗机构智能化升级4.2 区域医疗中心/医联体建设4.3 医疗IT公司智能化应用开发医疗知识中台白皮书引言随着我国人口老龄化程度的不断攀升和新冠疫情的常态化影响,人民群众对优质医疗服务的需求也与日俱增,进一步加剧了我国医疗资源供需不平衡矛盾。为了切实有效缓解就医难、看病贵的社会问题,国家高度重视医疗健康领域的发展,陆续发布了“ 健康中国 2030”规划纲要关于促进“ 互联网 + 医疗健康 ”发展的意见关于实施健康中国行动的意见等多项重要文件,明确提出利用新技术加快医疗健康行业数字化转型和构建完善的医疗健康服务体系,为人民群众提供全方位、全周期健康服务。医疗行业是知识密集型行业,具有高复杂度、零容错性和需要循证等特点。新兴技术需要与医疗知识进行深度融合,才能更好地赋能医疗行业发展。当前快速发展的人工智能技术,已经能够支持机器实现对医疗知识的理解、组织和利用,提高机器运用医疗知识的深度与广度,使得机器像医生一样思考;此外,中台架构的出现,能够有助于医疗机构进行自身医疗知识的沉淀、积累与共享,更好地为医疗机构发展奠定基础。围绕新时代智慧医疗发展态势及未来趋势,百度依托在医疗行业领域的经验积累和海量异构数据汇聚处理、知识加工等技术优势,打造了融合诊断指南、临床路径、专家共识、医疗标准的医疗知识中台,用医疗知识赋能医疗诊疗过程,使得医疗机构人员便捷、高效地获取优质权威的医疗知识,让医疗服务可以有章可循。医疗知识中台的主要价值体现:1、医疗知识中台是提供医疗知识服务和医疗知识加工的智能化开放平台,通过内置的基础工具,从经典权威的医学教科书、专家共识、临床指南中获取医疗知识,经过加工后形成便于机器识别理解的医疗知识,并对外提供医疗知识服务。2、医疗知识中台是促进医疗行业应用智能化升级的关键底座,能够将隐性医疗知识转换成显性、标准化医疗知识,实现从医疗数据向医疗知识的跃升。3、医疗知识中台将拓展知识的传递和应用方式。传统方式下,主要依据医生利用大脑中的医学逻辑去利用医疗知识;基于医疗知识中台,设备和设备之间、程序和程序之间互动成为可能,机器能够理解和利用医疗知识,可以将医疗知识嵌入到业务流程中辅助进行医疗知识利用,降低医生精力和脑力负担。014、医学知识中台内置百度多年积累的医疗知识,医疗机构和行业生态伙伴能够快速部署应用。另外,针对“ 自有 ”的知识源 / 数据源,中台用户可以通过医疗知识加工环节,将“ 自有 ”知识更新到医疗知识库中,形成完整的闭环流程,满足特定业务场景按需构建医疗知识库的需 求。5、医疗知识中台结合了医学思维和技术思维,符合医学逻辑约束。传统基于大数据统计挖掘的 AI 计算模型,其数据置信度受到训练量以及概率影响,在严苛的医学场景下存在局限性。而医疗知识中台发挥中枢大脑作用,强调医疗知识的关键驱动和约束作用,使得机器能够认知医学知识,更好地为医疗机构和医疗从业人员服务。6、医疗知识中台提供的开放、标准组件,使得行业生态能够以搭积木的方式,按照应用场景需要快速构建医疗知识服务体系,支撑场景应用开发,有助于医疗知识驱动下的应用生态培 育。医疗知识中台白皮书02医疗行业发展面临的新挑战随着我国居民健康观念从“ 治病 ”到“ 预防 ”的转变、人口老龄化程度不断加深和卫生总费用的持续攀升等变化,人民群众对医疗服务的需求不断增长。但我国医疗卫生体系长期面临着平均医护人员总量供给不足、优质医疗资源过于聚集、基层医疗资源质量短期难以大幅提高等挑战。国家历来高度重视医疗卫生领域的体系建设,近年来,先后出台了多项政策推动医疗行业高质量发展、提升医疗资源供给、保障居民的基本医疗服务。尤其是在“ 十四五 ”规划纲要中明确提出,通过打造国家医学中心、区域医疗中心和专病诊疗中心,借助新技术从根本上提升医疗服务水平和引导优质医疗资源下沉,缓解医疗供需不平衡难题。031.1-医疗健康服务需求不断攀升对医疗资源分布配置提出新挑战“ 十三五 ”期间,中央和地方政府在医疗卫生领域的财政投入持续增加,我国居民主要健康指标得到不同程度的提升,其中人均预期寿命从 76.3 岁提高到 77.3 岁,婴儿死亡率从 8.1降至 5.6,孕产妇死亡率从 20.1/10 万降至 17.8/10 万1。但随着人民群众健康观念的转变、人口老龄化趋势持续走高和新冠疫情防控常态化等综合要素的影响,整个社会对医疗服务的需求持续增大,具体表现为以下三方面:首先,人民群众健康意识不断提升,从“治病”向“预防”转变。随着生活水平的不断提升,我国居民愈发重视维持自身健康,居民人均医疗保健消费支出复合增长率 7.1% 甚至超过了GDP 的复合增长速度 6.4%,如图 1 和图 2 所示。同时,疫情期间健康知识广泛传播,居民对高质量医疗服务需求表现出上升态势,逐渐从“ 以治疗为主 ”转化为“ 以预防为主 ”,医疗服务市场规模将进一步扩大。医疗知识中台白皮书04图 1 2016 - 2020 年中国 GDP 变化情况图22016 2017 2018 2019 202074.683.291.999.1101.6单位:万亿元6.4% 数据来源:国家统计局网站和卫健委官网 数据来源:国家统计局网站图 2 2016 - 2020 年居民人均医疗保健消费支出情况3图 3 中国人口年龄结构变化趋势4医疗知识中台白皮书05其次,人口老龄化程度不断加深,对社会基础医疗保障服务能力提出更高要求。 据第七次全国人口普查结果显示,我国人口总量为 14.11 亿,其中 60 岁及以上人口为 2.64 亿人,占18.70% ,如图 3 所示。预计到 2050 年 60 岁以上人群占比将高达 36%,中国将全面进入老龄化社会。老龄化将带来大量的慢性疾病患者,极易引发并发症和伴生性疾病,加剧医疗救治难度;同时,老龄化还将伴随大量的失智失能人口,加大社会养老负担,为老年人健康管理和康护服务提出新的挑战,医疗资源分配将面临更大难题。2016 2017 2018 2019 20201,3071,4511,6851,9021,843单位:元7.1%5,41950 1980 2018 2020 2025 2030 2035 2040 2045 20509,813,9 14,1 14,1 14,2 14,1 13,9 13,8 13,57%7%18% 19% 21% 25% 29% 31% 33% 36%=60岁60岁单 位 : 亿93%82% 81% 79% 75%71%69%67%64%93%34数据来源:国家统计局网站数据来源:国家统计局网站医疗知识中台白皮书最后,卫生总费用持续攀升,医疗健康服务重视程度不断加深。 卫生总费用(含政府、社会和个人)逐年上升,且占GDP的比重越来越大,2020年卫生总费用突破7.2万亿元,占GDP比重突破7%5,达到历史新高,如图4所示。一是政府持续加大优质医疗资源扩容和基层医疗服务能力建设,大幅增加了医疗卫生的投入,特别是新冠疫情后,卫生应急体系、疾病预防控制体系的经费预算进一步增加。二是社会支出持续上升,基本医疗保险参保人达到13.6亿人,医保支付总额持续增加,并且商业健康险保费支付年均复合增长率超过30%。三是随着居民生活水平的提高,更加关注疾病预防和健康管理,健康消费逐步升级,个人在医疗保健的支出力度不断增强。数据来源 :2016 - 2020 年卫生健康事业发展统计公报506图 4 2016 - 2020 年卫生总费用变化情况6.2%4.65.35.96.57.26.3%6.4%6.6%7.1%2016 2017 2018 2019 2020卫 生 总 费 用 占GDP比重卫 生 总 费 用单 位 : 万亿元医疗知识中台白皮书07在“ 健康中国 2030”发展战略的引导下,分级诊疗、医联体、互联网医疗等政策陆续颁布,推动我国医疗卫生事业发展取得长足的进步,尤其是在新冠肺炎爆发以来,更是经受住了疫情的极端考验。但立足于我国庞大的人口基数和日益增长的医疗保健需求,医疗资源的供给依旧面临较大挑战。主要表现为平均医护人员数量仍显不足、优质医疗资源过于集聚、基层医疗服务质量短期难以大幅提高等。首先,医护人员总量虽然位居世界第一,但千人医生和护士数仍显不足。 近年来,医学教育改革提速,培养出大量优秀的医护队伍,医护人员总量突破 830 万人,支撑起世界上最大、遍及城乡的医疗卫生服务体系。但相较于金砖国家及主要发达国家,我国每千人医生护士数量仅高于印度与南非,大幅落后于其他金砖国家和主要发达国家,医疗人力资源指标与主要发达国家相比有一定差距,还有较大进步空间,如图 5 所示。1.2-人均医疗资源供给依旧不足优质医疗资源分布过于集中图 5 2019 年各国每千人医生数、每千人护士数情况6南 非 印 度 中 国 巴 西 韩 国 俄 罗 斯 奥 地 利 美 国 澳 大 利 亚0.792.30.932.322.464.165.322.643.831.12.393.17.437.948.4810.3711.9812.22千 人 医 生 数千 人 护 士 数数据来源:OECD 经济合作组织官网数据库 Health resources6 其次,医疗资源分布结构尚待优化,优质资源过于集聚。 当前,“ 倒三角 ”的医疗服务体系依然存在,虽然基层医疗卫生机构占比达到 95%,但能够提供优质医疗服务的医生主要集中在大医院,而基层医疗机构高水平医生稀少、诊疗能力薄弱。患者更倾向于选择大医院就医,进而导致出现大医院门庭若市、小医院门可罗雀的局面。此外,医生诊疗需要丰富的临床经验和实践操作积累,基层缺乏足够多的资源来提升诊疗能力,而大医院虽具备优质诊疗能力,但在向基层传导的过程中存在诸多约束,导致优质医疗资源难以下沉到基层。最后,基层医疗资源供给的质量不高,且短期内难以大幅提高。 由于医学的复杂性,培养高质量医生的周期长、费用高,尤其是高质量全科医生需要 5-10 年培养周期,需经过长期的投入和知识沉淀,才能提高医疗资源的供给质量。当前,基层医疗机构中具备本科及以上学历的医生不足17%,因此,医疗资源质量提升的瓶颈主要在于基层,但基层医疗机构具有数量多、分布广、位置偏远等特点,传统以教育为主的能力提升方式存在诸多限制,尤其是难以获取有针对性的医疗知识支持,从而导致短期内提升医疗服务质量的难度加大。医疗知识中台白皮书08图 6 医疗卫生机构分布情况7三 级 医 院二 级 医 院一 级 医 院机构数(家)约 3, 000约1 万约1.2 万入院人员数(人次)其中:全国医疗卫生机构总数:超过 100 万家全国医院总数3.5 万家(含未定级医院) 基层医疗卫生机构 95% 医院 3%其他 2% 9, 400 万 3700 万 960 万 数据来源:2016 - 2020 年卫生健康事业发展统计公报7医疗知识中台白皮书09国 家 顶 级 优 质 医 疗 资 源神 经 科 心 血 管 科 儿 科 呼 吸 科 创 伤 科肿 瘤 科河 北 山 西 辽 宁 安 徽 福 建 河 南 云 南 新 疆医 疗 资 源 薄 弱 地 区输 出 医 院输 入 医 院试 点 省 份 远 程 诊 疗 医 学 教 育 临 床 路 径 指 导 远 程 手 术 示 范区 域 医 疗 中 心 建 设内 蒙 古 吉 林黑 龙 江 江 西 广 西 海 南 重 庆 贵 州西 藏 甘 肃 青 海 宁 夏图 7 区域医疗中心建设示意图随着我国城镇化加速、人口结构深刻转变和疾病谱的不断变化,对医疗健康服务需求的增长速度持续加快,而医疗资源的供给和布局难以在短时间内得到较大改善,在平时体现为看病难与医患矛盾,在突发的公共卫生事件面前则体现为医疗资源的被挤兑。因此,医疗健康服务供需不平衡的困境仍然是医疗行业面临的最大挑战。为此,我国政府不断制定颁布应对政策,持续引导和优化医疗卫生体系发展。1.3-政策推陈出新解决供需矛盾推动优质医疗资源扩容下沉自“ 健康中国 2030”战略提出以来,举国上下深入贯彻实施,政府、医疗机构、医药企业和科技公司等社会资源协同创新,实施了一系列卓有成效的实质性举措,培育出互联网医疗、移动医疗、智慧医疗等新兴发展业态,成为推进三医联动、医保支付方式改革、医联体、分级诊疗、医养结合等政策落地的活跃力量,进一步促进了我国医疗健康服务体系的演进发展。尤其是新冠疫情以来,全国各地都组织开展了特色各异的疫情阻击战,取得了举世瞩目的成绩,进一步彰显了“ 以人民健康为中心 ”的发展理念。为推进卫生健康领域供给侧改革、缩小区域间医疗技术水平差距、促进医疗资源合理分布和均衡发展,国家基于医联体政策的实践探索经验,提出区域医疗中心政策,并作为“ 十四五 ”期间重点建设任务,将头部医疗机构所积累的医疗知识下沉到基层医疗机构中,为基层赋能,如图 7 所示。但受到地域空间、技术手段、医生能力等方面的限制,部分区域医疗中心的建设效果仍难达预期。不同于医院单纯的规模扩张,区域医疗中心、医联体等跨医院之间的医疗资源建设,面临大量的医疗知识传递和积累需要。由于传统以医生经验、医疗诊疗路径为主的医疗知识传播方式和管理方式难以得到显性化、标准化的表达,从而限制了优质医疗资源所沉淀的医疗知识的传播范围和推广节奏,主要表现为建设周期过长、医生人力成本和精力成本过高以及医疗知识的运用方式较为单一等。因此,将医疗知识进行科学高效的管理进而赋能基层,在多个专科领域不断提升医疗服务能力,是推动区域医疗中心建设、优质医疗资源扩容下沉的关键。医疗知识中台白皮书1011新兴技术助力医疗行业向知识化、智能化、中台化迈进在以人工智能为代表的新兴技术推动下,将迎来医疗行业新一轮数字化转型和智能化升级。医疗行业是知识密集型行业,具有高复杂度、低容错性和需要循证等特点,新兴技术需要与医疗知识进行深度融合才能更好地赋能医疗行业发展。技术的快速发展,使得机器能够识别、理解和组织医疗知识,进一步提高和促进了机器利用医疗知识的深度和广度;此外,中台架构的出现,能够支持医疗机构实现自身医疗知识的沉淀与积累,更好地为医疗机构智能化升级赋能。2.1-医疗知识是医疗行业的根基显性化表达将成为新趋势医疗行业是知识密集型行业,无论是在经验医学、循证医学还是精准医学阶段,医学知识始终扮演着关键角色,是日常诊疗行为中不可或缺的要素之一,贯穿着临床诊疗与科研的始终,为临床诊疗、公共卫生、医学研究、药品研发提供指导和约束,如图 8 所示。随着新兴技术与医疗行业的深度融合,医疗服务提供方、监管方和 IT 公司等医疗行业不同角色,对医疗知识都提出了新的发展需求。对于医院、基层医疗机构等医疗服务提供方而言,随着互联网、物联网等技术的广泛应用,产生了大量基于医疗知识的深度利用需求。传统依托于纸质文献、教科书、医学日志、专家经验为主要方式的知识应用,拓展到以电子病历、健康档案、影像学数据和检验数据等为主要载体的知识应用。新知识载体的出现,为机器利用医疗知识进行医疗行为带来新的可能。因此,将医疗知识进行显性化表达对于机器而言变得愈发重要,尤其是基于医疗知识图谱的表征方式,能够使得机器理解医疗知识。同时,由于医疗行业低容错的特性,通过数理统计计算产生的医医疗知识中台白皮书12图 8 现代医学演进发展经验医学循证医学精准医学大多以经验和推论为基础,从医生自身经验出发处理患者,注重医疗指标的改善和临床症状的缓解医疗知识源于教科书、期刊出版物、上级医师指导、个人长久的经验总结医疗知识拓展到循证的临床指南、医学文献、医学辞典、医学图谱等医疗知识拓展到源于遗传基因的分子生物学数据、医学影像和检验数据、电子病历数据等基于基因组测序技术的生物信息与大数据科学交叉应用,产生新型医疗模式,根据患者个体差异制定精确治疗方案,提供个性化治疗在医生个人临床经验的基础上,更加注重采用临床研究证据,要求基于循证证据制定患者的诊疗方案,并应用于治疗过程医疗知识中台白皮书13疗知识 / 模型,需要经过严谨的临床实践验证和循证支持后,医生才可信、临床才可用,因此对于医疗机构而言更希望利用已经达成行业共识的医疗知识。对医疗行业的监管方而言,需要确保整个医疗行为的可管可控,同样也存在将病历书写规范、医师行为规范、安全用药规范、医保合规使用规范等医疗标准固化到信息化平台中的需求,形成约束性的医疗规则,对医疗机构进行指导和约束,确保医疗过程符合规则约束,进而促进医疗行业良性发展。对于医疗 IT 公司而言,在智能化发展的大趋势之下,其智能化产品的建设严重依赖于医学知识,符合医学逻辑的产品将更受市场认可、更具竞争力,因此基于知识驱动的应用系统开发也将成为新的发展需求。综上,将隐性医疗知识进行显性化表达,从而支持机器对医学知识进行有效的组织和利用,并将医疗知识嵌入到业务流程之中,日益成为医疗行业未来发展的重要方向。图 9 机器认知理解医疗知识并提供标准化服务医疗知识中台白皮书142.2-AI技术加速提升机器认知能力为医疗行业智能化发展注入新活力国家数字化政策的持续加码和新冠肺炎疫情的出现,加速了医疗行业数字化转型进程,尤其是在数据的采集汇聚、共享交换和互联互通等方面开展了大量建设,电子病历和集成平台最具典型代表。但如何有效处理和利用数字化资产,升级形成医疗知识,并使得机器进一步认识和理解医疗知识,面临着新的挑战,如图 9 所示。前台 智能化应用后台 智能化支撑人 工 智 能 区 块 链 云 计 算 大 数 据智 能 服 务( 业 务 体 系 )智 能 应 用基础能力( 医疗大脑)智能引擎场 景 化 诊 疗 服 务医疗知识服务的标准化输出能力:API&SDK全 息 画 像 智 能 诊 疗 路 径 推 演 风 控 预 警 临 床 科 研 生 命 科 学感 知 能 力认知能 力看听学 习 能 力分 析 能 力预 测 能 力推 理 能 力认 知 能 力推 理 能 力首先,海量数据未被挖掘生成知识,数据的应用价值被严重埋没。数字资产的承载形式从结构化数据拓展到非结构化数据,包括文本、图像、音视频等。数据形态的多样化,带来数据量的指数级增长,但由于大多数的医疗机构缺乏有效的处理能力来利用海量数据,医疗数据基本都在数据库中“ 沉睡 ”,并未形成医疗知识,医疗数据的应用潜力被严重埋没。其次,机器理解认知医疗知识存在挑战。由于医疗知识本身的复杂性和专业性,抬高了机器认知医疗知识的门槛,机器不仅要按照医学属性、逻辑和规则进行识别、解析、分词等,实现对结构、语义和时序的理解,而且还要为机器构建完整的医疗知识概念空间,从而将医学知识进行合理表征和组织,支持自主调用和利用知识,实现基于医疗知识的自主推理。最后,缺乏统一的医疗知识体系分类标准。当前在尝试向机器理解医学知识的探索中,由于对医疗知识的分类标准和描述方式等不统一不规范,导致医疗知识产品的可复用程度低,造成了大量的重复构建,并且为后期知识的一体化应用增加难度。随着模式识别、自然语言处理、知识图谱、深度学习、图计算等一系列人工智能技术的不断发展,以百度为代表的科技公司不断发挥自身在 AI 技术的领先优势(百度以 13007 件专利的申请量和 3652 件专利的授权量四度蝉联 AI 专利申请量和授权量双第一,并在智慧医疗领域专利申请量排名首位8),基于完整的 AI 技术布局,创新提出全新的解决方案。运用知识增强的跨模态深度语义理解能力,通过集成化的多模态数据融合,构建智能化的医学知识体系,使得机器能够掌握、理解和利用医疗知识,不仅能够帮助医疗机构从繁杂的信息中提取医疗知识,拓展以往单纯从医学书籍、临床经验、科学研究等方式获取医学知识的途径,而且能够充分结合医疗机构个性化需求,生产符合自身需要的医疗知识,提供标准化的医疗知识服务,进而使机器像医生一样进行思考,辅助医生进行问诊、诊断和治疗,提高医疗服务质量、缓解医生的诊疗压力。医疗知识中台白皮书15 数据来源: 国家工业信息安全发展研究中心、工信部电子知识产权中心 中国人工智能高价值专利及创新驱动力分析报告8随着医院信息化的持续建设,以医院管理系统、电子病历、医学影像系统等为代表的医院信息系统数量持续增多,各个系统之间的交互关系越来越复杂,产生的医疗数据难以被有效的二次利用,还未将数据转换成知识,在知识的分享与应用、驱动业务增长方面还有较大增长空间。同时,面对新兴技术的快速发展和政府政策的不断推进,传统树形、固定的 IT 架构已经越来越难以适应这些变化,缺少技术手段来应对这些向智能化发展的变化,进而限制了医疗机构在数字化时代的系统升级与能力演进,因此,建立全新的信息与知识处理技术架构,已迫在眉睫。中台架构的出现,在消除烟囱、架构解耦、能力重用等方面能够带来极大的改善,不仅能通过新的 IT 架构解决传统系统之间难以按需互联共享的问题,促进资源的整合与利用,为医疗机构实现数字化转型和智能化升级提供支持,而且通过中台的构建,可以将大量重用能力进行有效封装,避免后期多次重复开发,满足上层多样化应用的复用需要,真正意义上实现能力沉淀与复用。而知识中台则更强调在知识层面的复用与沉淀,机器能够自主从数据中汲取知识、构建知识,以人机互动的服务方式接入医疗业务场景,将知识洞察与医疗核心业务能力结合,满足知识驱动模式下多样化场景应用的开发需求。图 10 中台架构示意图医疗知识中台白皮书162.3-构筑中台是医疗机构智能化升级的关键抓手,也是能力沉淀的有效途径复 用 沉 淀中 台17医疗知识中台遵循医疗逻辑的智能化开放平台为满足医疗机构智能化转型升级的迫切需求,医疗知识中台概念应运而生。以百度为代表的科技公司,发挥自身在人工智能技术领域的优势,并结合多年深耕于医疗行业的积累和沉淀,将医疗知识固化到机器中,打造出能够提供医疗知识加工和医疗知识服务的开放平台医疗知识中台,赋能医疗行业中不同层级的医院、专业公共卫生机构、医疗 IT 公司等,加速行业智能化升级进程。本章节重点介绍医疗知识中台的概念定位、架构分层、产品功能和产品特征等。3.1-医疗知识中台基本定位医疗知识中台是遵循医疗逻辑的智能化开放平台,具备医疗知识加工能力和医疗知识服务能力,其基本定位如图 11 所示。医疗知识中台基于自然语言处理、知识图谱等人工智能技术,专注医疗知识的生产、组织建设,从经典权威的医学教科书、专家共识、临床指南、路径规则标准中抽取医疗知识,经过加工后形成便于机器识别理解的医疗知识,并对外提供智能化医疗知识服务。医疗知识中台通过对电子病历、健康档案等医疗数据信息进行知识提取、知识关联、知识分析、知识整合、知识组织等处理,实现医疗知识、临床路径、医疗规则的构建,满足医疗知识智能检索、智能推荐等通用应用和智能医生助手、辅助诊疗系统、智慧病案等具体场景应用的需求,如图 12 所示。医疗知识中台白皮书18图 11 医疗知识中台基本定位图 12 医疗知识中台业务架构医疗知识中台开放智能的医疗知识加工医 疗知 识 组 织知识关联医 疗知 识 生 产知识审核知识发布图谱生成知识融合内容理解数据清洗开箱即用的医疗知识服务医疗知识门户医疗知识问答医疗知识推荐医疗知识预测医疗知识写作医疗知识开放接口医疗知识搜索医 疗知 识 库+医 疗 知 识智 能 检 索医 疗 知 识智 能 推 荐医 疗 知 识人 机 交 互.智 能 医 生 助 手辅 助 诊 疗 系 统CDSS智 慧 病 案 智 能 医 保 核 查 智 能 预 导 诊 处 方 核 验 智 能 问 诊 新 药 临 床 测 试医 疗知 识医 学数据临床路径医 疗规则电 子病 历健 康档 案诊 疗信 息检 测数 据临 床表 征基 因测 序监 护数 据影 像分 析过 程数 据药 物反 应遗 传病 史医 疗 知 识 中 台知识提取知识关联知识组织知识整合知识分析医疗知识中台白皮书193.2-医疗知识中台架构分层医疗知识中台是促进医疗行业应用智能化升级的关键底座,能够实现从医疗数据到医疗知识的跃升。医疗知识中台处于知识源 / 数据源与场景应用层的中间位置,支持各类医疗场景的应用开发,其架构分层主要包括基础工具集、医疗知识加工、医疗知识库、中台内核和通用医疗知识应用,如图 13 所示。基础工具集是标准化的 AI 工具集,对医学教科书、医疗临床指南、电子病历等知识源 / 数据源预处理,转换成支持知识加工的数据格式;医疗知识加工遵循知识发现与构建的一般过程,实现对医疗知识的一站式构建和组织;医疗知识库是按照主题对医疗知识进行分类存储,对外提供医疗知识服务;中台内核是医疗知识中台的核心大脑,按照统一的医学术语、知识体系、标准规范等约束医疗知识的加工过程,确保符合医学逻辑;通用医疗知识应用能够提供医疗知识门户、知识搜索、知识问答等基础知识应用。图 13 医疗知识中台架构分层图知 识 源/数 据 源场 景 应 用医 疗 知 识 库中台内核基 础 工 具 集通 用 医 疗 知 识 应 用医 疗 知 识 加 工医疗知识中台医疗知识中台白皮书20医疗知识中台内部运行流程,如图 14 所示。医疗知识中台能够将隐性医疗知识转换成显性且标准化的医疗知识。首先,针对权威和广泛的知识源 / 数据源,医疗知识中台通过基础工具集的前置识别处理,形成结构化数据;其次,基于结构化数据,在中台内核的约束下,医疗知识加工进行知识生产和知识组织,形成标准化、机器可识别调用的医疗知识;最后,将医疗知识分门别类地存储于医疗知识库中,对外提供医疗知识服务,并支持通用医疗知识应用。图 14 医疗知识中台内部运行流程图知 识 源/数 据 源医 疗 知 识服 务医 疗 知 识 中 台医 疗 知 识 库基 础 工 具 集医 疗 知 识 加 工中台内核医 学 术 语 医 疗 知 识 体 系 医 疗 行 业 标 准通 用 医 疗知 识 应 用标 准 化 医 疗 知 识结 构 化 数 据知 识 生 产 医疗知识图谱知 识 组 织医疗知识中台白皮书213.3-医疗知识中台产品功能医疗知识中台将改变医疗知识的应用方式,从传统由用户获取信息后自主利用的方式,升级到机器根据业务流程需要自动调取和利用医疗知识。医疗知识中台提供一整套覆盖医疗知识获取、加工和通用应用等功能于一体的产品,其产品功能组成如图 15 所示。图 15 医疗知识中台产品功能图疾 病 筛 查 智 能 问 诊 临床辅 助 决策支持 合 理 用 药 病 案 质 控 慢 病 管 理场 景 应 用.知 识 源/ 数 据 源医 学 经 典 著 作 医 学 教 科 书 医 疗 学 术 期 刊 医 疗 临 床 指 南 医 疗 诊 疗 标 准 优质电 子 病 历 健 康 档 案 临床经验 生 命 科 学 研 究 医 疗 知 识 中 台基 础 工 具 集医 疗 知 识 加 工医 疗 知 识 库医 疗 文 本 识 别O CR 自 然 语 言 处理N LP医 疗 语 音 识 别ASR 医 疗 图 像/影 像 识 别 医 疗 视 频 识 别中台内核医 疗 知识规则通 用 医 疗 知 识 应 用知 识 生 产 知 识 组 织医 疗 知 识 体 系医 疗 术 语集医 疗 知 识 图 谱医 疗 知 识 调用中间件医疗知 识 搜 索 医疗知 识 推 荐 医疗知 识 门 户 医疗知 识 问 答 医疗知 识 写 作症 状 库 体 征 库 检 验 库 检 查 库 疾 病 库 药 品 库 手术操 作 库数 据 清 洗 内 容 理 解 知 识 融合 图 谱 生成 知 识 关联 知 识 审核 知 识 发布 医疗知识中台白皮书22基础工具集能够对广泛的知识源 / 数据源进行识别和处理,使得机器能够看清、听清并能够像人类一样具备学习和认知的能力。主要包括医疗文本识别、语音识别、图像识别、视频识别、自然语言处理等多种类型的基础工具,如图 16 所示。3.3.1 基础工具集基础工具集支持以标准化组件的方式被第三方调用,并结合实际的医疗业务场景进行灵活的部署使用,支撑实现病历文本结构化、症状识别、病历理解、疾病症状关联等基本操作,大幅缩短开发部署周期。机器识别方面:支持医疗文本、医疗语音、医疗图像 / 影像和医疗视频等多种文件类型的内容识别,将多种来源的知识源 / 数据源进行正确无误的识别,以支持医疗知识的构建。医疗自然语言处理方面:通过建立知识增强的语义理解框架,增强医疗自然语言处理能力,并融入医疗知识以及增强小样本学习能力,进一步增强机器的阅读理解能力。医疗知识加工是主要包括知识生产、知识组织和医疗知识图谱等,完成医疗知识的标准化输出,如图 17 所示。图 16 基础工具集组成图图 17 医疗知识加工功能图3.3.2 医疗知识加工基 础 工 具 集医 疗 自 然 语 言 处 理 NLP 医 疗 文 本 识 别 OCR 医 疗 语 音 识 别 ASR 医 疗 图 像/影 像 识 别 医 疗 视 频 识 别医 疗 知 识 加 工知 识 生 产数 据 清 洗 内 容 理 解知 识 融合 图 谱 生成知 识 组 织知 识 关联 知 识 审核知 识 发布 医疗知识图谱医疗知识中台白皮书23图 19 医疗知识图谱示意图图 18 医疗知识内容理解示意图知识生产完成知识点的生产,从隐性的知识源和“ 沉睡的 ”数据源中主动提取挖掘医疗知识,通过数据清洗、内容理解、知识融合和图谱生成等过程,从数据中自动挖掘各类知识,从结构、语义和时序等方面提取医学实体,并对医学实体进行实体消歧和共指消解等知识融合,进而完成医疗知识图谱的构建。知识组织重点完成知识点与知识点之间的关联与管理,对发现的医疗知识进行统一组织,通过知识关联、知识审核、知识发布等过程,将生产的新知识按照医疗知识体系的分类要求与现有知识进行关联,依托知识审核,确保新生产知识的正确性,并通过知识发布满足全科、专科等多种场景下的知识应用需求。医疗知识图谱是基于医疗知识生产和组织过程,能够基于疾病、症状、体征、药品、手术等各类医学本体及其之间的属性关系,生成可视化的图谱展现,并使得机器更加接近于人类的认知思维,为广泛应用提供坚实基础。医疗知识中台白皮书243.3.3 医疗知识库医疗知识库对生成的医疗知识进行存储,通过中间件,向外提供医疗知识服务能力,既包括内嵌的基础医学知识,也包括后期新开发生产的医学知识,用户能够进行场景化的医疗知识应用开发。行业中以百度为代表的科技公司,为便于医疗机构和行业生态伙伴快速使用医疗知识中台,将多年积累的医疗知识嵌入到医疗知识中台产品之中,向行业开放。医疗知识库按照知识的不同维度进行分类,主要包括疾病库、症状库、药品库、体征库、检查库、检验库和手术操作库等,覆盖医院临床科室、医技科室及行政科室等,如图 20 所示。医疗知识主要从 5,700+ 书籍、30+ 科室专业指南、200+ 临床路径等知识源中采集获取可循证的医疗知识,形成包括数百万条的医学术语、数千万条的医学术语关系、数十万条的医学事理、数亿条的医学知识条目、4,000 种深度专病图谱、20 万深度药品图谱的知识库,具有知识结构化、术语体系完备、层级结构清晰等特点,能够覆盖诊前、诊中和诊后等诊疗全场景。同时,为便于对医疗知识的调用,医疗知识中台提供了中间件,支持 API、SDK 等方式的调用,满足可视化展示、检索、推理计算和开发应用的需要。医疗知识库的内容可根据需要进行扩充和更新,医疗机构和行业生态伙伴可以在内嵌医疗知识的基础上,针对“ 自有 ”的知识源 / 数据源,通过医疗知识加工环节,产生新的医学知识,更新到医疗知识库中,形成完整的闭环流程,满足特定业务场景按需构建医疗知识库的需求,如图 21 所示。图 20 医疗知识库分类图医 疗 知 识 库医 疗 知 识 调用中间件体 征 库 检 查 库疾 病 库 症 状 库 药 品 库检 验 库 手术操 作 库医疗知识中台白皮书25图 21 医疗知识库更新示意图 标准化医 疗 知 识内 嵌 医 疗 知 识约束医疗知 识 加 工医疗知识库沉淀新 产 出 的医 疗 知 识内 嵌 的医 疗 知 识3.3.4 中台内核图 22 医疗知识规则引擎功能图中台内核按照医学术语、标准规范、路径等医疗业务逻辑的约束,将医疗业务的相关逻辑进行规则化表达,引导机器遵守并利用规则进行医疗知识生产,完成知识的积累和增长,如图 22 所示。中台内核包括医疗知识规则、医疗知识体系和医疗术语集等。医疗知识规则主要将面向临床使用的临床指南、手术规则、诊疗标准、临床路径、医学常识、检验检查规则等标准规范转换成约束规则,约束知识加工过程;医疗知识体系是基于医学逻辑构建的统一医疗知识索引,将不规范的医疗表达映射为标准化的统一描述,从而支持机器对医疗知识的调用;医疗标准术语是遵循医学属性的标准化术语体系,便于机器进行分词、关联、理解等基础识别,同时也支持不同标准术语之间的映射。中台内核 医 疗 知识规则 医 疗 知 识 体 系 医 疗 术语集 医疗知识中台白皮书263.3.5 通用医疗知识应用通用医疗知识应用是医疗知识中台能够对外提供医疗知识服务的基本方式,主要包括知识门户、知识搜索、知识问答、知识推荐等,如图 23 所示。医疗知识中台能够提供基于医疗知识图谱和医疗知识库的通用应用,包括知识门户、知识搜索、知识问答和知识推荐等,重点向基层医疗机构、个人 / 公众提供直接的医疗知识服务,满足终端用户按需获取所需医疗知识的需要。图 23 通用医疗知识应用图图 24 医疗知识搜索示意图通 用 医 疗 知 识应 用知 识 门 户 知 识 搜 索 知 识 问 答知 识 推荐 知 识 写 作.医疗知识中台白皮书27图 25 医疗知识中台特征3.4-医疗知识中台产品特征医疗知识中台具有组件标准、服务开放、共性复用、灵活重组、易取易用和迭代更新等六大特征,如图 25 所示。组件标准:医疗知识中台提供符合