门户
图库
科技
数据
VR
区块链
论坛
百科
导航
首页
要闻
观察
访谈
活动
科技
人物
互联网
IT
网络安全
网络通信
更多
大数据
云计算
无人机
机器人
智能家居
无人驾驶
机器学习
物联网
智能穿戴
智慧城市
投稿
首页
登录
注册
区块链
VR
Fintech
人工智能导航
全智网
智客公社
活动会展
专栏作者
图库
VR动态
快捷导航
要闻
观察
访谈
活动
Ai说
机器人
智能硬件
无人驾驶
语音识别
图像识别
自然语言
机器学习
无人机
智能家居
物联网
网贷行业
大数据
云计算
首页
>
行业
>
人工智能快讯
来源:
2020-10-11 14:16:00
热度:
阿里云天池Apache Spark落幕:AI医疗进入落地实践深水期,达摩院如何用生态破局?
LX A i 中 国 网 Q
10 月 10 日,AI 医疗行业最高规格赛事——阿里云、英特尔(中国)有限公司联合主办的 Apache Spark AI 在杭州落下帷幕。
脊柱外科疾病已经越来越困扰着老年人及久坐的上班一族,脊柱病变发展缓慢且不明显,长此以往会压迫神经和血管,甚至造成大脑指挥失灵。
此次比赛正是瞄准脊柱外科疾病,参与者需要提供提供全自动算法来定位锥体、椎间盘的位置和相应分类以帮助筛查病例。
比赛历时 121 天,覆盖了脊柱外科疾病核心症状 7 种。来自学校、科研机构、医疗企业等各个地方的 3330 名选手组成了 3107 支参赛队伍。
这些开发者们将单个病灶诊断准确度提高至 70%,单个病例筛查时间提高至 0.05min。
阿里云天池是全球最大规模的大数据赛事平台,从 2017 年便开始深耕 AI 医疗赛道举办「数字人体」系列比赛, Apache Spark AI 已经是该系列的第三场。
天池大赛的背后,是阿里云磨砺医疗 AI 决心。
软硬协同,英特尔新款 CPU「首秀」
2017 年,阿里云天池第一届「数字人体」比赛正式启动,如今已经走过了三个年头,前两届分别聚焦于宫颈癌风险智能和肺部结节智能诊断。
今年脊柱智能诊断大赛传承了以往比赛中的开放性、权威性。
比赛并不是在阿里内部的「孤军作战」,而是延续了阿里一贯的生态打法,联合了行业中的多个合作伙伴,比如湘雅医院、解放军 301 医院等骨科医疗界权威专家;香港大学、南洋理工大学、浙江大学等学术资源。
同时首次开放了具备行业共识和全球影响力的 MRI 骨科数据集,具有行业里程碑式的意义。
但相比前两场,此次比赛也有一定的创新。相比前两场有一定的创新,首先这是「数字人体」系列首次应用开源 Apache Spark 技术。如今开源 Spark 技术已经在中国技术圈里生根发芽,获得越来越多开发者的信赖,这次天池大赛也将 Spark 技术推向了医疗领域。
另外参赛选手更加开放,除学生外,还有大量来自科研机构、互联网企业的开发者。在闯入决赛的 6 支队伍中,既有来自「北京大学前沿交叉学科研究院」的研究生,也有来自国内外医疗 AI 企业的从业人员,比如健康管理企业「妙健康」和硅谷「深透医疗」的工程师。
比赛也取得了很多成果,「我们开放了经过行业认证的 MRI 优质骨科数据集,发布了英特尔和 ECS 编制的白皮书,各个算法团队将单个病灶诊断准确度提高至 70%,单个病例筛查时间提高至 0.05min。」达摩院人工智能工程中心负责人华先胜说。
值得注意的是,此次 Apache Spark 还是英特尔第三代至强可扩展处理器的「首秀」。今年 6 月 18 日英特尔全球发布了新款 CPU,Spark AI 算是其首次在公开环境中使用并产生成果。
「随着数据越来越多,我们需要有越来越大的算来解决和处理数据的问题。」阿里云计算平台总经理贾扬清表示,云平台和英特尔等硬件制造商的软硬件协同设计变得越重要,「今天硬件提供越来越多的能力,软件特别像海棉一样把算力吸起来,这才能产生高效广泛的应用。」
(阿里云计算平台总经理贾扬清)
今年 6 月 18 日英特尔全球发布了第三代至强可扩展处理器(Cooper Lake),继续加大其在内置 AI 加速方面的投入,将 bfloat16 支持整合到其独有的深度学习加速技术(增强型英特尔 Deep Learning Boost)当中。支持同时为 CPU 的 AI 训练和推理性能提供加速。
根据英特尔工程师,增强型英特尔 Deep Learning Boost 可将人工智能推理和训练性能最高提升 1.87 倍,自然语言处理的训练性能提升 1.7 倍,推理提升 1.9 倍。
复赛 CPU 赛道同时使用了英特尔开源的 Analytics Zoo。Analytics Zoo 是一个统一的大数据和 AI 平台,可无缝地将 Spark、TensorFlow、PyTorch 和 Ray 程序集成到一个端到端的流水线中。
复赛选手基于 Analytics Zoo 集成的英特尔优化 TensorFlow 和 PyTorch 框架以及 bfloat16 的加速能力,有效提高了赛题的训练和推理性能。
「我们希望做的事情是让英特尔的硬件制造商和云计算的云服务商一起合作,给产业界和科研人员提供更好的算法、数据和算力。」英特尔大数据技术全球 CTO Jason dai 表示。
4 年耕耘,「AI 医疗是未来,阿里必须做」
「数字人体」系列比赛的背后是达摩院在医疗 AI 行业的长期耕耘。
「达摩院」的名字被整个医疗 AI 行业记住是在疫情期间,疫情爆发之初,达摩院就迅速将 AI 技术投入到医疗实践。
先是连夜研发智能疫情机器人,免费拨打控摸排电话排查身体异常人群;后又将 AI 算法正式用于新馆肺炎病原学检测,并与浙江省疾控中心合作,用算法将疑似病例基因分析时间缩至半小时。
2 月 15 日,达摩院还基于 5000 CT 影像样本数据快速研发出了 CT 影响算法,在郑州小汤山上线,可以在 20 秒内对新冠疑似患者 CT 影像做出判读,并量化病症的轻重程度,目前分析结果准确率达到 99%。
如今,达摩院算法识别标注的第一张新冠肺炎 CT 影像的代码和照片就被分别收藏在中国国家博物馆和中国科技馆。
或许整个达摩院都没有预料到自己的技术能如此迅速的在实践中产生作用,疫情期间的成就来源于持续 4 年的积累与坚守。
「人工智能进入医疗健康领域是一个必的事情,阿里没人做怎么行?」达摩院医疗 AI 团队的成立是来自于华先胜对未来精准的预判。在 AI 已经渗透到各行各业之时,医疗在当时还是待开垦的沃地。
(达摩院人工智能工程中心负责人华先胜)
在团队刚刚搭建的 2016 年,人工智能如何在医疗领域发挥作用还并不清晰,达摩院毅然冲进了这片 “无人区”,决定先研发技术,定下了「允许医疗先不赚钱」的规定,从肺部 CT 影像开始切入医疗 AI。
2017 年,达摩院正式成立前期就在国际权威的肺结节检测大赛上打破世界纪录,将在样本数据中成功发现结节占比的比例提升至 89.7%。后来这项技术直接为第一套新冠 CT 自动诊断系统打下了基础。
此后达摩院技术持续突破,在 Nature 子刊、CVPR 等顶尖学术期刊与会议上,发表了多篇论文。
但彼时达摩院还没有清晰的技术商业化路径,直到疫情为团队,甚至整个 AI 医疗行业技术落地按下了加速键。
抗疫高峰期时,医院影像科业务量飞速增长,多数医生加班加点通宵读片,但仅靠肉眼测评耗时且不精准,不少医院认识到 AI 医疗影像判读的价值;疫苗研发迫在眉睫,一些 AI 技术也进入了医药研发领域;远程医疗逐渐普及,「智能问诊机器人」等产品的需求开始增加,医院加速进行数字化转型…
这些这些逐渐明晰的落地场景都验证了华先胜先生最初的判断。据 IDC 数据,2025 年人工智能应用市场总值将达到 1270 亿美元,其中医疗行业将占市场规模五分之一。
但需要清醒认识到的是,医疗领域专业、复杂,技术落地从来不是一个简单的事情。在整个行业都逐渐从理论向实践转型的过程中,还面临着非常多的痛点。
比如高质量数据的缺失。医疗影像数据面临着质量参差不齐,标准化程度低、人工标注难度大等诸多行业性难题。没有数据集,算法的精度和准确性便得不到保证。
行业人才也缺失。「AI」和「医疗」都是专业性极强的领域,AI + 医疗需要的也是复合型人才,但目前全球生物医学交叉领域选手都非常少。
很多医疗 AI 领域科研人员在学校都很难接触到真实的医学场景,都是从技术角度切入产品研发,学术味浓但未必适合医生使用。
新京报「寻找中国创客」报道曾指出,有时一家三甲医院能同时安装 10 余家 AI 公司的产品,同质化严重,医院真正使用的只有一两家。
如何解决?阿里的做法是,以比赛为切入点打入行业生态。
「每一个选手解决的小问题都能推动行业前进」
在一定程度上,「数字人体」系列比赛也可以说是达摩院的「黄埔军校」,一些优秀的比赛选手日后都进入到了阿里云工作,这让阿里云在医疗 AI 领域首先就跑赢在了「人才」的起跑线上。
「医疗 AI 领域还没有现成的人才,目前人才都是用非专业的,民间众筹的方式培养出来,好处就是可以挑选出对这个领域有发自内心热爱的人。
我们希望这个比赛可以为也许现在还不知道在哪里的同学种上一个梦想的种子,培养出一些复合型人才为产业座贡献。」阿里云市场营销和公共事务总经理刘湘雯说。
(阿里云市场营销和公共事务总经理刘湘雯)
「数字人体」系列比赛一直都是面向全行业开发者,此次 Spark AI 更加开放,尤其鼓励企业选手参赛,所以选手在接受不同领域知识时的成长也更加明显。
此次 GPU 赛道冠军便是一个「复合型团队」,由妙宜家健康科技集团、东北大学、中山大学联合组成。
谈及夺冠原因时,妙宜家常德杰表示直言,「在比赛过程中,我们需要和学生沟通、和专业的医生沟通,算法人员和业务人员沟通一定会存在障碍,但我们最后把遇见的问题都反映在了模型里,才取得了比较好的成绩。」
就具体问题而言,来自深透医疗的项磊举了一个例子,「判断椎间盘类别时,医生会只看椎间盘在哪,但算法人员并不知道椎间盘区域在哪。这就需要与医生配合,在设计算法时先设计分割的网络,分割出椎间盘区域以提高分类的精确性。」
此外,阿里云天池联合三甲医院开放的骨科数据集也让算法的训练环境更加接近真实的医疗场景。不少来自学校和科研机构的成员则更多希望把象牙塔的技术拿到实际医疗场景中「遛一遛」。
北京大学前沿交叉学科研究院张丽从读博就开始就做医疗影像处理,但始终局限在学校科研领域,他表示参赛就是想将科研成果应用到医疗实践。
「我们组的科研方向就是医疗图像处理、计算机视觉算法等,一开始就有一个非常好的人体姿态识别检测算法,看到天池比赛,觉得我们的算法也有这样这样的拓展性,希望能找到脊柱影像识别等领域的应用方向。」
数据集的开放便可以在医疗场景和科研环境中架起一道桥梁。
「我们提供 500 多份的腰椎核磁的数据,7 种典型的锥体和椎间盘的状态,多样性、困难度都比较大,非常接近真实情况」华先胜表示。
很多开发者在真实的数据中都会碰见并想方设法解决以往没有遇见的问题,比如数据噪声大、结果太容易过拟合、算法模型在训练集上表现不错但测试集上结果并不好等。
每一个选手解决的小的问题汇聚在有 50 万开发者的天池平台上,就可以推动行业向前走一步。「虽然每次只能解决一个小的问题,但通过大会的推进便可以在领域中凝练问题进而推动产品和解决方案的落地。」
比赛结束后,阿里云会汇聚行业从业者、研究人员、医生就当下实际问题进行研讨和观点碰撞,不说官话,都是在探讨实践中遇见的问题、困境和可能的解决方案。
在此基础上,阿里云还将比赛的经验加以凝练总结,发布了《阿里云天池大赛赛题解析》,提取了阿里云天池 7 年 200 多场数据大赛精华,是国内首本针对大数据竞赛的图书,对于相关技巧、技术、内涵进行了详尽阐述。
阿里打法:比赛为抓手,构建 AI 医疗系统工程底座
开发者、三甲医院、专家智库、企业… 每一次的「数字人体」比赛也都是一次行业生态参与者的集会,阿里也正在医疗行业复制自己的「阿里打法」,要成为底层基础设施的建设者和行业解决方案的提供者。
「当年拿一个电脑拿一个简单的数据集应用的日子已经过去,人工智能落地非常强烈的需求就是要有一个系统工程底座,能够把从需求到解决方案的链路打通。」贾扬清说。
在贾扬清看来,人工智能在未来必然要经历一个「祛魅」过程,现在开发应用要从需求出发,需求 - 建模 - 模型迭代 - 上线 - 结果回流,是一个门厂的系统工程。
在未来,阿里云真正想要的构建的就是系统工程底座,将解决方案打包给需要的人。「五年后人工智能可能成为一个非常容易的工具给每个人使用。」
天池比赛就是构建平台非常重要的抓手。
「天池比赛已经承办了很多年,现在是做算法和代码的的平台,会聚集行业专家和开发者,我们希望在接下来的年月里能够跟大家一起共创人工智能下半场,真正实现产业数字化。」
LX A i 中 国 网 Q
本文网址:
欢迎关注微信公众号:
人工智能报
;合作及投稿请联系:
editor@cnaiplus.com
关键词阅读:
天池
达摩
医疗
实践
生态
落地
落幕
深水
何用
阿里
分享到
智能推荐
无相关信息
精选
独家盘点免费vr资源网站 vr资源网站排名
IMC2019中国智造CIO年会正式启动——趋势预测,洞见未来智造!
2024第20届郑州工业装备博览会将于5月9日开幕!
最近抖音很火的机器人快宝有人知道内情吗?人工智能已经逆天?
现代快报的快宝到底有没有人工后台?
自然语言处理的研究现状及发展趋势
快手商业副总裁严强:面对3亿DAU 我们用AI沉淀社交资产
免费Google账号共享2021有效谷歌账号密码大全
创米数联杨洋: 如何让“一扇门”成为全屋智能新突破口?
80后北大学霸拿下“3D视觉第一股”!蚂蚁刷脸支付的幕后赢家,开盘涨超45%
AI中国号
...
关注微信公众号,了解最新精彩内容
热门文章
...
独家盘点免费vr资源网站 vr资源网站排名
IMC2019中国智造CIO年会正式启动——趋势预测,洞见未来智造!
2024第20届郑州工业装备博览会将于5月9日开幕!
最近抖音很火的机器人快宝有人知道内情吗?人工智能已经逆天?
现代快报的快宝到底有没有人工后台?
热门标签
...
智能制造
工业机器人
人工智能发展
人工智能公司
人工智能机器人
人工智能大会
快讯
...
宇树科技创始人王兴兴提醒公众甄别不实信息
【环球网科技综合报道】3月2日消息,宇树科技创始人王兴兴近日以个人身份正式入驻微信视频号,并
2025-03-02
微软全球范围宕机 数万人服务受影响
【环球网科技综合报道】3月2日消息,,据Downdetector数据显示,美国东部时间周六下午3点30分后,微
2025-03-02
埃隆·马斯克最新JRE 3小时访谈聊了啥·五万字完整版|谷歌|飞船|人工智能|外星文明|知名企业|埃隆_马斯克|spacex_订阅
2025-03-01
理想汽车2月交付量近2.7万辆,智能驾驶系统升级引市场热议!
[db:简介]
2025-03-01
岚图汽车2月销量破8千辆,同比增长152%,全年冲刺20万辆目标
[db:简介]
2025-03-01
特斯拉FSD入华引热议,车主:这位“老司机”有点不懂中国规矩
[db:简介]
2025-03-01
问界新M5 Ultra预订开启,23.8万起售
[db:简介]
2025-03-01
小鹏汽车2月交付量破3万,同比增长570%
[db:简介]
2025-03-01
DeepSeek 再次震惊全球:价格只有 OpenAI 1/25,利润率却超过 500%|gpu|计算量|大模型|openai|deepseek_订阅
2025-03-01
DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?|谷歌|微软|算法|预训练|知名企业|云计算费用|openai|deepseek_订阅
2025-03-01
刚刚,DeepSeek全面开源V3/R1推理系统!成本利润率高达545%|路由|冗余|通信|大模型|deepseek_订阅
2025-03-01
DeepSeek公布成本、收入和利润率!最高可日赚346万|冗余|计算量|大模型|deepseek_订阅
2025-03-01
2025西安丝绸之路国际旅游博览会
2025西安丝绸之路国际旅游博览会 时间:2025年4月18-20日 地点:西安国际会展中心
2025-03-01
2025江苏人形机器人展示洽谈会
2025江苏人形机器人展示洽谈会 时间:3月25日-26日 地点:南京国际博览中心
2025-03-01
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河|gpt|安本正义|云计算费用|openai|埃隆_马斯克|deepseek_订阅
2025-03-01
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键|智能体|isa|人工智能|deep|云计算费用|openai|research_订阅
2025-03-01
Nature独家爆料:全球机构撤稿率大排行,医学领域成重灾区|文章|学术论文_订阅
2025-03-01
Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:好搞笑啊|算法|编辑器|openai|python|claude|高吞吐量内核_订阅
2025-03-01
2025机器人灵巧手创新大会暨灵巧手新技术新产品展示推广会
2025机器人灵巧手创新大会暨灵巧手新技术新产品展示推广会 灵巧手作为机器人的核心部件是深
2025-03-01
IBM中国投资公司停运,1800员工一夜失业!昔日霸主黯然落幕|微软|大连|裁员|运营|ibm|知名企业_订阅
2025-03-01