我是做 HIS 的,也就是医院信息系统。
现在正在学习神经网络,学了很多了,想要实践一下。正好手边有很多家医院的数据库,想利用神经网络 + 医院大数据做个有意义、难度又不是很大的事情。
本来想着“预测下一日 /下一小时的就诊人次”,这样难度应该不大。但是又转念一想,这样的预测做出来也没什么意义,也不值得提供给医院管理层去分析什么,所以想请各位说道说道,集思广益一下,看看有什么值得做又不是太难的。
PS:这些数据都只是我一个人使用,不会拿来对外的。
1
imn1 2018-03-29 22:58:52 +08:00
什么数据?
|
3
murmur 2018-03-29 23:01:41 +08:00 1
能拿到一些高清的 ct 或者核磁片子可能做一些图像处理的东西
其余的似乎没卵用。。。 |
4
SorryChen 2018-03-29 23:02:23 +08:00 1
现在医疗很多结合机器学习,当年很早的时候,贝叶斯网就在国外来诊断结核病,现在也有很多用医疗影像结合深度学习做辅助诊断的,还有很多用病例记录做预测的,记得读过一篇论文,很诡异的名字:DeepDeath = =预测你怎么死
|
5
hinate 2018-03-29 23:03:55 +08:00 via iPhone 1
可以做推荐,根据病人的描述给出初步的诊断及治疗方案...之后不断优化推荐算法.(胡思乱想)
|
6
ldd OP 我是楼主。
除了图像分析,有没有其他的点?我的这些数据都是存在数据库的,完全结构化、标准化。包含所有运营数据、就诊数据、病人信息、收入明细。 我的初衷是用神经网络分析出来点什么结论、或者预测出点什么趋势,来提供给医院管理层参考 |
8
feverzsj 2018-03-29 23:08:20 +08:00
预测人次,那是统计学的事情,要自己训练神经网络没这么简单的,你如果以为拿一堆数据塞进去就能出结果,那是天方夜谭
|
9
hcymk2 2018-03-29 23:09:18 +08:00 1
其实可以试下做分类。
|
10
murmur 2018-03-29 23:09:38 +08:00
@ldd 个人外行的感觉现代医学特别依赖仪器检验 有了检验科的结果你靠百度也能诊断
但就是这种牛逼的仪器和靠谱的检验科难找 小时后肺炎误诊的路过 真的。。牛逼。。小医院拍 X 光愣是没看出肺部有问题来 患者是不会按课本生病的 何况你用神经网络预测出的结果和医生首诊的结果也差不了多少。。。 |
11
yu099 2018-03-29 23:15:45 +08:00 via Android
之前谷歌的那个 ai 公司不是刚搞出来心脏的一个图像诊断分类的吗?似乎有九十几的准确率,人类七十几,但似乎那样也没用,疑难杂症还是得有经验的医生,结果出来医生还是得自己复核一遍,似乎还没什么卵用
|
12
ldd OP @hcymk2 分类这个点提醒了我,可能有搞头,比如根据就诊情况,提前判断某个门诊病人是否会住院……还不够有意义,我再深入想想,可能这个方向是对的
|
14
murmur 2018-03-29 23:29:22 +08:00
@ldd 这个是没法提前判断的啊,判断病人会不会住院要等诊断结果出来再说
而且有的病是可以住院可以选择每天来门诊的 或者是有钱人选择比较刺激的治疗方法。。比如全麻拔牙。。一次搞定所有智齿。。刺激不 所以判断某个门诊病人是否会住院其实就 3 点:1、钱够不 2、床位有不 3、病多重 1 和 2 不用 AI 也能判断出来 3 的话没诊断结果也预测不了 。。。所以还没卵用 |
15
murmur 2018-03-29 23:30:14 +08:00
|
16
murmur 2018-03-29 23:31:22 +08:00
有句话说叫,内科怕发烧,外科怕腹痛,症状就摆在这,你的贝叶斯去诊断吧
|
17
SorryChen 2018-03-30 00:05:39 +08:00 via iPhone
@murmur 不是啊...我只是举了个贝叶斯诊断结核的例子...这是个很有名的例子啊……节点都是表示的类似去没去过亚洲,咳不咳嗽这种很明确的特征了,那你要说我咳嗽到要死我非给医生说我不咳嗽,那什么都不管用。这个诊断系统微软开发的人在国外比较知名了。
|
18
327beckham 2018-03-30 00:08:09 +08:00
看一下最近的 kaggle 上正在进行中的 data science bowl 喽
|
19
jowuIM 2018-03-30 00:35:25 +08:00
一个医院的数据集太小了,你以为能做什么?不是大数据,不如 excel ?
|
20
shoaly 2018-03-30 07:51:42 +08:00
可能 最有戏的就是 分析 CT 照片的图像了...
|
21
murmur 2018-03-30 08:09:56 +08:00
@SorryChen 知乎那个我是看了的
根本不需要那么麻烦 直接一个 DR 一个痰培养一个抽血就搞差不多了 如果说为啥国内这几年才搞什么 AI 诊断 国外是因为诊疗成本太高 等的太慢才靠患者主诉搞什么贝叶斯诊断 国内不确诊一个痰培养做出来就完了么 还要那么多主诉干嘛 真的国内 X 光太便宜了 抽血拍片一套搞定就 100 来块钱 一个 DR 片社区报销才七八十块钱 胜过千言万语 贝叶斯这种东西也就停留在理论研究 在国内落地乘上患者巨大基数能把任何一个医院告破产 有些东西永远是技术解决不了的 一是检查是要花钱的 有些检查是小医院做不出来的 二是某些诊断真的是金字指标 但是这些东西大多数都是创伤检查 比如穿刺活检 三是某些病例即便是诊断出来了,你也无能为力,典型的就是癌症,太小了拍片拍不出来,等拍出来已经扩散了 |
22
binux 2018-03-30 08:10:15 +08:00
@feverzsj 你把 (星期几+时间=>就诊人数) 扔给神经网络它也能训练出来的,我觉得和统计的没区别。神经网络会把结果记下来。。
|
23
Felldeadbird 2018-03-30 08:19:03 +08:00 via iPhone 1
可以分析季度流行病?
|
24
ldd OP @murmur 纠正几个误区
1.仪器是用来确定和排除病情的,具体的治疗方案和程度拿捏还是靠医生。 2.跟据拍片结果做出诊断,除了和仪器精度有关,也和技师的知识库有很大关系。 3.病人的主述是公认的确定病情的有效依据,更何况记录下的主诉都是医生再整理的,有一定的参考价值。 4.癌细胞是由病理切片分析,不是拍片,初期就可以确认。 |
25
omph 2018-03-30 08:49:23 +08:00
更适合用统计学吧,神经网络不是包打一切的
|
26
murmur 2018-03-30 08:53:01 +08:00
@ldd
1、但是的却是高端仪器的普及让误诊率下降了不少,以前我在校医院做尿检就那么一个小纸条,现在密密麻麻能打满半张 B5 纸,当然有一部分是尿沉渣有一部分是镜检复查,不过的却首先,你得有仪器啊,尤其是几百万几千万的 CT MRI 不是想有就有的起的 2、这个同意,但是我也怀疑 3、靠谱的主诉当然有效,但是现代仪器检查能让肚子疼、发烧这些主诉落到具体某个病或者某些病上,尤其是对于表达能力有限或者查阅百度胡思乱想的患者 4、同意,但是病理切片不是随便做的啊,有的可以穿刺有的要做术中病理,但是没有拍片检查哪里有上来就穿刺或者开刀的 |
28
green15 2018-03-30 08:54:34 +08:00 via iPhone
我知道的,IBM 和 Google 就是在做楼主说的这套东西……
|
29
Len1133 2018-03-30 09:06:54 +08:00 2
识别处方上的汉字。。。算了,难度太大了
|
32
murmur 2018-03-30 09:28:37 +08:00 1
有点水了 总结一下我认为可能落地的方面
1、影像诊断,理由不说了,很多大厂也都在投资,不过这个对数据要求很高,我看一个文章说参加数据标注的都是高年资医生,确保图像清晰、标注准确、诊断无误,也就是要求每一个训练数据都做到金字指标的要求,这个怕是楼主做不到吧 2、知识库,就是让医生不要忘记那种罕见病的可能性,不过现在怕是中小医院诊断不了直接让转大医院,因为就算诊断出罕见病也不好治疗 3、罕见病、癌症、基因相关,这个也是楼主搞不了大厂加名医才能联合做的,常见病都有金字诊断指标,不需要什么 AI 只要检查到位可以几乎不误诊,但是癌症这个就难治了,有的诊断出来化疗甚至是进口药都不好使,所以国外一些机构貌似在研究基因和治疗效果的关系,这种没有成文的、需要探索的才是机器学习大显身手的地方 |
33
barble 2018-03-30 09:48:32 +08:00
我觉得可以根据病人陈述去追溯一些不明原因的疾病的病因,比如川崎病、突发性耳聋等
|
34
Morriaty 2018-03-30 10:08:28 +08:00
楼主愿意分享下数据吗
|
36
php01 2018-03-30 11:10:33 +08:00
根据妇产科孕妇的 x 光片的各项指标值,配合产后婴儿性别做分析与筛选。最后要求得出结论,哪几项指标决定了胎儿的性别。凭借这个,财务自由没问题的。
|
37
murmur 2018-03-30 11:13:29 +08:00
@php01 这东西还用的到 AI b 超的是个医生都能看出来 这不是大陆法律禁止的问题还要机器学习干嘛
或者不在大陆做 去香港做就行 不在香港很多小诊所都偷着可以做性别鉴定 |
40
awenxjtu 2018-03-30 11:40:24 +08:00 via Android 1
从病例入手,分析症状是哪些,比例多少,什么症状容易忽视导致恶果,用了什么药,效费比如何
|
41
Phox 2018-03-30 11:58:19 +08:00 1
可以帮助更多人,比如根据大数据分析年龄,体温,心跳,用药,等分析出未来一两天内晚上可能需要急救的病人
|
42
Doodlister 2018-03-30 12:08:31 +08:00 via Android
@Morriaty 违法的兄弟。
|
43
murmur 2018-03-30 12:12:54 +08:00
@Phox 未来需不需要急救在他入院的时候基本就知道了,还需要预测么
另外不可能因为你预测出未来没有患者需要急救就给医生护士放假 预测失败就是人命关天 成本太高了 没人敢用预测给急诊科或者重症科安排排班表 |
44
hcymk2 2018-03-30 12:15:43 +08:00 1
其实也先试下分诊辅助,这个风险最小。
|
45
zhouyou457 2018-03-30 12:39:01 +08:00 via iPhone 1
流行病学统计?根据患者描述与检测报告,再加上患者的各类疾病的患病风险,给予医生辅助分析诊断,还可以提供医疗建议...
|
46
easylee 2018-03-30 12:42:10 +08:00
“ PS:数据不外给,请自重。”
点赞👍! |
47
zeraba 2018-03-30 12:43:51 +08:00 via Android 1
优化诊断流程方面,医院可以想象成一个工厂,每个科室是一条流水线,它们公用了几个车间,分别是血常规,B 超之类的检验科,在资源有限的情况下,如果一个病人需要做多重检测,可以根据每种检测所需时间做个推荐,先去某某窗口做 A 检测,再去某某窗口做 B,做为一个病人不可能跑去不同的地方先去看看排队情况,他们也不了解每个检测的所需时间,这个可以帮助更快的诊断。当然还有很多思路,大体方向一个是提高总体营收,提升效率,另一个可以是减少成本,比如药品库存的控制等等
|
48
zhaojjxvi 2018-03-30 12:45:52 +08:00 via iPhone
先考虑清楚这部分数据能不能用
|
49
idler 2018-03-30 13:25:26 +08:00 1
外行好奇问一句,楼主将这些数据用于未知用途不用经过患者同意吗?还是已经经过同意了?因为我感觉这件事里,医院如同 Facebook,楼主如同 Cambridge Analytica。
|
50
ayumilove 2018-03-30 13:25:46 +08:00 1
对于公立三甲医院,HIS 当中 取得的数据,目前 大部分 还是被用于 医院评价科室 医保(自费)药品、器材比例 分析上。
领导需要的 这些数据 基本用不到神经网络。 |
51
ayumilove 2018-03-30 16:16:54 +08:00
除了 AI 自动根据 PACS 影像诊断病情以外,
以上提出的 功能 在 通过 HIMSS 7 级认证的 医院都基本具备。 |
52
logOo 2018-03-30 16:21:07 +08:00
我擦,感觉到了一丝丝恐惧啊,icloud 迁到贵州就被喷成那样,您这随随便便就生产数据了?
|
53
XinLake 2018-03-30 16:48:40 +08:00
美图不是号称 AI 发现生病么。
拿一堆疾病皮肤图片数据集训练,然后自拍图跑神经网络模型,看看能不能检测出疾病。 |
54
csx163 2018-03-30 16:50:54 +08:00
觉得这个帖子是违法的,而且不道德
|
55
northisland 2018-03-30 16:54:56 +08:00
依照年龄、生病部位、身体状况什么的,做个聚类
然后,别人可以根据自己情况,查看自己的病得花多少钱,还有几年好活 |
56
murmur 2018-03-30 16:56:23 +08:00
@northisland 这就是预后么,你想问的话医生会告诉你的,干嘛要自己根据软件查自己寿命
|
57
ss0xt 2018-03-30 17:07:23 +08:00
楼主是医院内部信息科的人还是 HIS 厂商的实施人员??数据这么容易拿?
|
58
banksiae 2018-03-30 17:14:02 +08:00
国内有个新兴公司,就是做你这个的,前几天好像刚拿到融资,利用 AI 手段给医生提供诊断支持,具体的名字一时想不起了
|
59
lekai63 2018-03-30 17:16:32 +08:00
楼主可以帮忙解答一下关于数据合规性方面的问题么?
可能会要给社区医院做一套慢病管理的解决方案,其中会涉及病人电子病历、数据的管理。本来是想加点有意思的元素:比如采用区块链相关技术,将数据存储于联盟链上。防止医院单方面修改,在医患关系中能以不能篡改的电子病历作为一项证据。 ——————目前暂未实施———————— 有个问题就是,我作为系统开发商(即医院、病人、卫计委等之外的服务机构),是否可以存储该区块数据——相当于我第三方存了这些数据,不知道会不会违规。 |
60
qinrui 2018-03-30 17:18:04 +08:00 via iPhone
病人特征交叉分析,比如发现某类病人具有某些特征,然后筛选出符合这个特征的尚未得病的人,进行风险预警。
我手上也有一批数据,按人头算是千万规模,时间序列的数据有 10 亿条,也想分析出一些有价值的东西,但不知道用什么工具或者方法,求指导。 |
61
lekai63 2018-03-30 17:19:07 +08:00
至于数据应用,你跟个内行的医生聊聊就会有很多可以实操的东西拉,比如:
横向的:同一科室不同医生的诊疗流程、给药习惯可能存在比较大的差异。 纵向的:同一医生多年来诊疗流程、给药习惯的变化、趋势等 只是举个例子,可能进一步分析下去会有更多的发现哦~ |
62
goodbest 2018-03-30 17:20:25 +08:00 via iPhone
医生手写处方识别…
|
63
lekai63 2018-03-30 17:30:25 +08:00
by the way
不知道楼主 base 何方,患者数据的分析(即隐去敏感的患者个人信息后),尤其是心血管方面的。如有机会,希望能聊聊看。我们有技术团队以及浙江省心血管领域的权威专家,比较关注医生在诊疗和给药过程中的行为数据,研究不同行为下给病患带来的影响。(比如诊疗步骤 ABCD,有的医生走 ABC,有的走 ACD。开的药也会不太一样。需要结合病症、愈后效果等交叉分析。) |
64
eric1202 2018-03-30 17:31:44 +08:00
医疗软件系统 是每个地区都不一样的吗?你们数据库怎么同步?
|
65
evanvane 2018-03-30 20:43:35 +08:00 via iPad
作为医生,只想说你这种行为还是偷偷做的好,有点令我恶心。
|
66
letitbesqzr 2018-04-01 00:49:36 +08:00
请问医院有同意你使用这些数据进行分析了吗?
|
67
chentydev 2018-04-09 23:04:23 +08:00
自助导诊和辅助诊断都不可行。相比于模糊的就诊数据,自助导诊更依赖于基于精确医学知识构建的规则树。医学影像的计算机辅助诊断确实会用到很多数学、计算机算法的东西,但是这块门槛也比较高,本身没有扎实数学功底又不懂医学的连入门都困难,更别说创新了。以前读书的时候影像科的老师给了一个基于小世界模型的脑部 CT 还是什么分析的文章,我表示作为普通工科学生读过之后完全看不懂里面的数学模型。
单纯就这一堆数据而言,我觉得还是做做传统的数据可视化和基础统计分析比较靠谱,比如 XX 病种平均开销 17 年 X 元,18 年涨到 Y 元; XX 科室中药开得多; XX 科室自费病人多。这些数据就算强行弄弄预测什么的,也没什么实际意义啊。 |