首页> 热点 >

要闻速递：剑桥华人团队搞出多模态医学大模型！单个消费级显卡就能部署，借鉴斯坦福「羊驼」而来

2023-04-18 12:19:12 来源：商业新知网

衡宇发自凹非寺量子位 | 公众号 QbitAI

ChatGPT、AutoGPT能干那么些事，好想知道大模型啥时候才能看病，救我本人狗命？

带视觉的多模态医学基础大模型，它来啦～

名为 Visual Med-Alpaca ，官宣即开源。

(资料图片仅供参考)

这个专为生物医学领域设计的基础模型，构建于LLaMa-7B之上，还在一定程度上借鉴了Visual-ChatGPT和Alpaca （羊驼）。

因为参数量相对较小，所以使用单个消费级GPU 就能轻松部署和运行。

给小羊驼披上白大褂的背后团队，主要成员来自剑桥大学语言技术实验室（CambridgeLTL，Language Technology Lab at the University of Cambridge），以及一位MIT背景的中国小哥。

披上白大褂的羊驼

披上白大褂的小羊驼，望闻问切的实际效果如何？

带着疑问，我们把同样的考题（根据模态能力）丢给了Visual Med-Alpaca、Glass AI （提供诊断和临床建议的生成式AI应用）、VQA Medical Model （医学影像语言模型）、MOSS以及GPT-4。

看X光片能力

既然是多模态LLM，测试时自然不能放过这部分。

丢给他一张胸部X光片，并且提问：X光片显示了这人有啥毛病？该咋办？

Visual Med-Alpaca给出的答案是这样的：

在胸部X光片中看到的双侧浸润和双侧胸腔积液，可能表明呼吸道感染或其他呼吸系统疾病，例如肺炎肺水肿或胸腔积液，重要的是咨询医疗专业人员以进行正确诊断和治疗计划。

而参赛选手中另一名能读图看病的 VQA Medical Model ，回答就两个字：

褥疮（the decubitus）。

提供用药建议

鉴于能够读图看病的LLM应用太少，后续测试都只采用纯文字模式。

第一个问题：我头发掉到快秃了，有啥药可以救救孩子？

Visual Med-Alpaca 列出了5种药物，顺带解释了一下用法和对应病症。

1、米诺地尔：一种用于头皮以促进头发生长的药物。 2、非那雄胺：一种口服药物，可减缓二氢睾酮 (DHT) 的产生，DHT 是一种可导致脱发的激素。 3、皮质类固醇：可涂抹在头皮上以减轻炎症和促进毛发生长的外用药物。 4、蒽林：一种应用于头皮的药物，通过刺激滋养毛囊的血细胞的产生来促进头发生长。 5、酮康唑：一种应用于头皮的药物，用于治疗可导致脱发的真菌感染。在使用任何这些化学物质治疗脱发之前。请务必咨询医疗保健专业人员，因为它们可能有潜在的副作用并且可能并不适合所有人。

（感觉有人跟我一样需要，所以特地翻译后列出，狗头.jpg）

Glass AI 对这个问题的回答，给出的诊疗方案是米诺地尔和非那雄胺。

深孚众望的 ChatGPT ，也给出了5种用药：

（由于一些不可描述的原因，对第3种表示婉拒了哈）

第二个问题：如何检测2型糖尿病？

Visual Med-Alpaca 给出了5种测试办法，包括空腹血糖测试、口服葡萄糖耐量测试等。

Glass AI 给出的建议包含了此前的5种方案，然后额外有一种脂质谱。

ChatGPT 给出的测试办法少了一种，但也举例了多种方法。

体验结果来看，Visual Med-Alpaca在医学领域确实普遍表现更好，Glass AI也很有不错的表现，但吃亏在无法进行多模态的生成。