此为临时链接,仅用于预览,将在短期内失效。

林诗栋晋级WTT香港总决赛四强

世界杯云顶站谷爱凌三连冠

国资委原副部长级干部潘良被查

我国成功发射卫星互联网低轨16组卫星

一起为国乒加油!WTT香港总决赛今日开赛

华科大发布AI小猴子 “看图说话”能力世界领先

长江云新闻    ©原创 2023-12-13 20:11   阅读:0  

多模态大模型,是一类可以同时处理文本、图像、音频等多种感知数据的AI架构。近日,华中科技大学团队发布了名为“Monkey”的多模态大模型,“看图说话”能力达到世界领先水平。

随机翻拍一张黄鹤楼的照片,短短四五秒,这只AI“小猴子”就对图片特征进行了精准形象的描述。

华中科技大学人工智能与自动化学院研究员、博士生导师刘禹良:“以前的这些多模态大模型,它支持的图片分辨率最高就只有448×448,这个模型能够支持最大的分辨率是896×1344,相当于是原来图片的分辨率的好几倍,能挖掘到里面微小的一些细腻度信息,比如说知道图片中有谁、穿着什么衣服等等,大概是一个什么氛围。”

超群的“看图说话”能力背后,是长达20年的研究。早在2003年,这支科研团队就开始从事图像识别研究,目前团队成员平均年龄只有22岁。Monkey是大家尝试了10多种方案后最终确定的,在某些样本上,它的图像描述能力甚至超越了业界公认的领先者——OpenAI的多模态大模型GPT-4V。

华中科技大学人工智能与自动化学院学生李长:“我们在18个数据集上有16个数据集能比LLAVA这些模型,都能比它们高,我们在密集文本问答这个任务上,发现我们能完成一些GPT-4V所完成不了的任务。”

华中科技大学人工智能与自动化学院研究员、博士生导师刘禹良:“比如说在医疗领域,利用我们这个模型,事实上就能够辅助针对病患的一些图片给出一些精细化的描述,来去辅助医生给出更加精准的一些判断。”

(长江云新闻记者 吴宝洪 汪佳睿 通讯员 高翔)

责任编辑 张智美子
小贴士
2步分享
  • 点击右上角“…” 按钮
  • 分享给指定朋友或分享到朋友圈
进入长江云新闻阅读更多精彩内容>>

推荐阅读

  • 从“点突破”到“群跃升”! 湖北万亿级产业集群加速崛起
  • 湖北“十四五” 民生为大暖人心 | 在推动高质量发展中持续增进人民福祉
评论 最热 最新
打开长江云新闻看更多 
发表评论。。。
{{ item.passport.nickname || "" }}

{{ item.content }}

{{ formatDate(item.create_time) }} · {{item.ip_location | splitAreaCity}} 回复
{{realSupportList[item.comment_id] || 0}} {{item.comments.length}}
{{ i.passport.nickname || "" }}
{{ i.replyed_passport.nickname || "" }}

{{ i.content }}

{{ formatDate(i.create_time) }} · {{i.ip_location | splitAreaCity}} 回复
{{realSupportList[i.comment_id] || 0}} {{i.reply_count || 0}}
{{item.foldStatus ? "收起" : "展开" + item.comments.length + "条回复"}}

暂无评论,快来抢沙发~

点击加载更多
发送

登录长江云账号

{{isMobile ? "账号密码登录" : "短信登录"}}
发送验证码

请输入图片验证码

确定

https://img.cjyun.org.cn/a/10008/202312/371b818865e5b599923d92d398e3a053.png
{"appId":"wxcccd4eaac7d51769","nonceStr":"QuPHXiybGGqDuyfM","timestamp":1765688820,"signature":"45ca2d1b32c63a6e1f771234c477452f8a20b357","link":"https:\/\/m.hbtv.com.cn\/p\/3437279.html","desc":"\u8fd1\u65e5\uff0c\u534e\u4e2d\u79d1\u6280\u5927\u5b66\u56e2\u961f\u53d1\u5e03\u4e86\u540d\u4e3a\u201cMonkey\u201d\u7684\u591a\u6a21\u6001\u5927\u6a21\u578b\uff0c\u201c\u770b\u56fe\u8bf4\u8bdd\u201d\u80fd\u529b\u8fbe\u5230\u4e16\u754c\u9886\u5148\u6c34\u5e73\u3002","title":"\u534e\u79d1\u5927\u53d1\u5e03AI\u5c0f\u7334\u5b50 \u201c\u770b\u56fe\u8bf4\u8bdd\u201d\u80fd\u529b\u4e16\u754c\u9886\u5148","imgUrl":"https:\/\/img.cjyun.org.cn\/a\/thumb\/10008\/202305\/2336336c2f3e0f3d6d36e40d2246c7b6.png!w300_h300.png","debug":""}